전체 글 (75) 썸네일형 리스트형 [패스트캠퍼스 수강 후기] 데이터분석 인강 100% 환급 챌린지 30회차 미션 16. ch04. sklearn - 분류 - 03. 데이터의 불균형(imbalance) - 18. ch04. sklearn - 분류 - 05. 모델 선언, 학습(fit), 예측(predict) 16. ch04. sklearn - 분류 - 03. 데이터의 불균형(imbalance) from sklearn.model_selection import train_test_split x_train, x_valid, y_train, y_valid = train_test_split(df_iris.drop('target', 1), df_iris['tagret']) x_train.shape, y_train.shape x_valid.shape, y_valid.shape sns.countplot(y_train) stratif.. [패스트캠퍼스 수강 후기] 데이터분석 인강 100% 환급 챌린지 29회차 미션 13. ch03. sklearn - 전처리 기본 - 07. Standardization (표준화) - 15. ch04. sklearn - 분류 - 02. dataset으로부터 데이터프레임 13. ch03. sklearn - 전처리 기본 - 07. Standardization (표준화) 표준화 (Standard Scaling) from sklearn.preprocessing import StandardScaler standard_scaler = StandardScaler() x = np.arange(10) # outlier 추가 x[9] = 1000 x.mean(), x.std() 평균, 표준편차 scaled = standard_scaler.fit_transform(x.reshape(-1, 1)) x.me.. [패스트캠퍼스 수강 후기] 데이터분석 인강 100% 환급 챌린지 28회차 미션 09. ch03. sklearn - 전처리 기본 - 03. 빈값 처리(Imputer) - 12. ch03. sklearn - 전처리 기본 - 06. Normalization(정규화) 09. ch03. sklearn - 전처리 기본 - 03. 빈값 처리(Imputer) 전처리: 결측치 결측치를 확인하는 방법은 pandas의 isnull() 그리고 합계를 구하는 sum() train.isnull().sum() 개별 column 결측치 train['Age'].isnull().sum() 1. 수치형 (Numerical Column) 데이터에 대한 결측치 처리 train['Age'].fillna(0).describe() train['Age'].fillna(train['Age'].mean()).describe() .. 이전 1 ··· 13 14 15 16 17 18 19 ··· 25 다음