본문 바로가기

카테고리 없음

[패스트캠퍼스 수강 후기] 데이터분석 인강 100% 환급 챌린지 30회차 미션


16. ch04. sklearn - 분류 - 03. 데이터의 불균형(imbalance) - 18. ch04. sklearn - 분류 - 05. 모델 선언, 학습(fit), 예측(predict)

16. ch04. sklearn - 분류 - 03. 데이터의 불균형(imbalance)

from sklearn.model_selection import train_test_split

x_train, x_valid, y_train, y_valid = train_test_split(df_iris.drop('target', 1), df_iris['tagret'])

x_train.shape, y_train.shape

x_valid.shape, y_valid.shape

sns.countplot(y_train)

stratify: label의 클래스의 분포를 균등하게 배분

x_train, x_valid, y_train, y_valid = train_test_split(df_iris.drop('target', 1), df_iris['target'], stratify=df_iris['target'])

sns.countplot(y_train)

x_train.shape, y_train.shape (shape 찍어서 확인)

x_valid.shape, y_valid.shape



17. ch04. sklearn - 분류 - 04. logistic regression (로지스틱 회귀)


Logistic Regression

from sklearn.linear_model import LogisticRegression


18. ch04. sklearn - 분류 - 05. 모델 선언, 학습(fit), 예측(predict)


step 1: 모델 선언

model = LogisticRegression()

step 2: 모델 학습

model.fit(x_train, y_train)

step 3: 예측

prediction = model.predict(x_valid)

prediction[:5]

step 4: 평가

(prediction == y_valid).mean()



패스트캠퍼스 데이터분석 강의 링크
bit.ly/3imy2uN