16. ch04. sklearn - 분류 - 03. 데이터의 불균형(imbalance) - 18. ch04. sklearn - 분류 - 05. 모델 선언, 학습(fit), 예측(predict)
16. ch04. sklearn - 분류 - 03. 데이터의 불균형(imbalance)
from sklearn.model_selection import train_test_split
x_train, x_valid, y_train, y_valid = train_test_split(df_iris.drop('target', 1), df_iris['tagret'])
x_train.shape, y_train.shape
x_valid.shape, y_valid.shape
sns.countplot(y_train)
stratify: label의 클래스의 분포를 균등하게 배분
x_train, x_valid, y_train, y_valid = train_test_split(df_iris.drop('target', 1), df_iris['target'], stratify=df_iris['target'])
sns.countplot(y_train)
x_train.shape, y_train.shape (shape 찍어서 확인)
x_valid.shape, y_valid.shape
17. ch04. sklearn - 분류 - 04. logistic regression (로지스틱 회귀)
Logistic Regression
from sklearn.linear_model import LogisticRegression
18. ch04. sklearn - 분류 - 05. 모델 선언, 학습(fit), 예측(predict)
step 1: 모델 선언
model = LogisticRegression()
step 2: 모델 학습
model.fit(x_train, y_train)
step 3: 예측
prediction = model.predict(x_valid)
prediction[:5]
step 4: 평가
(prediction == y_valid).mean()
패스트캠퍼스 데이터분석 강의 링크
bit.ly/3imy2uN