본문 바로가기

카테고리 없음

[패스트캠퍼스 수강 후기] 데이터분석 인강 100% 환급 챌린지 33회차 미션

27. ch04. sklearn - 분류 - 14. 정밀도(precision)와 재현율(recall) - 30. ch05. sklearn - 회귀 - 02. 보스턴 주택 가격예측 데이터셋



27. ch04. sklearn - 분류 - 14. 정밀도(precision)와 재현율(recall)

from sklearn.metrics import precision_score, recall_score

정밀도 (precision)

양성 예측 정확도

TP / (TP + FP)

precision_score(y_test, pred)

무조건 양성으로 판단하면 좋은 정밀도를 얻기 때문에 유용하지 않습니다.

재현율 (recall)

TP / (TP + FN)


양성 샘플의 비율

recall_score(y_test, pred)



28. ch04. sklearn - 분류 - 15. f1score

f1 score

정밀도와 재현율의 조화 평균

from sklearn.metrics import f1_score

f1_score(y_test, pred)




29. ch05. sklearn - 회귀 - 01. 회귀(Regression)


회귀 (regression) 예측

수치형 값을 예측 (Y의 값이 연속된 수치로 표현)

import pandas as pd
import numpy as np

np.set_printoptions(suppress=True)


from sklearn.datasets import load_boston


데이터 로드


data = load_boston()


data['data']에는 X 데이터, data['feature_names']에는 컬럼 명

df = pd.DataFrame(data['data'], columns=data['feature_names'])


df['MEDV'] = data['target']

df.head()

학습용/검증용으로 분리

from sklearn.model_selection import train_test_split

x_train, x_test, y_train, y_test = train_test_split(df.drop('MEDV', 1), df['MEDV'])

x_train.shape, x_test.shape

x_train.head()

y_train.head()