27. ch04. sklearn - 분류 - 14. 정밀도(precision)와 재현율(recall) - 30. ch05. sklearn - 회귀 - 02. 보스턴 주택 가격예측 데이터셋
27. ch04. sklearn - 분류 - 14. 정밀도(precision)와 재현율(recall)
from sklearn.metrics import precision_score, recall_score
정밀도 (precision)
양성 예측 정확도
TP / (TP + FP)
precision_score(y_test, pred)
무조건 양성으로 판단하면 좋은 정밀도를 얻기 때문에 유용하지 않습니다.
재현율 (recall)
TP / (TP + FN)
양성 샘플의 비율
recall_score(y_test, pred)
28. ch04. sklearn - 분류 - 15. f1score
f1 score
정밀도와 재현율의 조화 평균
from sklearn.metrics import f1_score
f1_score(y_test, pred)
29. ch05. sklearn - 회귀 - 01. 회귀(Regression)
회귀 (regression) 예측
수치형 값을 예측 (Y의 값이 연속된 수치로 표현)
import pandas as pd
import numpy as np
np.set_printoptions(suppress=True)
from sklearn.datasets import load_boston
데이터 로드
data = load_boston()
data['data']에는 X 데이터, data['feature_names']에는 컬럼 명
df = pd.DataFrame(data['data'], columns=data['feature_names'])
df['MEDV'] = data['target']
df.head()
학습용/검증용으로 분리
from sklearn.model_selection import train_test_split
x_train, x_test, y_train, y_test = train_test_split(df.drop('MEDV', 1), df['MEDV'])
x_train.shape, x_test.shape
x_train.head()
y_train.head()