본문 바로가기

분류 전체보기

(75)
[패스트캠퍼스 수강 후기] 데이터분석 인강 100% 환급 챌린지 45회차 미션 [패스트캠퍼스 수강 후기] 데이터분석 인강 100% 환급 챌린지 45회차 미션 08. ch 02. 분류 분석 - 03. 분류 분석과 로지스틱 회귀 모델 - 2 - 09. ch 02. 분류 분석 - 04. Logistic Regression을 이용한 08. ch 02. 분류 분석 - 03. 분류 분석과 로지스틱 회귀 모델 09. ch 02. 분류 분석 - 04. Logistic Regression을 이용한 3) 지도 학습 기반 분류 분석 3-1) 데이터 전처리 데이터 타입 변경 df['Legendary'] = df['Legendary'].astype(int) df['Generation'] = df['Generation'].astype(str) preprocessed_df = df[['Type 1', 'Ty..
[패스트캠퍼스 수강 후기] 데이터분석 인강 100% 환급 챌린지 44회차 미션 06. ch 02. 분류 분석 - 01. Pokemon 데이터셋 탐색 - 07. ch 02. 분류 분석 - 02. 분류 분석과 로지스틱 회귀 모델 - 1 06. ch 02. 분류 분석 - 01. Pokemon 데이터셋 탐색 정답이 없는 경우. 비지도 학습. 2. EDA (Exploratory Data Analysis : 탐색적 데이터 분석) 2-1) 기본 정보 탐색 df.shape df.info() df.isnull().sum() 개별 피처 탐색 df['Legendary'].value_counts() df['Generation'].value_counts() df['Generation'].value_counts().sort_index().plot() df['Type 1'].unique() 타입1에 무슨 타..
[패스트캠퍼스 수강 후기] 데이터분석 인강 100% 환급 챌린지 43회차 미션 [패스트캠퍼스 수강 후기] 데이터분석 인강 100% 환급 챌린지 43회차 미션 04. ch 01. EDA & 회귀 분석 - 03. 지도 학습과 회귀 분석 - 05. ch 01. EDA & 회귀 분석 - 04. Linear Regression을 이용한 수치 04. ch 01. EDA & 회귀 분석 - 03. 지도 학습과 회귀 분석 회귀 분석 설명 변수와 종속 변수간의 인과관계를 찾아내는 것 함수를 데이터에 맞추는 과정 (모델 학습 과정) OLS (Ordinary Least Square) vs MLE 모델 학습 과정 OLS (Ordinary Least Square) 제곱(Square)을 가장 작은(Least) 상태로 추정하는 것. = 오차들의 제곱을 최소화 하는 것 그래디언트 디센트(Grandient Des..
[패스트캠퍼스 수강 후기] 데이터분석 인강 100% 환급 챌린지 42회차 미션 05. Part 2. 01. ch 00. 강의 소개 영상 - 01. 오리엔테이션 - 03. ch 01. EDA & 회귀 번석 - 02. EDA를 통한 인사이트 발견 실습 01. ch 00. 강의 소개 영상 - 01. 오리엔테이션 EDA(Exploratory data analysis) : 탐색적 데이터 분석 데이터 분석 데이터로 할 수 있는 모든 것들 분석의 목적, 분야에 따라 여러 가지의 기술들이 필요 모든 데이터 분석의 공통점 1. 목표에 대한 문제 정의 2. 문제 해결에 필요한 탐색적 데이터 분석 3. 목표에 맞는 분석 기법 적용 - 회귀 분석 - 딥 러닝 - 수학 기법 적용 - 데이터 시각화 02. ch 01. EDA & 회귀 번석 - 01. 데이터 분석 문제를 정의하는 방식과 %matplotlib..
[패스트캠퍼스 수강 후기] 데이터분석 인강 100% 환급 챌린지 41회차 미션 58. ch07. sklearn - 비지도학습 - 04. 차원축소 - LDA - 62. ch07. sklearn - 비지도학습 - 08. 군집의 평가(실루엣스코어) 58. ch07. sklearn - 비지도학습 - 04. 차원축소 - LDA LDA(Linear Discriminant Analysis): 선형 판별 분석법 (PCA와 유사) from sklearn.discriminant_analysis import LinearDiscriminantAnalysis from sklearn.preprocessing import StandardScaler df.head() lda = LinearDiscriminantAnalysis(n_components=2) data_scaled = StandardScaler()...
[패스트캠퍼스 수강 후기] 데이터분석 인강 100% 환급 챌린지 40회차 미션 55. ch07. sklearn - 비지도학습 - 01. 비지도학습이란 - 57. ch07. sklearn - 비지도학습 - 03. 차원축소 - PCA 55. ch07. sklearn - 비지도학습 - 01. 비지도학습이란 목표치가 없음. 차원 축소: PCA, LDA, SVD 군집화: KMeans Clustering, DBSCAN 군집화 평가 56. ch07. sklearn - 비지도학습 - 02. 차원축소란 feature의 갯수를 줄이는 것을 뛰어 넘어, 특징을 추출 from sklearn.preprocessing import StandardScaler from sklearn.decomposition import PCA from sklearn import datasets import pandas as ..
[패스트캠퍼스 수강 후기] 데이터분석 인강 100% 환급 챌린지 39회차 미션 50. ch06. sklearn - 앙상블 - 10. 블렌딩(Weighted Blending) - 54. ch06. sklearn - 앙상블 - 14. 하이퍼파라미터 튜닝 50. ch06. sklearn - 앙상블 - 10. 블렌딩(Weighted Blending) 각 모델의 예측값에 대하여 weight를 곱하여 최종 output 계산 final_outputs = { 'elasticnet' : poly_pred, 'randomforest' : rfr_pred, 'gbr' : gbr_pred, 'xgb' : xgb_pred, 'lgbm' : lgbm_pred, 'stacking' : stack_pred, } final_prediction=\ final_outputs['elasticnet'] * 0.1\ *..
[패스트캠퍼스 수강 후기] 데이터분석 인강 100% 환급 챌린지 38회차 미션 46. ch06. sklearn - 앙상블 - 06. 그라디언트 부스트(Gradient) - 49. ch06. sklearn - 앙상블 - 09. 스태킹(Stacking) 앙상블 46. ch06. sklearn - 앙상블 - 06. 그라디언트 부스트(Gradient) from sklearn.ensemble import GradientBoostingRegressor, GradientBoostingClassifier gbr = GradientBoostingRegressor(random_state=42) gbr.fit(x_train, y_train) gbr_pred = gbr.predict(x_test) mse_eval('GradientBoost Ensemble', gbr_pred, y_test) gbr = ..
[패스트캠퍼스 수강 후기] 데이터분석 인강 100% 환급 챌린지 37회차 미션 42. ch06. sklearn - 앙상블 - 02. 보팅(Voting) 앙상블 - 45. ch06. sklearn - 앙상블 - 05. 부스팅(Boosting) 앙상블 42. ch06. sklearn - 앙상블 - 02. 보팅(Voting) 앙상블 Voting은 단어 뜻 그대로 투표를 통해 결정하는 방식 from sklearn.ensemble import VotingRegressor, VotingClassifier Tuple 형태로 모델을 정의 single_models = [ ('linear_reg', linear_reg), ('ridge', ridge), ('lasso', lasso), ('elasticnet_pipeline', elasticnet_pipeline), ('poly_pipeline', ..
[패스트캠퍼스 수강 후기] 데이터분석 인강 100% 환급 챌린지 36회차 미션 39. ch05. sklearn - 회귀 - 11. 파이프라인 (Pipeline) - 41. ch06. sklearn - 앙상블 - 01. 앙상블 학습의 이해 39. ch05. sklearn - 회귀 - 11. 파이프라인 (Pipeline) from sklearn.pipeline import make_pipeline elasticnet_pipeline = make_pipeline( StandardScaler(), ElasticNet(alpha=0.1, l1_ratio=0.2) ) elasticnet_pred = elasticnet_pipeline.fit(x_train, y_train).predict(x_test) mse_eval('Standard ElasticNet', elasticnet_pred, y_..