본문 바로가기

분류 전체보기

(75)
[패스트캠퍼스 수강 후기] 데이터분석 인강 100% 환급 챌린지 15회차 미션 03. part1. 파이썬 필수 스킬 01. ch01. matplotlib - 01. matplotlib 소개 - 03. ch01. matplotlib - 03. 밑그림 그리기(단일, 다중) 01. ch01. matplotlib - 01. matplotlib 소개 matplotlib.pyplot as plt pandas 연동 다양한 그래프 단점 한글 완벽 지원 X. 사용성 복잡할 수 있음. 02. ch01. matplotlib - 02. colab에서 한글 폰트 지정. import matplotlib.pyplot as plt import pandas as pd import numpy as np df = pd.read_csv('https://bit.ly/ds-house-price-clean') df df...
[패스트캠퍼스 수강 후기] 데이터분석 인강 100% 환급 챌린지 14회차 미션 32. ch03. pandas - 시각화 - 03. plot, line, bar, histogram - 35. ch03. pandas - 시각화 - 06. area, pie. scatter 32. ch03. pandas - 시각화 - 03. plot, line, bar, histogram plot 일반 선그래프 df['분양가'].plot() df['분양가'].plot(kind = 'line') kind 옵션: line: 선그래프 bar: 바 그래프 barh: 수평 바 그래프 hist: 히스토그램 kde: 커널 밀도 그래프 hexbin: 고밀도 산점도 그래프 box: 박스 플롯 area: 면적 그래프 pie: 파이 그래프 scatter: 산점도 그래프 1) line 그래프 : 데이터 연속적인 경우(ex. ..
[패스트캠퍼스 수강 후기] 데이터분석 인강 100% 환급 챌린지 13회차 미션 27. ch02. pandas - 전처리 - 12. 원핫인코딩의 개념과 get_dummies - 31. ch03. pandas - 시각화 - 02. cab 한글폰트 깨짐현상 해결 27. ch02. pandas - 전처리 - 12. 원핫인코딩의 개념과 get_dummies 2. 원핫인코딩 (One-hot-encoding) 한개 요소 True, 나머지 요소는 False로 만들어주는 기법 blood_map = { 'A': 0, 'B': 1, 'AB': 2, 'O': 3, } df['혈액형_code'] = df['혈액형'].map(blood_map) df.head() >이름 그룹 소속사 성별 생년월일 키 혈액형 브랜드평판지수 혈액형_code 0 지민 방탄소년단 빅히트 남자 1995-10-13 173.6 A 10..
[패스트캠퍼스 수강 후기] 데이터분석 인강 100% 환급 챌린지 12회차 미션 21. ch02. pandas - 전처리 - 06. Series의 type 변환 - 26. ch02. pandas - 전처리 - 11. select_dtypes 21. ch02. pandas - 전처리 - 06. Series의 type 변환 1. Series의 Type df.info() 통해 확인 가능. object: 일반 문자열 타입 float: 실수 int: 정수 category: 카테고리 datetime: 시간 1-2. type 변환 astype 메소드 사용. series별로(column)별로 변환. df.['키'].dtypes 데이터 타입을 알아보는 것. df['키'].astype(int) 정수형으로 변환. -> NaN 값 있을 때는 변환 X fillna로 빈값 채운 후에 변환 가능 df['키']..
[패스트캠퍼스 수강 후기] 데이터분석 인강 100% 환급 챌린지 11회차 미션 16. ch02.pandas-전처리-01. 결측값 채우기(fillna) - 20. ch02.pandas-전처리-05. DataFrame 합치기 (merge) 16. ch02.pandas-전처리-01. 결측값 채우기(fillna) 1. 결측값을 채워주는 fillna fillna(): na 값에 대하여 fill해주는 함수 df['키'].fillna(-1) >0 173.6 1 177.0 2 180.0 3 178.0 4 162.1 5 178.0 6 182.3 7 -1.0 8 179.2 9 167.1 10 -1.0 11 183.0 12 175.0 13 176.0 14 174.0 Name: 키, dtype: float64 df2 = df.copy() df2 df2['키'].fillna(-1, inplace = Tr..
[패스트캠퍼스 수강 후기] 데이터분석 인강 100% 환급 챌린지 10회차 미션 08. ch01. pandas - 08. Selection - boolean indexing, isin - 15. ch01. pandas - 15. 복합 인덱스(multi-index)와 인덱스 08. ch01. pandas - 08. Selection - boolean indexing, isin 3. boolean indexing - 조건을 활용한 색인 numpy에서의 boolean 인덱싱과 같은 원리 df['키'] > 180 >0 False 1 False 2 False 3 False 4 False 5 False 6 True 7 False 8 False 9 False 10 False 11 True 12 False 13 False 14 False Name: 키, dtype: bool oolean Index..
[패스트캠퍼스 수강 후기] 데이터분석 인강 100% 환급 챌린지 9회차 미션 05. ch01. pandas - 05. 통계값(describe), 요약 정보(info), 정렬 1. 파일 읽어오기(csv) import pandas as pd df = pandas.read_csv('http://bit.ly/ds-korean-idol') df > 2. 기본 정보 알아보기(index, column, info) 2-1, column(열) 출력하기. df.columns Index(['이름', '그룹', '소속사', '성별', '생년월일', '키', '혈액형', '브랜드평판지수'], dtype='object') 가로목록 2-2. column(열) 이름 재정의 new_col = ['name', '그룹', '소속사', '성별', '생년월일', '키', '혈액형', '브랜드평판지수'] (원래 데이터..
[패스트캠퍼스 수강 후기] 데이터분석 인강 100% 환급 챌린지 8회차 미션 안녕하세요. 오늘 무심코 강의 분량을 보는데... 참 많이 남았네요. 50일 과정인데 이러다가는 완주를 못할것같아 더 많이씩 들어야겠다는 생각을 했습니다. 드디어 시작한 판다스 예에. 얼렁 다 배워서 익숙해지고 싶어요. 어떻게 잘 써먹을수 있을지 기대되네요. 39. ch06_09-43. ch06_13 02.part1. [파이썬 필수 스킬] 데이터분석을 위한 시작, 전처리 라이브러리 ch 01_01- ch 01_04 39. ch06_09 3. index를 반환하는 argsort 정렬된 값이 아닌 index를 반환 3-1. 열 정렬(왼쪽에서 오른쪽) np.argsort(arr2d, axis=1) >array([[0, 1, 2, 3], [3, 2, 1, 0], [1, 0, 3, 2]]) np.sort(arr2..
[패스트캠퍼스 수강 후기] 데이터분석 인강 100% 환급 챌린지 7회차 미션 안녕하세요. 듣는 강의 갯수는 얼마 안되는데 매 강의마다 적고 외우다보면 시간이 금방 훅 가네요. 주말에도 해야한다는 부담이 다소 있지만 꾸준히 쭉 가니 좋네요. 36. ch06_06 - 38. ch06_08 36. ch06_06 3. boolean 인덱싱 조건 필터링을 통하여 boolen 값을 이용한 색인 arr = np.array([1, 2, 3, 4, 5, 6, 7]) arr2d = np.array([[1, 2, 3, 4], [5, 6, 7, 8], [9, 10, 11, 12]]) 3-1. true와 false값으로 myTrueFalse = [True, False, True, False, True, False, True] arr[myTrueFalse] >array([1, 3, 5, 7]) (true..
[패스트캠퍼스 수강 후기] 데이터분석 인강 100% 환급 챌린지 6회차 미션 안녕하세요. 오늘은 주말이라 쉬는줄 알고 있다가 뒤늦게 미션 완료! 점점 헷갈리는게 생기네요. 다시 블로그 들여다보면서 공부해야겠어요. 34. ch06_04 - 35. ch06_05 34. ch06_04 import numpy as np 1. 슬라이싱 배열의 부분 선택 arr = np.array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9]) arr.shape >(10, ) 1-1 .index 지정하여 색인 1차원 array : 범위안에 있는 것만 가능. 앞은 0부터, 끝은 -1부터 arr = np.array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9]) arr[0] >0 arr[10] >error (9까지만 순서) arr[-1] >9 (뒤에서부터 거꾸로) arr[-10] >0 arr..