본문 바로가기

카테고리 없음

[패스트캠퍼스 수강 후기] 데이터분석 인강 100% 환급 챌린지 22회차 미션

20. ch02. seaborn - 05. seaborn matplotlib 차트를 seaborn에서 - 21. ch02. seaborn - 06. countplot

 

 titanic = sns.load_dataset('titanic')
titanic

survived: 생존여부
pclass: 좌석등급
sex: 성별
age: 나이
sibsp: 형제자매 + 배우자 숫자
parch: 부모자식 숫자
fare: 요금
embarked: 탑승 항구
class: 좌석등급 (영문)
who: 사람 구분
deck: 데크
embark_town: 탑승 항구 (영문)
alive: 생존여부 (영문)
alone: 혼자인지 여부


tips = sns.load_dataset('tips')
tips


total_bill: 총 합계 요금표
tip: 팁
sex: 성별
smoker: 흡연자 여부
day: 요일
time: 식사 시간
size: 식사 인원

1. Countplot

항목별 갯수

# 배경을 darkgrid 로 설정
sns.set(style='darkgrid')

1-1 세로로 그리기

sns.countplot(x="class", hue="who", data=titanic)
plt.show()

1-2. 가로로 그리기

sns.countplot(y="class", hue="who", data=titanic)
plt.show()

1-3. 색상 팔레트 설정

sns.countplot(x="class", hue="who", palette='copper', data=titanic)
plt.show()

2. distplot

matplotlib의 hist 그래프와 kdeplot을 통합한 그래프 입니다.

분포와 밀도를 확인할 수 있습니다.

2-1. 기본 distplot

sns.distplot(x)
plt.show()

2-2. 데이터가 Series 일 경우

x = pd.Series(x, name="x variable")
x

sns.distplot(x)
plt.show()

2-3. rugplot

rug는 rugplot이라고도 불리우며, 데이터 위치를 x축 위에 작은 선분(rug)으로 나타내어 데이터들의 위치 및 분포를 보여준다.

sns.distplot(x, rug=True, hist=False, kde=True)
plt.show()

2-4. kde (kernel density)

kde는 histogram보다 부드러운 형태의 분포 곡선을 보여주는 방법

sns.distplot(x, rug=False, hist=False, kde=True)
plt.show()

2-5. 가로로 표현하기

sns.distplot(x, vertical=True)

2-6. 컬러 바꾸기

sns.distplot(x, color="y")
plt.show()

3. heatmap

3-1. 기본 heatmap

uniform_data = np.random.rand(10, 12)
sns.heatmap(uniform_data, annot=True)
plt.show()


3-2. pivot table을 활용하여 그리기

tips

pivot = tips.pivot_table(index='day', columns='size', values='tip')
pivot

sns.heatmap(pivot, cmap='Blues', annot=True)
plt.show()

 

 

 

 

패스트캠퍼스 데이터분석 강의 링크
bit.ly/3imy2uN