본문 바로가기

카테고리 없음

[패스트캠퍼스 수강 후기] 데이터분석 인강 100% 환급 챌린지 24회차 미션

24. ch02. seaborn - 09. pairplot - 25. ch02. seaborn - 10. violinplot

24. ch02. seaborn - 09. pairplot


집합의 조합에 대해 히스토그램과 분포도
숫자형 column에 대해서만

4-1. 기본 pairplot

sns.pairplot(tips)

plt.show()

4-2. hue 옵션으로 특성 구분

sns.pairplot(tips, hue='size')
plt.show()

4-3. 컬러 팔레트 적용

sns.pairplot(tips, hue='size', palette="rainbow")
plt.show()

4-4. 사이즈 적용

sns.pairplot(tips, hue='size', palette="rainbow", height=5,)
plt.show()



25. ch02. seaborn - 10. violinplot


5. violinplot


바이올린처럼 생긴 violinplot 입니다.

column에 대한 데이터의 비교 분포도를 확인할 수 있습니다.

곡선진 부분 (뚱뚱한 부분)은 데이터의 분포를 나타냅니다.
양쪽 끝 뾰족한 부분은 데이터의 최소값과 최대값을 나타냅니다.

5-1. 기본 violinplot 그리기

sns.violinplot(x=tips["total_bill"])

plt.show()


5-2. 비교 분포 확인

x, y축을 지정해줌으로썬 바이올린을 분할하여 비교 분포를 볼 수 있습니다.


sns.violinplot(x="day", y="total_bill", data=tips)

plt.show()


5-3. 가로로 뉘인 violinplot

sns.violinplot(y="day", x="total_bill", data=tips)

plt.show()


y와 x 순서 바꿔주기


5-4. hue 옵션으로 분포 비교

단일 column에 대한 바이올린 모양의 비교


sns.violinplot(x="day", y="total_bill", hue="smoker", data=tips, palette="muted")
plt.show()


5-5. split 옵션으로 바이올린을 합쳐서 볼 수 있습니다.

sns.violinplot(x="day", y="total_bill", hue="smoker", data=tips, palette="muted", split=True)

plt.show()

그래야 데이터가 비대칭 모양으로 확인할 수 있어서 split 옵션을 줌.



패스트캠퍼스 데이터분석 강의 링크
bit.ly/3imy2uN