20. ch02. seaborn - 05. seaborn matplotlib 차트를 seaborn에서 - 21. ch02. seaborn - 06. countplot
titanic = sns.load_dataset('titanic')
titanic
survived: 생존여부
pclass: 좌석등급
sex: 성별
age: 나이
sibsp: 형제자매 + 배우자 숫자
parch: 부모자식 숫자
fare: 요금
embarked: 탑승 항구
class: 좌석등급 (영문)
who: 사람 구분
deck: 데크
embark_town: 탑승 항구 (영문)
alive: 생존여부 (영문)
alone: 혼자인지 여부
tips = sns.load_dataset('tips')
tips
total_bill: 총 합계 요금표
tip: 팁
sex: 성별
smoker: 흡연자 여부
day: 요일
time: 식사 시간
size: 식사 인원
1. Countplot
항목별 갯수
# 배경을 darkgrid 로 설정
sns.set(style='darkgrid')
1-1 세로로 그리기
sns.countplot(x="class", hue="who", data=titanic)
plt.show()
1-2. 가로로 그리기
sns.countplot(y="class", hue="who", data=titanic)
plt.show()
1-3. 색상 팔레트 설정
sns.countplot(x="class", hue="who", palette='copper', data=titanic)
plt.show()
2. distplot
matplotlib의 hist 그래프와 kdeplot을 통합한 그래프 입니다.
분포와 밀도를 확인할 수 있습니다.
2-1. 기본 distplot
sns.distplot(x)
plt.show()
2-2. 데이터가 Series 일 경우
x = pd.Series(x, name="x variable")
x
sns.distplot(x)
plt.show()
2-3. rugplot
rug는 rugplot이라고도 불리우며, 데이터 위치를 x축 위에 작은 선분(rug)으로 나타내어 데이터들의 위치 및 분포를 보여준다.
sns.distplot(x, rug=True, hist=False, kde=True)
plt.show()
2-4. kde (kernel density)
kde는 histogram보다 부드러운 형태의 분포 곡선을 보여주는 방법
sns.distplot(x, rug=False, hist=False, kde=True)
plt.show()
2-5. 가로로 표현하기
sns.distplot(x, vertical=True)
2-6. 컬러 바꾸기
sns.distplot(x, color="y")
plt.show()
3. heatmap
3-1. 기본 heatmap
uniform_data = np.random.rand(10, 12)
sns.heatmap(uniform_data, annot=True)
plt.show()
3-2. pivot table을 활용하여 그리기
tips
pivot = tips.pivot_table(index='day', columns='size', values='tip')
pivot
sns.heatmap(pivot, cmap='Blues', annot=True)
plt.show()
패스트캠퍼스 데이터분석 강의 링크
bit.ly/3imy2uN