Seaborn
- Matplotlib 기반 통계 시각화 라이브러리
- 통계정보 : 구성, 분포, 관계 등
- Matplotlib 기반이라 Matplotlib으로 커스텀 가능
- 쉬운 문법과 깔끔한 디자인이 특징
pip install seaborn=='version'
import seaborn as sns
- 시각화의 목적과 방법에 따라 API를 분류하여 제공
- Categorical API
⊙ Countplot(): 범주를 이산적으로 세서 막대 그래프로 그려주는 함수
⊙ boxplot(): Box Plot. 대푯값을 잘 보여주지만 실제 분포를 표현하기에는 부족
⊙ violinplot(): Violin Plot. Box Plot의 단점을 어느정도 보완.
이산적 데이터를 연속처럼 표현 & 데이터 범위가 아닌 곳까지 데이터 표시하는 단점.
⊙ boxenplot(), swarmplot(), stripplot() 등 - Distribution API
범주형/연속형 모두 살펴볼 수 있음
⊙ histplot(): 히스토그램
⊙ kdeplot(): Kernel Density Estimate
⊙ ecdfplot: 누적 밀도 함수
⊙ rugplot: 선을 사용한 밀도함수
⊙ histplot, kdeplot으로 결합 확률분포 표현 가능. 입력에 2개의 축 모두 넣어주면 됨. - Relation & Regression API
⊙ scatterplot(): Scatter Plot. hue뿐만 아니라 style, size로도 데이터 구분 가능.
⊙ lineplot(); Line Plot
⊙ regplot(): 회귀선을 추가한 scatter plot - Matrix Plots
⊙ heatmap(): Heatmap. 상관관계 시각화에 사용 - Multiples API
⊙ jointplot(): Joint Plot. 2개 피처의 결합확률 분포와 각각의 분포를 시각화 제공.
⊙ pariplot(): Pair Plot. 데이터셋의 pari-wise 관계를 시각화 - Theme API
- Facet Grid
다중 패널을 사용하는 시각화
feature-feature 뿐만 아니라 feature's category-feature's category간의 관계도 볼 수 있음.
⊙ catplot(): Categorical
⊙ displot(): Distribution
⊙ replot(): Relational
⊙ Implot(): Regression
'네이버 부스트캠프 AI Tech > Data Visualization' 카테고리의 다른 글
[부스트캠프 AI Tech] Interactive visualization & 비정형 데이터셋 viz (0) | 2022.02.17 |
---|---|
[부스트캠프 AI Tech] 다양한 시각화 방법론 (0) | 2022.02.13 |
[부스트캠프 AI Tech] matplot lib basics (0) | 2022.02.04 |
[부스트캠프 AI Tech] 데이터 시각화 기초 (0) | 2022.02.03 |
댓글