본문 바로가기
네이버 부스트캠프 AI Tech/Data Visualization

[부스트캠프 AI Tech] Seaborn

by 중앙백 2022. 2. 5.
Seaborn
  • Matplotlib 기반 통계 시각화 라이브러리
  • 통계정보 : 구성, 분포, 관계 등
  • Matplotlib 기반이라 Matplotlib으로 커스텀 가능
  • 쉬운 문법과 깔끔한 디자인이 특징
pip install seaborn=='version'
import seaborn as sns

 

 

 

  • 시각화의 목적과 방법에 따라 API를 분류하여 제공
  1. Categorical API
    ⊙ Countplot(): 범주를 이산적으로 세서 막대 그래프로 그려주는 함수
    ⊙ boxplot(): Box Plot. 대푯값을 잘 보여주지만 실제 분포를 표현하기에는 부족
    ⊙ violinplot(): Violin Plot. Box Plot의 단점을 어느정도 보완.
                   이산적 데이터를 연속처럼 표현 & 데이터 범위가 아닌 곳까지 데이터 표시하는 단점.
    ⊙ boxenplot(), swarmplot(), stripplot() 등

  2. Distribution API
    범주형/연속형 모두 살펴볼 수 있음
    ⊙ histplot(): 히스토그램
    ⊙ kdeplot(): Kernel Density Estimate
    ⊙ ecdfplot: 누적 밀도 함수
    ⊙ rugplot: 선을 사용한 밀도함수
    ⊙ histplot, kdeplot으로 결합 확률분포 표현 가능. 입력에 2개의 축 모두 넣어주면 됨.

  3. Relation & Regression API
    ⊙ scatterplot(): Scatter Plot. hue뿐만 아니라 style, size로도 데이터 구분 가능.
    ⊙ lineplot(); Line Plot
    ⊙ regplot(): 회귀선을 추가한 scatter plot

  4. Matrix Plots
    ⊙ heatmap(): Heatmap. 상관관계 시각화에 사용

  5. Multiples API
    ⊙ jointplot(): Joint Plot. 2개 피처의 결합확률 분포와 각각의 분포를 시각화 제공.
    ⊙ pariplot(): Pair Plot. 데이터셋의 pari-wise 관계를 시각화

  6. Theme API

  7. Facet Grid
    다중 패널을 사용하는 시각화
    feature-feature 뿐만 아니라 feature's category-feature's category간의 관계도 볼 수 있음.
    ⊙ catplot(): Categorical
    ⊙ displot(): Distribution
    ⊙ replot(): Relational
    ⊙ Implot(): Regression

댓글