본문 바로가기
네이버 부스트캠프 AI Tech/Data Visualization

[부스트캠프 AI Tech] 데이터 시각화 기초

by 중앙백 2022. 2. 3.
데이터 시각화
  • 데이터를 그래픽 요소로 매핑하여 시각적으로 표현하는 것.
  • 시각화의 목적 / 독자(대상자)는 누구인가 / 어떤 데이터를 시각화할 것인가 / 어떤 스토리로 인사이트를 전달할 것인가 / 방법은 효과적인가 / 디자인은 만족스러운가

 

  • 데이터를 시각화하기 위해서는 데이터가 우선적으로 필요
    시각화를 진행할 데이터 : 데이터셋 관점(global) / 개별 데이터의 관점(local)

 

데이터 셋의 종류
  • 정형 데이터 : 테이블 형태로 제공되는 데이터. csv, tsv파일로 제공. → 데이터간 비교 및 관계. 주로 통계적 특성 확인.
  • 시계열 데이터 : 시간 흐름에 따른 데이터. → 추세, 계절성, 주기성들을 살핌
  • 지리 데이터 : 지도 정보와 보고자 하는 정보 간의 조화 중요. → 거리, 경로, 분포 등 실제 사용
  • 관계형(네트워크) 데이터 : 객체와 객체 간의 관계를 시각화. 객체는 Node, 관계는 Link로 표현.
                    크기, 색, 수 등으로 객체와 관계간 가중치 표현.
  • 계층적 데이터 : 관계 중에서도 포함 관계가 분명한 데이터 → Tree, Treemap, Sunburst 등
  • 비정형 데이터

 

 

데이터의 종류
  1. 수치형(numerical) - 연속형(continuous) : 길이, 무게, 온도 등
                            - 이산형(discrete) : 주사위 눈금, 사람 수 등
  2. 범주형(categorial) - 명목형(norminal) : 혈액형, 종교 등
                            - 순서형(ordinal) : 학년, 별점, 등급 등 (숫자로 표현은 되지만 정량적인 의미가 없음)

 

시각화 이해하기
  • mark : 점, 선, 면으로 이루어진 데이터 시각화

  • channel : 각 마크를 변경할 수 있는 요소들

  • Pre-attentive Attribute(전주의적 속성)
    주의를 주지 않아도 인지하게 되는 요소
    과도하게 사용하면 인지하기 어려움. 적절하게 사용해야 시각적 분리(visual popout)

 

 

댓글