데이터 시각화
- 데이터를 그래픽 요소로 매핑하여 시각적으로 표현하는 것.
- 시각화의 목적 / 독자(대상자)는 누구인가 / 어떤 데이터를 시각화할 것인가 / 어떤 스토리로 인사이트를 전달할 것인가 / 방법은 효과적인가 / 디자인은 만족스러운가
- 데이터를 시각화하기 위해서는 데이터가 우선적으로 필요
시각화를 진행할 데이터 : 데이터셋 관점(global) / 개별 데이터의 관점(local)
데이터 셋의 종류
- 정형 데이터 : 테이블 형태로 제공되는 데이터. csv, tsv파일로 제공. → 데이터간 비교 및 관계. 주로 통계적 특성 확인.
- 시계열 데이터 : 시간 흐름에 따른 데이터. → 추세, 계절성, 주기성들을 살핌
- 지리 데이터 : 지도 정보와 보고자 하는 정보 간의 조화 중요. → 거리, 경로, 분포 등 실제 사용
- 관계형(네트워크) 데이터 : 객체와 객체 간의 관계를 시각화. 객체는 Node, 관계는 Link로 표현.
크기, 색, 수 등으로 객체와 관계간 가중치 표현. - 계층적 데이터 : 관계 중에서도 포함 관계가 분명한 데이터 → Tree, Treemap, Sunburst 등
- 비정형 데이터
데이터의 종류
- 수치형(numerical) - 연속형(continuous) : 길이, 무게, 온도 등
- 이산형(discrete) : 주사위 눈금, 사람 수 등 - 범주형(categorial) - 명목형(norminal) : 혈액형, 종교 등
- 순서형(ordinal) : 학년, 별점, 등급 등 (숫자로 표현은 되지만 정량적인 의미가 없음)
시각화 이해하기
- mark : 점, 선, 면으로 이루어진 데이터 시각화
- channel : 각 마크를 변경할 수 있는 요소들
- Pre-attentive Attribute(전주의적 속성)
주의를 주지 않아도 인지하게 되는 요소
과도하게 사용하면 인지하기 어려움. 적절하게 사용해야 시각적 분리(visual popout)
'네이버 부스트캠프 AI Tech > Data Visualization' 카테고리의 다른 글
[부스트캠프 AI Tech] Interactive visualization & 비정형 데이터셋 viz (0) | 2022.02.17 |
---|---|
[부스트캠프 AI Tech] 다양한 시각화 방법론 (0) | 2022.02.13 |
[부스트캠프 AI Tech] Seaborn (0) | 2022.02.05 |
[부스트캠프 AI Tech] matplot lib basics (0) | 2022.02.04 |
댓글