시각을 통한 데이터 분석 도출하기

사람은 많은 정보를 시각으로 얻기 때문에, 데이터 시각화는 데이터를 말하는 데에 좋은 방법입니다.

0

 

Computing, Control, Information and Education Engineering, Liu, sung &yao, 2015

… 사람은 80% 이상의 정보를 시각을 통해 얻는다.

– Computing, Control, Information and Education Engineering, Liu, sung &yao, 2015

 photo created by freepik
photo created by freepik

인간은 시각의 동물이라는 말을 들어본 적 있을 것이다. 인간은 자연적으로 시각적 입력을 다른 어떤 방법보다도 빠르게 인지하기 때문이다. 그만큼 우리에게 시각이 중요하다는 의미이기도 한데, 보통 사람이 감각기관을 통해 획득하는 정보 중 80% 이상이 시각을 통해 얻어진다고 한다. 그렇기 때문에 데이터 시각화는 우리에게 효과적일 수밖에 없다.

 

우리는 본능적으로 패턴을 찾는다

 그림 1.19 데이터 시각화로 요약한 우리나라 전 국민의 우울증 진료 현황 데이터
그림 1.19 데이터 시각화로 요약한 우리나라 전 국민의 우울증 진료 현황 데이터

우리는 시각화 차트를 볼 때 가장 먼저 어떤 시각적 패턴이 있는 것은 아닌지 유심히 살핀다.

시각화 요소인 도형의 형태, 크기, 위치나 색을 근거로 시각적 패턴을 찾는다. 어떤 의도에 의한 움직임이 아니라 자연스러운 반응이다. 예를 들어, 선 차트에서는 선의 높낮이 변화 형태를 근거로 데이터의 변화 추세를 파악한다. 또 다른 값들과 구별되는 이상치가 있는지 없는지여부를 빠르게 파악하기도 한다. 마찬가지로 막대 차트, 파이 차트 등 다른 시각화 차트 모두시각화 요소의 시각적 패턴을 근거로 데이터의 의미를 파악할 수 있다.

데이터 시각화를 활용하면 데이터 분석을 위한 수학적, 통계적 전문 기술이 없어도 차트의 시각적 패턴을 근거로 누구나 쉽게 데이터 인사이트를 찾을 수 있다. 데이터 전문가뿐만 아니라 누구나 시각화를 통해 데이터를 활용할 수 있다는 의미다. 넓은 의미에서는 시각화를 활용할 때 데이터를 활용할 수 있는 사람의 범위가 넓어지므로 데이터를 기반으로 한 가치 창출의 범위가 확대된다고도 볼 수 있다.

Photo by Sigmund on Unsplash
Photo by Sigmund on Unsplash

 

데이터 시각화는 스토리텔링에 힘을 부여한다

같은 맥락에서 데이터 시각화는 스토리텔링에도 강점이 있다. 데이터를 활용하는 사람이 시각화 차트를 통해 데이터 인사이트를 쉽고 빠르게 찾아 낼 수 있듯이 시각화 차트를 보고 정보를 수용하는 사람 역시 동일한 원리에 따라 효과적으로 데이터의 의미를 이해할 수 있다. 데이터의 의미를 전달해 상대방을 설득하고, 데이터를 통해 스토리텔링하고자 할 때 시각화를 적절히 활용하면 효과적으로 의미를 전달할 수 있다.

Photo by Amerr Basheer on Unsplash
Photo by Amerr Basheer on Unsplash

시각화 유형, 목적에 맞게 골라 한다

한 가지 주의해야 할 점은 정확한 데이터 인사이트 전달을 위해 어떤 형태의 시각화를 활용할 것인가를 고민해야 한다는 점이다. 자신이 전달하고자 하는 데이터 인사이트에 적합한 시각화 유형을 선택하고, 해석에 오류가 발생하지 않도록 시각화 차트를 만들어야 한다. 그렇다면 데이터 인사이트에 적합한 시각화 유형은 무엇일까? 많은 시각화 유형 중 특정 시각화 유형을 선택하는 기준은 ‘데이터를 어떤 목적으로 보여줄 것이냐’가 일반적이다.

시각화 차트 분류와 관련된 해외 자료로 앤드루 아벨라(Andrew Abela)가 고안한 차트 유형 추천 도표를 살펴보자. 여기서는 차트의 사용 목적을 비교, 관계, 분포, 구성으로 나눈다.

그림 1.20 앤드루 아벨라가 고안한 목적에 따른 차트 선택 방법
그림 1.20 앤드루 아벨라가 고안한 목적에 따른 차트 선택 방법

데이터 시각화의 가장 기본적인 목적은 데이터의 크기를 ‘비교’하는 것이다. 따라서 모든 시각화 유형은 비교를 위한다고도 할 수 있다. 그중에서도 대표적인 ‘비교’를 위한 시각화 차트는 막대 차트와 선 차트다. 이를 좀 더 세분화하면 누적 막대 차트, 그룹 막대 차트, 영역 차트 등으로 나눌 수 있다. </p>

전체 데이터 중 특정 항목이 차지하는 ‘구성’ 비중을 보는 데 적합한 차트는 파이 차트, 100% 누적 막대 차트, 워터폴(Waterfall) 차트 등이 있다. 차트 내 구성 항목이 많을수록 차트를 구성하는 요소가 많아져 데이터를 비교하기 어렵다. 따라서 구성 비중을 표현하는 데 활용하는 시각화 차트에서는 비교 항목이 4~5개 정도인 데이터를 사용하는 것이 효과적이다.

데이터의 ‘분포’를 확인하기 위해서는 산점도, 히스토그램 등을 활용한다. 데이터 간의 관계를 보기 위해서는 산점도, 버블 차트 등의 시각화 유형을 활용한다.

 


<참고자료>
뉴스젤리·서울신문, 「인터랙티브 데이터 시각화 콘텐츠 ‘우울증 보고서’」, 2017. 03. 03, http://project.newsjel.ly/depressed/
앤드루 아벨라, 『익스트림 프레젠테이션』, 커뮤니케이션북스(2011), 120p

대표저자_강원영

 

원문보기

뉴스젤리
데이터 시각화 전문기업 뉴스젤리는 2014년에 설립되어, 누구나 데이터를 볼 수 있고, 쉽게 활용할 수 있어야 한다는 사명 아래 데이터 시각화 기술을 통한 데이터 민주화(Data Democracy)를 실현하고 있다. 지속적인 특허 경영을 통해 갖춘 기술력으로 데이터 시각화 솔루션 DAISY를 자체 개발했을뿐만 아니라, 시각화 차트 라이브러리 Jelly-Chart 기반의 맞춤형 시각화 대시보드 구축, 시각화 컨설팅 등 공공 및 기업에 다양한 시각화 서비스를 제공한다.

댓글

귀하의 의견을 입력하십시요.!
여기에 이름을 입력하십시요.