Presentation vs Exploration, 메시지를 뒷받침하는 그림, 흥미로운 자료와 틀린해석, 예쁜그림의 함정, (line,bar,scatter)의 용도
강의영상
https://youtube.com/playlist?list=PLQqh36zP38-yh9AnfWEzztWA3flQXkq9g
ref
Cairo, A. Functional Art, The: An Introduction to Information Graphics and Visualization, New Riders, 2012. San Francisco, US.
-
((일반적생각, 카이로의 생각), 제 생각)으로 나누어서 설명
Presentation vs Exploration
Presentation
-
프리젠테이션방식의 시각화는 화자가 다듬은 이야기를 전달하기에 좋은 시각화이다. 즉 잘 정리된 메시지를 전달하기에 좋다.
Exploration
- 문학적유기체라는 작품이다. 링크.
- 어떤 소설책을 시각화.
- 수형도 + 칼라
- 수형도의 의미: 단원, 문단, 문장, 단어 (수형도 계층적 구조를 시각화 하기에 뛰어남. ex: 리그레션트리!)
- 색깔: 여행, 음악, 파티 등 소설에서 자주 등장하는 소재 (색은 범주형 변수를 표현하기에 뛰어남)
-
익스플로래이션 방식은 독자가 스스로 그림에서 메시지를 찾아낸다.
-
소설을 읽어보지 않은 사람: 이 그래픽으로 소설책의 전체 주제를 미리 파악가능
-
소설을 이미 읽어본 사람: 분석 & 탐구를 할 수 있음. ex: 파티와 음악이 동시에 등장하는 경우가 많다.
절충
-
카이로: 사실 프리젠테이션과 익스플로레이션은 절충가능함
- aes(x=‘GDP’,y=‘불평등’,text=‘년도’,color=‘정부’)
- 초록색정부: 소득이 증가 & 불평등이 훨씬 더 증가
- 갈색정부: 매우 빠른 경제 성장
- 포인트간의 간격이 조밀하다 = 변화가 더디다 // 포인트간의 간격이 넓다 = 변화가 빠르다.
-
언뜻보기에는 우리에게 익숙한 라인플랏인듯 보이지만 의외로 정보를 해석할만한 요소가 있다.
익스플로레이션형의 그래프는 그릴줄도 알아야 하지만 남이 그린 그래프를 해석할 수도 있어야함.
메시지를 뒷받침하는 그림을 그려야 한다
인구문제에 대한 편견
-
주장1 (맬서스주의자): 가난한 나라들의 출산율이 너무 높음 \(\to\) 세계인구가 90억까지 증가할 것이다. (현재 70억)
-
주장2: 잘사는 나라에서는 애를 적게 낳음 \(\to\) 고령화 문제
<이성적 낙관주의자>에서 제기된 리들리의 메시지
-
둘다 틀렸다.
-
주장1의 반박: 가난한 나라의 출산율은 점점 감소하고 있음. (특히 가난하다가 막 부유해진 나라는 이러한 감소폭이 드라마틱함, ex: 브라질)
-
주장2의 반박: 평균적으로 잘사는 국가들의 출산률이 매우 낮은것은 사실이나 최근들어 약간 증가하는 경향을 보임. (ex: 스웨덴, 영국, 노르웨이, 스페인)
-
리들리의 주장: 결국 세계의 인구는 안정화 될 것 (증가하지도 감소하지도 않는다)
-
리들리의 주장을 뒷받침하기 위해 그린 그림
- 이 그림은 간단명료해 보이지만 리들리의 주장을 뒷받침하기에는 부족하다.
- 그림에서 얻을 수 있는 정보: 인구변화를 연도별로 나열했더니 성장속도가 둔화된다는 사실
- 리들리가 주장한 다양한 패턴은 이 그림에 보이지 않는다. (출산률이 회복되고 있다는 선진국이라든가, 브라질/인도와 같은 나라의 인구안정화에 대한 주장)
카이로
-
리들러의 메시지는 아래의 그림들이 더 잘 전달한다.
- 스웨덴, 노르웨이 -> 출산률 증가
- 브라질, 인도 -> 출산률 대폭감소
소감
-
어떠한 통계량 혹은 현상을 살펴볼때 그것의 부분집합들이 역시 그러한지 살펴보는것은 기본임 (그룹별로 파악하면 정반대의 결과가 나올 수 있음)
-
중요한 선을 제외한 나머지는 회색처리(일러스트레이터 사용) 한 것이 시각적으로 우수하며, 인상적이었음
-
과학적인 논문작업에 들어갈 그림이라면 임의로 회색처리한 것이 다소 비판을 받을 수 있음.
흥미로운 자료와 틀린해석
- Left: aes(x=‘출산율’, y=‘수입’)
- Right: aes(x=‘출산율’, y=‘전체 중학생중 여학생이 차지하는 비율’)
-
해설: 당신이 부자가 될수록 당신은 더 적은 아이를 가질 것이다 + 중학교에 진학하는 여성이 적을수록 아이를 많이 낳는다. (그림밑에 주석을 해석) - 교재의문장: “중학교에 진학하는 여성이 적을수록 아이를 많이 낳는다고 해석할 수 있다.”
-
여학생들을 중학교에 보내지 않으면 출산율이 올라가나요???
예쁜그림을 그리려다가 메시지가 흐려지지 않도록 하라
사례1: 남미국가의 국방력
-
아래는 남미국가들의 국방력을 시각화한 그림
- 쓸모없는 그래픽
- 뭐 기억나는 것이 있나요?
-
아래가 더 우수한 그림이다. 더 정확한 비교를 할 수 있어요.
-
그리고 위의 그림보다 아래의 그림이 더 우수한 시각화이다.
- 브라질이 국방력도 우수하고 예산도 많이 투자하는 것 같지만 인구가 흑막인것 같다.
-
흑막을 제거
-
최종적으로 제안하는 그래프
- 좌측하단: aes(x=‘인구’, y=‘군인수’, size=‘예산’)
- 우측하단: 관심있는 그래프가 아님
사실 저는 좌측하단의 그래프가 좋은 시각화라고 생각안해요
-
1사분면의 의미: 인구도 높고 군인수도 많은 나라 (똑같은 정보임 의미가 없다. 마치 x축이 토익점수, y축이 텝스점수 같은느낌임)
- 모든 점들이 직선에 몰려있다면? \(\to\) 왜 2차원으로 표현함?
-
저같으면 aes(x=‘예산(인구효과제거)’, y=‘군인수(인구효과제거)’,size=‘인구’)로 할것 같아요.
- 1사분면의 의미: 예산도 많이 쓰고 군인수도 많은나라 = 콜롬비아.
- 4사분면의 의미: 예산은 많이 쓰는데 군인수가 적은나라 = 브라질
-
산점도에서 데이터를 한눈에 파악하고 특징을 요약하기 위해서는 X,Y를 너무 비슷한 성질의 변수로 설정하지마라.
아래중 어떤것이 더 바람직한 그래프인가?
- aes(x=‘토익’, y=‘텝스’, color=‘합/불’, shape=‘회사의종류’)
- aes(x=‘토익’, y=‘GPA’, color=‘합/불’, shape=‘회사의종류’)
사례2: 스페인의 실업률
- 명암으로 왜 크기비교를 하는것인가?
-
비교를 위해서는 바플랏이 더 우수하다.
사례3: 버블의 남용
-
카이로교수님의 강의자료에 등장하는 그림
-
회색이 befor, 검은색이 after
- 크기비교는 바플랏으로 하는것이 아니다.
-
우리눈은 작원원이 큰원의 절반정도 차지한다고 느껴진다.
-
그렇지만 실제로는 아래와 같음
-
버블차트는 크기를 왜곡시킨다.
-
하지만 아래의 버블차트는 우수하다.
-
선거지도는 수치비교에 별로 관심이 없다.
-
대신에 민주당표와 공화당표가 어떤 지역에 몰렸는지 파악하는 것이중요
-
따라서 aes중 가장 중요한 x,y를 모두 지역에 투자함
라인플랏, 바플랏, 산점도
-
시간경과에 따른 변화를 보여주고 싶으면 라인플랏, 비교를 하고 싶다면 바플랏, 관계를 알고싶다면 산점도.