[Vol.10] 빅데이터가 읽어낸 2020 미국대선 후보들의 모습
빅데이터가 읽어낸 2020 미국대선 후보들의 모습
최홍규 ([email protected])
EBS 연구위원
2020 미국 대통령 선거 기간이 다가왔다. 민주당의 조 바이든(Joe Biden, 이하 바이든)과 공화당의 도널드 트럼프(Donald Trump, 이하 트럼프)가 두 주인공이다. 지난번 2016년 대선에서는 힐러리 클린턴(Hillary Clinton)과 트럼프가 맞붙었을 당시 힐러리 클린턴에 우위를 점치는 예측들이 많았다. 그래서인지 이번 대선에서 바이든 후보의 지지율이 트럼프보다 높다고 하더라도 끝까지 결과를 지켜봐야 한다는 목소리도 있다.
이번 원고에서는 빅데이터 시각화 솔루션을 통해 2020 대선 후보들의 모습을 읽어보고자 한다. 소프트웨어 솔루션 업체인 RavenPack에서 제공하는 ‘US Election Media Monitor 2020’과 컨설팅 그룹 ICG(Illumina Consulting Group)에서 제공하는 ‘LUX Election 2020’이라는 도구를 통해서 살펴본다.
후보자와 관련된 주제별 뉴스 비율
[출처: US Election Media Monitor 2020(1))]
하지만 트럼프는 바이든 후보에 비해 미디어에서 더 주목한 후보다. 3월 중순 이후 미디어가 바이든을 더 주목하기도 했으나 이후의 기간 동안에 바이든은 트럼프의 미디어 주목도를 넘어서지 못했다. 이것만 봐도 바이든에 비해 트럼프가 미디어에서는 더 주목받고 조명 받았던 인물임은 확실해 보인다.
그렇다면 사람들은 트럼프와 바이든을 언급할 때 어떠한 감정을 함께 언급할까? 아래 그래프에서 확인해볼 수 있다. “LUX Election 2020”은 미국 내에서 영향력 있는 소셜미디어 플랫폼인 트위터(Twitter), 레딧(Reddit), 갭(Gab)의 내용을 분석해준다. 따라서 아래 그래프로 사람들이 일상생활의 소셜미디어를 사용하며 양 후보에 대해 어떠한 감정을 쏟아내는지 그 내용을 비교해볼 수 있다.
일단, 감정을 담은 언급량의 차이에서 바이든은 트럼프를 절대 따라올 수 없다. ‘분노(Anger)’에서부터 ‘기쁨(Joy)’, ‘공포(Fear)’, ‘놀라움(Surprise)’, ‘역겨움(Disgust)’, ‘슬픔(Sadness)’까지도 사람들은 트럼프 후보를 언급하며 이런 감정을 표현하는 경우가 대부분이었다. 트럼프라는 후보가 가지는 캐릭터 때문인지 사람들은 인간 감정의 희로애락을 트럼프라는 인물에는 적극적으로 표현하지만, 상대적으로 바이든에게는 이러한 감정적 표현을 섞어 언급하지 않는다.
후보자 관련 언급된 내용 중 감정적 표현 비율
[출처: LUX Election 2020]
사실 대통령 선거는 한 국가의 정치 이벤트 중 가장 큰 이벤트에 속하므로, 그 어느 때보다 사회 전 분야에 대한 공약에 관심이 커진다. 빅데이터를 통해 각 이슈 영역에 대한 세세한 내용과 그 효과, 이에 대한 사람들의 생각을 명확히 밝혀내는 데는 한계가 있지만 어떠한 후보가 어떠한 이슈들로 부각되고 있으며 이에 대한 사람들의 정서는 어떠한지 정도는 가늠해볼 수 있다. 이에 대한 사례로 아래 그래프들을 살펴볼 수 있다.
아래 그래프는 후보들이 그들의 공약이 수립되는 각 이슈 영역에서 얼마나 조명을 받고 있는지 이를 보여주는 히트맵(heat map)이다. 물론 아래 그래프로 한 후보가 특정 이슈 영역에서 조명받고 있다고 해서 해당 후보가 그 이슈 영역을 장악한다거나 관련 공약을 사람들이 더 찬성하고 있다는 점을 의미하지는 않는다. 그보다는 특정 후보가 어떠한 이슈에 많이 연관되어 언급되고 있으며 그러면서 자신의 존재감을 어떠한 영역에서 드러내고 있는지 이러한 점이 아래 그래프에서 잘 나타난다.
히트맵 상에서 짙은 붉은 영역이 더 많은 언급 정도를 나타내고 부각되는 정도를 의미하는데, 트럼프의 경우 몇몇 이슈 영역에서는 자신의 존재를 뚜렷이 부각시켰다. “정치 자금(Money in Politics)”, “사업 대 노동(Business vs Labor)”, “총기 규제(Gun Control)”, “헬스케어(Healthcare)” 등이 이들 영역이다. 미국 내에서 매번 대통령 선거 때마다 첨예하게 의견이 대립되는 이슈들이다. 이러한 이슈들에서는 바이든도 상대적으로 부각되는 모습을 보였지만, 후보자로서는 트럼프가 이들 이슈 영역에서 후보자라는 인물로서는 더 이슈화되었다고 판단해볼 수 있다. 물론, 다시 반복해 언급하지만 이슈화되었다고 해서 유권자들이 관련 공약에까지 호감을 보일지는 모를 일이다. 분명한 것은 트럼프 후보자 진영은 어떠한 이슈를 부각시키고 스스로도 해당 이슈와 함께 조명을 받는 능력이 바이든 진영보다는 뛰어나다는 점이다.
후보자 관련 이슈 히트맵
[출처: LUX Election 2020(2))]
아래는 각 후보자들이 언급한 공약과 정책들에 대해 사람들은 어떠한 정서적 반응을 보이는지 이를 제시한 그래프이다. 정책이나 공약의 내용과 관련한 센티멘트 분석의 결과다.
조 바이든 후보와 도널드 트럼프 관련 이슈의 감성어 분석
[출처: LUX Election 2020]
바이든 후보의 경우, “사업 대 노동(Business vs Labor)”, “정치 자금(Money in Politics)”, “사회 안전(Social Security)” 측면에서 긍정적인 언급량이 비교적 많았다. 민주당 후보라는 특성이 반영되어 상대적으로 노동자 계층에 대한 대변, 정치 자금에 대한 투명성 확보, 일상적인 사회 안전에 대한 문제 등에 대한 호감도가 높았던 것으로 판단된다.
트럼프 후보 경우에는 “총기 규제(Gun Control)”, “사업 대 노동(Business vs Labor)”, “헬스케어(Healthcare)” 등의 분야에서 긍정적인 언급량이 많았다. 앞서 살펴보았듯이, 이러한 이슈들은 트럼프 진영의 주요 공약들을 포함하고 있는 이슈들인데, 빅데이터로 분석한 내용만을 놓고 보면 유권자들의 호감을 이끌어내는데도 어느 정도의 성과를 거둔 것으로 보인다.
지난번 2016년 미국 대선에서 이변이 일어났다고 평가하는 의견들이 많았다. 그래서인지 이번 대선은 지난번과 달리 확신에 가득 찬 예측이 보이지는 않는다. 미국 선거에 관심이 없는 사람이라도 트럼프가 기존 정치인의 전형을 보여주는 인물이 아니고 이슈를 몰고 다니는 인물이라는 점은 몇몇 뉴스로도 인지할 수 있다. 그래서인지 대선 결과 예측에서 바이든의 지지율이 높게 나온다는 점을 특이한 현상으로 받아들이지는 않는 것이 일반적인 반응이다. 하지만 선거에 있어 예측이 어긋나는 경우는 무수히 많았다. 그래서 이번 미국 대선은 알 수가 없다. 예측도 조심스럽고 지지율이 높은 지역에서도, 낮은 지역에서도 어느 후보도 안심하지 않고 총공세를 펼치는 모양새로 가고 있다.
빅데이터를 통해. 데이터로만 봤을 때, 대선 기간 내내 트럼프 후보 진영은 분명 이슈를 만들고 스스로도 부각되는 효과를 톡톡히 누려왔다. 하지만 그 효과가 바이든 후보라는 안정성을 뛰어넘을 수 있는 것인지 따져봐야 한다. 여론은 항시 뒤바뀌고 샤이한 여론은 어디에나 존재하므로, 유권자의 마음이 빅데이터 마이닝으로 모두 분석되는 것도 아니다. 그냥 현재의 양상만을 가늠해볼 수 있을 뿐이다.
본 원고는 KISA Report에서 발췌된 것으로 한국인터넷진흥원 홈페이지(https://www.kisa.or.kr/public/library/report_List.jsp)에서도 확인하실 수 있습니다.
KISA Report에 실린 내용은 필자의 개인적 견해이므로, 한국인터넷진흥원의 공식 견해와 다를 수 있습니다.
KISA Report의 내용은 무단 전재를 금하며, 가공 또는 인용할 경우 반드시 [한국인터넷진흥원,KISA Report]라고 출처를 밝혀주시기 바랍니다.
1. | ⇡ | RavenPack에서 제공하는 ‘US Election Media Monitor 2020’의 데이터는 2020년 3월1일부터 10월 28일까지의 데이터임(https://election.ravenpack.com/united-states |
2. | ⇡ | 2020년 10월 28일 현재 시점부터 직전 3개월간 수집된 데이터임(https://luxelection2020.com/explore |