여론조사 보완 수단 떠올라
지난해 한국의 4·13총선과 6월 영국의 유럽연합(EU) 탈퇴, 그리고 미국 대통령 선거까지 여론조사는 민심을 읽는 데 실패했다. 낮은 응답률도 문제지만 속내를 제대로 밝히지 않는 응답자들의 진의(眞意)를 여론조사가 제대로 반영하지 못했다는 비판이 쏟아졌다.
그럼 여론조사의 한계를 보완하는 대안은 없을까. 미국 등 선진국에서는 ‘샤이(shy·부끄러워하는) 보수’ 등 숨은 여론을 보다 정확히 반영할 수 있는 보완책을 마련하는 데 여론조사 기관들이 많은 노력을 기울이고 있다. 그중 가장 강력한 대안으로 사용되는 것이 ‘빅데이터 분석’이다. 공신력 있는 여론조사기관이 맞히지 못한 선거 결과를 빅데이터 분석을 통해 맞히는 일이 늘고 있다.
지난해 미국 대선의 승자는 빅데이터라는 말이 있다. 미국 주요 언론들이 대부분 힐러리 클린턴 전 국무장관의 승리를 예측한 가운데 소셜네트워크서비스(SNS), 인터넷, 모바일 검색량을 토대로 분석한 예측치가 실제 결과와 가장 비슷한 것으로 나왔기 때문이다.
지난해 미국 대선 이전 세종대 경영학부 우종필 교수는 “대선 당선자는 트럼프가 될 것이고, 선거인단 수는 도널드 트럼프 285∼275명, 힐러리 클린턴 263∼253명이 될 것”이라고 예측해 주목을 받았다. 대선 결과 그가 트럼프 대통령이 당선될 것이라고 한 예측은 적중했다. 선거인단은 트럼프가 306명, 클린턴이 232명을 확보해 약간의 차이를 보였지만 이것도 근접하게 맞혔다.
우 교수가 트럼프 대통령의 당선을 예측할 수 있었던 것은 빅데이터를 분석한 덕분이다. 그는 구글의 검색 키워드 추세를 도표화해 실시간으로 보여주는 빅데이터 기반의 서비스인 ‘구글 트렌드’를 이용해 민심을 읽었다. 우 교수는 “유권자의 절대 다수가 컴퓨터나 스마트폰으로 접속하는 온라인에서는 굳이 표심을 숨기지도 않고 숨길 수도 없다”며 “이번 미국 대선을 두고 SNS를 분석한 결과 힐러리 클린턴이 도널드 트럼프를 이긴 적은 단 한 번도 없었다”고 설명했다.
빅데이터 분석이 최근 각종 여론조사의 복병으로 자리 잡은 ‘샤이’한 유권자의 표심을 읽을 수 있는 유력한 장치라고 전문가들은 보고 있다. 학계에서는 ‘샤이 유권자’ 현상을 독일의 커뮤니케이션 학자 노엘레 노이만의 ‘침묵의 나선 이론’을 통해 설명한다. 자신이 품고 있는 생각이 다수의 의견과 다르면 이를 굳이 밝히지 않고 침묵한다는 것이다. 지난해 미국 대선 때 샤이 유권자 현상은 ‘샤이 트럼프’로 불리며 여론조사 참패 사태를 초래했다.
보완재일 뿐 대체재는 아닌 빅데이터
그러나 빅데이터 분석이 여론조사를 대체할 수 있느냐는 질문에 고개를 끄덕이는 전문가는 많지 않다. 이들은 빅데이터 분석에도 한계가 있다고 지적한다. 우 교수는 “빅데이터를 추출하는 공간은 인터넷, 모바일 환경인데 이를 활발하게 이용하는 연령대는 아무래도 젊은층이 많다. 이 때문에 다양한 연령층의 여론을 반영하기가 어려운 측면이 있다”고 설명했다.
여론이 왜 변하는지에 대한 해석을 제시하지 못하는 점도 문제점으로 지적된다. 빅데이터 분석이 여론의 흐름, 실시간으로 변하는 여론 등 방향성은 보여줄 수 있지만 “왜 그렇게 변하는지”에 대한 해석의 근거를 제시하지 못한다는 것이다.
박성진 기자 psjin@donga.com