대선 기간 내내 여론조사에 대한 불신이 컸다. 이제는 다가오는 지방선거를 앞두고 차분히 말도 많고 탈도 많았던 여론조사를 돌아볼 시간이다. 필자는 2021년 1월 초부터 여론조사 공표금지 기간이 시작된 3월 2일까지 실시된 대선 후보 지지율 조사 총 620개를 취합해 조사기관의 고유한 경향성을 보정한 ‘통합지지율’을 매주 발표한 바 있다.
이번 대선 결과 윤석열, 이재명 후보의 표 차이는 불과 0.73%포인트(윤 48.56%, 이 47.83%)였다. 막판 야권후보 단일화라는 변수가 있긴 했지만 윤-이 후보의 지지율 격차를 분석하여 이번 대선 여론조사를 평가해 보자. 620여 개 대선 여론조사별로 윤-이 후보의 지지율 차이를 구하고 조사기관별 경향성을 보정한 후 지지율 차이를 추정해 보았다.
우선 여론조사 공표 금지 기간 직전(3월 2일 기준) 여론조사에서의 두 후보 간 지지율 차이는 약 3.7%포인트로 실제 득표율 차이인 0.73%포인트와는 차이가 컸다. 실제 득표율 차이가 신뢰구간(1.7%포인트∼5.6%포인트)을 벗어났다. 이번 대선 여론조사는 윤 후보의 상대적 우위를 전반적으로 과대 추정했다고 볼 수 있다.
20·30 여성 등 일부 잠재적 이 후보 지지자들의 응답률 저조를 원인으로 꼽을 수 있다. 필자가 속한 서울대-연세대 연구팀이 디자인해 2월 중순 채널A가 실시한 조사에서 20대 여성의 응답률은 동일한 연령대 남성의 절반에도 미치지 못했다. 또 세 번째 전화 시도에서 응답한 사람은 첫 번째 시도에서 응답한 사람과 비교해 이 후보 지지율은 약 4.7%포인트 높았던 반면 윤 후보 지지율은 7.4%포인트 낮았다. 여론조사 전반에서 이 후보 지지층의 응답률이 매우 낮았던 것을 시사한다.
영원한 논란거리인 자동응답방식(ARS)과 면접조사를 비교하면 어떨까? 여론조사 공표 금지 기간 시작 직전 ARS는 3.9%포인트, 면접조사는 2.5%포인트 차이로 윤 후보 우위를 예상해 면접조사가 실제 득표율 차이에 더 근접했다. 실제값(0.73%포인트)이 ARS 신뢰구간(1.8%포인트∼5.9%포인트)을 완전히 벗어난 반면 면접조사(0.1%포인트∼4.9%포인트) 신뢰구간 내에 있었다. 면접조사의 판정승이다.
물론 면접조사에서는 작년 8∼10월 국민의힘 경선이 한창일 무렵 평균 8.0%포인트 이상 윤 후보가 이 후보에게 크게 뒤지는 현상이 지속된 적이 있었고 선거 막바지로 가면서 오히려 ARS 결과에 근접하는 경향을 보여 논쟁의 여지도 있다.
면접 대 ARS, 무선 대 유무선 혼합, 가상번호 대 임의전화(RDD) 방식 등 세 축에 따라 세분화된 비교를 할 경우, ARS·무선·가상번호 방식이 실제값(0.73%포인트)에 가장 근사한 값(1.6%포인트)을 보였고 면접·무선·가상번호 방식(2.1%포인트)이 그 뒤를 이었다. 즉 ARS를 활용하더라도 가상번호를 사용하면 요일과 시간 등을 잘 선정할 경우 면접조사와 유사한 정확도를 확보할 수 있다는 해석이 가능하다. 반면 가장 저렴한 조사방식으로 볼 수 있는 ARS·유무선 혼합·RDD 방식은 윤-이 후보 격차를 가장 과대 추정(4.7%포인트)한 것으로 나타나 ‘싼 게 비지떡’임을 보여주었다.
업체별로 살펴보면 마지막 조사를 내놓은 날짜를 기준으로 미디어리서치(0.3%포인트), NBS(엠브레인퍼블릭·케이스탯리서치·코리아리서치인터내셔널·한국리서치 공동조사, 0%포인트), 한국갤럽(1.6%포인트), 윈지컨설팅(―0.2%포인트) 등이 실제 득표율 차이인 0.73%포인트와 1%포인트 이내의 오차를 보였다. 그러나 윈지컨설팅은 이 후보가 윤 후보를 앞선 결과를 내놓아 정확한 예측으로 간주하기엔 무리가 있었다. 또 NBS는 선거 막판 윤-이 후보 간 격차를 일주일 사이 0%포인트→9%포인트로 발표했다가 최종적으로 0%포인트 차이로 발표하며 널뛰기를 거듭했다. 또 두 후보의 격차를 0%포인트로 발표하여 실제로 승자를 제대로 예측했는지 확인 불가능하다. 반면 칸타코리아(6.7%포인트), 글로벌리서치(6.2%포인트), 넥스트리서치(5.8%포인트) 등은 실제 선거 결과와 비교하여 5%포인트 이상 윤 후보 우위를 과대 추정한 것으로 나타나 개선이 필요해 보인다.
이번 대선에서 여론조사는 전반적으로 윤 당선인의 우위를 과대 추정하는 한계를 보였다. ARS와 RDD 방식을 결합한 조사들이 특히 심했다. 20·30 여성 등 응답률이 낮은 잠재적 이 후보 지지층 표집에 특히 어려움을 겪었던 결과다. 결국 ‘저가형’ 조사들이 상대적으로 문제가 컸다. 다가오는 지방선거에서 언론이 자발적으로 이런 부류의 저비용 조사 결과는 보도를 자제하는 방안을 검토할 만하다.
댓글 0