첫 총선땐 ‘자유’가 핵심… 이번엔 ‘세대갈등’ ‘복지’ 떠올라■ 65년간 본보 지면에 등장한 ‘선거 키워드’ 분석해 봤더니
○ 키워드로 보는 선거 이슈
분석한 결과 제헌국회 선거에서는 ‘자유’라는 단어가 가장 많이 쓰였다. 정부 ‘수립’(6위)을 위한 첫 자유 ‘총선거’(7위)라는 의미가 담겨 있다. 첫 투표이기 때문에 유권자들이 투표소에서 본인임을 확인하는 ‘무인(拇印)’이란 말(19위)도 등장했다. 6·25전쟁 중 첫 직선으로 치러진 2대 대선(이승만 당선)에서는 ‘유엔’(1위) ‘휴전’(4위) ‘회담’(6위) ‘포로’(7위) 등이, 5·16군사정변 후 민정이양 형식으로 치러진 5대 대선(박정희 당선)에서는 ‘최고회의’(3위) ‘혁명정부’(7위)가 많이 사용됐다.
5, 6대 총선과 7대 대선에서는 ‘고무신’과 ‘막걸리’라는 단어가 ‘유권자’ ‘표’ ‘운동원’ 등과 함께 등장했다. 당시 집권당이 선거에 통반장을 동원했고 막걸리 한잔이나 고무신 한 켤레에 표를 사고팔았기 때문이다.
6월 민주항쟁 직후 13대 대선(노태우 당선)에서는 ‘지역감정’과 ‘단일화’가, 현대그룹 정주영 회장이 나선 14대 대선(김영삼 당선)에서는 ‘금권’ ‘관권’ ‘정치자금’ 등 돈과 관련된 단어가 많았다.
외환위기 때인 15대 대선(김대중 당선)에서는 ‘국제통화기금(IMF)’ ‘DJP연합’ ‘내각제’가, 16대 대선(노무현 당선)에서는 ‘병풍’ ‘후보단일화’ ‘행정수도’란 단어가 가장 많이 등장했다. 가장 최근의 17대 대선(이명박 당선)에서는 ‘BBK’ ‘선진화’ ‘대운하’ 등이 키워드였다.
선거 시기 ‘갈등’의 관련어를 보면 총선과 대선의 차이가 확인된다. 총선에서는 ‘공천’ 갈등이 가장 부각되고 ‘지역’ ‘세대’ ‘계파’ ‘당내’ 갈등도 나타난다. 반면 대선에서는 ‘당내’ 갈등이 도드라진다. 여야 간 본선 대결보다는 당내 경선 과정이 치열하기 때문이다. ‘종교’ ‘계층’ ‘노사’ ‘세대’ 갈등 등 전국적인 키워드가 나타나는 것도 대선 시기의 특징이다.
‘관권선거’ ‘금권선거’ ‘부정선거’ ‘불법선거’ ‘타락선거’ ‘혼탁선거’라는 키워드는 4대 대선(3·15부정선거)을 비롯해 7대(박정희 후보와 김대중 후보 격돌), 13대(6월 민주항쟁 직후), 14대(정주영 회장 출마)에 많이 등장했다. 총선 시기에는 5, 8, 13, 14대에 많았다. 대선과 총선이 겹치는 1960년, 1971년, 1987∼88년, 1992년에 논란이 많았던 셈이다. 총선과 대선이 겹친 올해에는 어떤 형태로 나타날까.
○ ‘개혁’ 줄고 ‘복지’ 떠올라
‘지역감정’은 13대 대선부터 다시 영향력을 발휘했다. ‘1노 3김’이 대결한 이 선거에서 당시 노태우 후보는 대구에서 69.7%, 김영삼 후보는 부산에서 56%, 김대중 후보는 광주에서 94.4%, 김종필 후보는 충남에서 45%를 득표했다. 14, 15, 16대 대선에서도 ‘지역감정’ 키워드는 힘을 발휘했으나 이명박 후보가 당선된 17대 대선 이후 비중이 크게 줄었다.
김일환 연구교수는 “지역감정이 선거 키워드로 등장하지 않는다고 유권자들의 지역 기반 투표 성향이 줄어들었다고 볼 수는 없다”며 “지역감정은 너무 고착화돼 더는 이슈가 되지 못하는 대신 ‘경제’ ‘세대 갈등’ ‘복지’ 등의 키워드가 선거의 주요 쟁점으로 떠올랐다”고 분석했다.
16대 총선에서는 ‘낙선운동’이 최대 화제였다. 그러나 18대와 올해 19대에서는 주목도가 크게 낮아졌다.
‘개혁’이란 단어는 16, 17대 총선에서 영향력 있는 키워드였으나 18, 19대에서는 점차 줄었다. 19대에서는 ‘복지’가 중요한 키워드로 등장했다. 4대 총선(1958년) 이후 54년 만이다. 무상급식이 이슈화한 데다 여야의 ‘선택적 복지’와 ‘전면적 복지’ 공약이 논쟁의 중심이 됐기 때문이다.
전승훈 기자 raphy@donga.com
▼ 본보 창간후 모든 기사 DB 구축… 선거기간 단어 3억개 분석 ▼
■ 어떻게 조사했나
어절 기준 무려 3억 개의 단어를 대상으로 한 데이터 분석에는 신문기사를 데이터 마이닝 기법으로 연구하는 고려대 민족문화연구원의 ‘물결 21’ 사업팀이 모두 동원됐다. 국문과 김흥규 교수, 언어학과 강범모 교수와 김일환 정유진 HK연구교수, 이도길 HK교수 및 석박사과정생 연구원 4명, 대학생 5명이 참여했다.
분석에는 3주 이상 걸렸다. 1947년 7월 21일부터 2012년 3월 26일까지 65년간의 신문기사량이 만만치 않았던 데다 1980년대 이전에는 한자가 많이 포함됐고 띄어쓰기의 오류도 적지 않기 때문이다.
선거 기간은 대선 전 1년, 총선 전 6개월(1990년대 이후는 대선 전 6개월, 총선 전 3개월)로 잡았다. 선거 기간의 키워드를 뽑기 위해 전체 단어의 빈도 통계를 구했다. 마찬가지로 관련어(선거 키워드)는 ‘선거’란 단어가 들어간 문장이나 문단의 전체 단어를 모두 색인한 뒤 예상보다 많이 쓰인 단어의 의미값(t-점수)을 계산했다.
신문기사는 블로그나 트워터와 비교할 때 신뢰도가 높다. 데이터 마이닝이 첨단이라고 하지만 텍스트의 신뢰성이 높지 않다면 가치가 낮을 수밖에 없다.
신문기사는 하루 단위로 나와 그동안 어떠한 단어를 얼마나 어떻게 썼는지 알기 어렵다. 직관으로 예측하기는 쉽지 않다는 얘기다. 특히 지금 독자가 경험하지 못한 시기에 대해서는 더더욱 그렇다. 이번 분석은 1920년 창간 이후 동아일보의 전 기사가 디지털로 DB화 되어 있기 때문에 가능했다.
김흥규 교수는 “신문기사는 그 시기 관심사와 사건이 그대로 담겨 있으므로 데이터 마이닝에 아주 좋은 자료”라며 “앞으로 과거와 현재뿐만 아니라 미래를 예측하는 데도 활용될 것”이라고 말했다.
김진경 기자 kjk9@donga.com