[대한민국 70년]동아일보 기사속 연관어 빅데이터 분석
1948년 8월 15일 대한민국 정부가 수립된 지 70주년을 맞아 동아일보와 고려대 민족문화연구원 디지털인문학센터가 공동으로 1946∼2014년 동아일보 기사에서 ‘같은 문장에서 대한민국과 함께 가장 많이 언급된 단어’를 분석한 결과 이렇게 나타났다. 1950년 3월 5일자 동아일보는 “대한민국은 유엔 감시하 선거를 통하여 수립되었던 것이며 유엔 총회는 한국의 유일한 합법적 정부로서 규정한 바 있는 것이다”라고 보도했다.
이번 연구는 고려대 민족문화연구원이 구축한 ‘동아일보 코퍼스(corpus·연구를 위한 말뭉치)’ 빅데이터 분석 시스템을 활용했다. 같은 문장에 함께 쓰인 정도가 높다는 건 두 단어의 연관성이 강하다는 걸 뜻한다. 이도길 민족문화연구원 교수는 “이 시스템은 직관이 아니라 철저히 단어의 양적 사용 양상을 토대로 추출된 결과를 보여 준다”고 말했다.
동아일보 빅데이터에는 민주화와 산업화를 모두 이룬 우리 현대사가 고스란히 담겼다. 1960년대까지도 ‘춘궁기’가 주요 키워드에 올랐고, 1980년대를 기점으로 단어 ‘전자’의 사용 빈도가 ‘쌀’을 앞섰다. ‘민족’이란 키워드 대신 ‘시민’이 점차 성장해 민주주의의 주체로 등장한 것으로 나타났다.
조종엽 기자 jjj@donga.com