고대 그리스의 철인(哲人) 소크라테스와 플라톤 가운데 후대 사람들은 책에서 누구를 더 많이 다뤘을까. 정확한 답을 찾을 수는 없지만 근사치의 답을 구할 수 있다. 답은 ‘플라톤’.
이런 답을 구할 수 있는 것은 최근 구글이 공개한 ‘엔그램뷰어’(ngrams.googlelabs.com) 덕이다. 구글은 전자책 제작을 위해 스캔한 책 가운데 1500∼2008년 출간된 520만 권을 대상으로 단어 사용 빈도를 따져 데이터베이스(DB)를 구축했다. 약 5000억 개의 단어를 망라했다. 영어 프랑스어 독일어 등 7개 언어권 책을 대상으로 했으며 이 중 1800∼2000년 출간된 영문 책의 비중이 가장 크다.
이 DB는 엔그램뷰어를 통해 확인할 수 있다. 1800∼2000년 나온 영문 책을 확인한 결과 소크라테스를 제목이나 본문에 언급한 횟수는 187만 건으로 플라톤(408만 건)에 훨씬 못 미쳤다. 이 기간 영어로 번역된 플라톤의 저작, 플라톤에 관한 연구서가 더 많았음을 짐작할 수 있다.
구글과 함께 DB작업을 진행한 미국 하버드대 연구진은 이 DB가 언어학을 비롯한 인문사회과학 연구, 문화 트렌드 분석 등에 좋은 기초 자료가 될 것으로 예상했다. 특정 인물들의 비교뿐 아니라 특정 단어가 어떻게 생성되고 소멸되는지, 단어 사용 빈도가 사회 현상과 어떤 연관을 맺는지 등 다각도의 해석이 가능하다는 것이다.
예를 들어 제1차 세계대전을 가리키던 ‘the Great War’라는 표현은 전쟁이 발발한 1914년부터 사용 빈도가 급증해 1930년대 말까지 유지됐다. 하지만 1939년 제2차 세계대전이 터지자 이 표현의 사용 빈도는 뚝 떨어졌고 대신 ‘World War I’이라는 표현이 급부상했다.
연구진은 책에 등장한 빈도만으로 유명도를 따지는 것에는 허점이 있지만 어느 정도 비교는 가능하다고 설명했다. ‘모차르트’와 ‘베토벤’을 비교한 그래프를 보면 전체적으로 베토벤이 줄곧 우위를 보이다가 모차르트 사망 200주기(1991년), 탄생 250주년(2006년)을 거치면서 최근엔 모차르트를 언급한 빈도가 더 많아졌다. 역대 최고의 과학자로 꼽을 수 있는 갈릴레오, 다윈, 프로이트, 아인슈타인 가운데선 프로이트가 가장 많이 등장했다. ‘한국(Korea)’과 ‘일본(Japan)’을 비교해보면 각각 336만 건, 960만 건이 확인된다. 예로부터 서양의 관심이 한국보다는 일본에 더 치우쳐 있었음을 짐작할 수 있다.
‘자본주의(capitalism)’ ‘사회주의(socialism)’ ‘공산주의(communism)’는 1930년대 초까지 근소한 차이만 있을 뿐 비슷한 빈도로 책에 등장했다. 그러나 ‘공산주의’의 빈도는 차츰 줄어들었고 1980년대를 거치면서 사회주의의 빈도 그래프도 급격히 하향곡선을 그렸다. ‘여성(women)’이라는 단어는 1970년대 초까지는 ‘남성(men)’에 비해 언급 빈도가 크게 떨어졌다. 그러나 페미니즘의 발달과 궤를 같이해 격차가 줄어들었고 1980년대 중반부터는 ‘여성’이 ‘남성’을 추월했다.
댓글 0