첫 개발대회 본선서 23개팀 겨뤄… 디피스트 1위 등 3개팀 수상 딥러닝 기술… 엉뚱한 내용 가려내 정부서 15억 지원받아 본격 개발
8일 경기창조경제혁신센터에서 개최돼 가짜뉴스 판별 기술을 겨룬 ‘인공지능(AI) R&D 챌린지’에서 1위를 차지한 ‘디피스트’팀. 과학기술정보통신부 제공
8일 오전 경기 판교 테크노밸리에 위치한 경기창조경제혁신센터 국제회의장에서 23개 팀 80여 명이 참석한 가운데 가짜 뉴스(fake news) 판별 기술을 겨루는 ‘인공지능 R&D(연구개발) 챌린지’ 대회가 열렸다. 이들은 71개 팀 256명이 참가한 예선을 뚫고 본선에 진출했다.
심사위원회는 한국언론진흥재단을 통해서 받은 6000여 개의 ‘진짜 기사’ 가운데 20%는 일부 다른 내용을 집어넣거나 본문 내용과 다른 내용의 제목을 넣어 ‘가짜 뉴스’로 만들었다. 주어진 시간은 5시간. 참가팀은 각자 개발한 가짜 뉴스 판별 엔진을 작동시켜 6000여 개 기사 각각마다 ‘진짜 뉴스’가 100% 확실하면 1을, ‘가짜 뉴스’임이 확실하면 0을 입력했다.
1위를 차지한 디피스트팀의 김창기 연구원은 “가짜 뉴스를 가려내기 위한 문장 간의 유사도 분석을 위해 ‘워드임베딩(word Embedding) 기술’과 ‘딥러닝 기술’을 접목했다”고 말했다. 워드임베딩 기술은 단어 간의 의미 연관성을 거리 단위로 표현한 기술이다. 예를 들면 사과와 배는 거리가 가깝고, 사과와 고양이는 상대적으로 멀다. 딥러닝은 컴퓨터가 사람의 뇌처럼 사물이나 데이터를 분류하는 기술로 기계학습의 일종이다. 이번에 수상한 3개 팀은 과기정통부에서 총 15억 원을 지원받아 가짜 뉴스를 가리는 AI를 계속 개발하게 된다. 과기정통부 관계자는 “본선에서 ‘톱 5’에 오른 팀들은 문단, 문장, 단어 사이의 연관관계 분석을 위해 나름대로 기계학습을 철저히 시켰다”며 “아직 초보 수준이지만 내년부터 본격적인 R&D를 거쳐 가짜 뉴스 판별도가 빠르게 높아질 것으로 본다”고 말했다.
‘속이는 것을 목적으로 만들어진 이야기’인 가짜 뉴스는 SNS를 통해 확산되면서 올 들어 세계적인 문제로 부상하고 있다. 미국 대선 기간 3개월간 페이스북을 통해 유통된 상위 20개 가짜 뉴스의 공유, 반응, 댓글 건수는 871만 건으로 상위 20개 주요 언론사 뉴스 기사에 대한 공유, 반응, 댓글 건수(736만 건)를 웃돌기도 했다. 권용현 과기정통부 지능정보사회추진단 부단장은 “앞으로도 사회의 여러 문제에 대한 기술적 해결책을 모색하겠다”고 말했다.
신수정 기자 crystal@donga.com