가짜뉴스 콕 잡아내는 ‘AI 보안관’ 나온다

첫 개발대회 본선서 23개팀 겨뤄… 디피스트 1위 등 3개팀 수상
딥러닝 기술… 엉뚱한 내용 가려내
정부서 15억 지원받아 본격 개발

8일 경기창조경제혁신센터에서 개최돼 가짜뉴스 판별 기술을 겨룬 ‘인공지능(AI) R&D 챌린지’에서 1위를 차지한 ‘디피스트’팀. 과학기술정보통신부 제공

인공지능(AI)으로 인터넷과 소셜네트워크서비스(SNS)에 떠도는 수많은 가짜 뉴스를 근절하기 위한 도전이 시작됐다.

8일 오전 경기 판교 테크노밸리에 위치한 경기창조경제혁신센터 국제회의장에서 23개 팀 80여 명이 참석한 가운데 가짜 뉴스(fake news) 판별 기술을 겨루는 ‘인공지능 R&D(연구개발) 챌린지’ 대회가 열렸다. 이들은 71개 팀 256명이 참가한 예선을 뚫고 본선에 진출했다.

심사위원회는 한국언론진흥재단을 통해서 받은 6000여 개의 ‘진짜 기사’ 가운데 20%는 일부 다른 내용을 집어넣거나 본문 내용과 다른 내용의 제목을 넣어 ‘가짜 뉴스’로 만들었다. 주어진 시간은 5시간. 참가팀은 각자 개발한 가짜 뉴스 판별 엔진을 작동시켜 6000여 개 기사 각각마다 ‘진짜 뉴스’가 100% 확실하면 1을, ‘가짜 뉴스’임이 확실하면 0을 입력했다.

과학기술정보통신부가 올해 처음 개최한 이 대회에서 우승한 팀은 ㈜이스트소프트와 줌인터넷㈜의 개발자들이 연합한 ‘디피스트(Deepest)팀’이었다. 이 팀은 모든 문제를 정확히 맞혔을 때의 만점을 1점으로 했을 때 0.7457점을 받았다. 김형철 과기정통부 기반소프트웨어컴퓨팅실 프로그램 매니저는 “1점 만점 중 0.9점 이상은 되어야 상용화가 가능한 수준이지만, 참가팀들이 6월 말 대회 공고 이후 5개월의 짧은 기간 동안 개발에 매달린 점을 감안하면 기대 이상의 성적을 보였다”고 말했다.

이번 대회에 출제된 가짜 뉴스는 크게 두 가지였다. 뉴스 제목과 다른 내용의 본문을 제시한 유형과 뉴스 본문 중 맥락에 관계없는 엉뚱한 내용이 포함된 뉴스를 찾는 것이었다. 가장 문제되는 가짜 뉴스는 사실이 아닌 내용을 사실로 포장한 뉴스이지만 고난도임을 고려해 이번에는 출제되지 않았다. 앞으로 가야 할 길이 멀다는 의미다.

1위를 차지한 디피스트팀의 김창기 연구원은 “가짜 뉴스를 가려내기 위한 문장 간의 유사도 분석을 위해 ‘워드임베딩(word Embedding) 기술’과 ‘딥러닝 기술’을 접목했다”고 말했다. 워드임베딩 기술은 단어 간의 의미 연관성을 거리 단위로 표현한 기술이다. 예를 들면 사과와 배는 거리가 가깝고, 사과와 고양이는 상대적으로 멀다. 딥러닝은 컴퓨터가 사람의 뇌처럼 사물이나 데이터를 분류하는 기술로 기계학습의 일종이다. 이번에 수상한 3개 팀은 과기정통부에서 총 15억 원을 지원받아 가짜 뉴스를 가리는 AI를 계속 개발하게 된다. 과기정통부 관계자는 “본선에서 ‘톱 5’에 오른 팀들은 문단, 문장, 단어 사이의 연관관계 분석을 위해 나름대로 기계학습을 철저히 시켰다”며 “아직 초보 수준이지만 내년부터 본격적인 R&D를 거쳐 가짜 뉴스 판별도가 빠르게 높아질 것으로 본다”고 말했다.

‘속이는 것을 목적으로 만들어진 이야기’인 가짜 뉴스는 SNS를 통해 확산되면서 올 들어 세계적인 문제로 부상하고 있다. 미국 대선 기간 3개월간 페이스북을 통해 유통된 상위 20개 가짜 뉴스의 공유, 반응, 댓글 건수는 871만 건으로 상위 20개 주요 언론사 뉴스 기사에 대한 공유, 반응, 댓글 건수(736만 건)를 웃돌기도 했다. 권용현 과기정통부 지능정보사회추진단 부단장은 “앞으로도 사회의 여러 문제에 대한 기술적 해결책을 모색하겠다”고 말했다.

신수정 기자 crystal@donga.com

가짜뉴스 콕 잡아내는 ‘AI 보안관’ 나온다

첫 개발대회 본선서 23개팀 겨뤄… 디피스트 1위 등 3개팀 수상 딥러닝 기술… 엉뚱한 내용 가려내 정부서 15억 지원받아 본격 개발

첫 개발대회 본선서 23개팀 겨뤄… 디피스트 1위 등 3개팀 수상
딥러닝 기술… 엉뚱한 내용 가려내
정부서 15억 지원받아 본격 개발