뉴스 트렌드 생활정보 International edition 매체

ETRI, 한국어 언어 모델 ‘AI 코버트’ 공개

입력 | 2019-06-12 03:00:00


사람이 하는 말을 정확히 이해하고 적절한 대답을 찾도록 돕는 인공지능(AI)용 한국어 데이터베이스(언어모델)가 나왔다. 기존에 존재하던 구글의 한국어 모델보다 질의응답, 문장 내 개체 역할 인식 등 성능이 뛰어난 것으로 평가됐다.

한국전자통신연구원(ETRI)은 AI 서비스 개발을 위해 독자적으로 구축한 한국어 특화 딥러닝 언어모델 ‘코버트(KorBERT)’를 10일 홈페이지를 통해 공개했다고 11일 밝혔다. 언어모델은 AI가 언어를 학습할 수 있도록 구축한 일종의 데이터베이스다. 언어를 숫자로 표현한 뒤 AI 기술의 일종인 딥러닝을 이용해 학습한다. 이 과정에서 어떤 단어가 특정 조건에서 얼마나 많이, 자주 나타나는지를 확률로 계산해 언어와 함께 모았다. ETRI의 코버트는 최근 10년간의 신문기사와 백과사전 데이터를 추가로 학습시켜 학습량을 늘린 게 특징이다.

윤신영 동아사이언스 기자 ashilla@donga.com