“음성으로 이모티콘을 표현할 수 있을까?” “하루가 다르게 늘어나는 신조어를 어떻게 재빨리 업데이트하지?”
추석 연휴 전날인 1일 오전 서울 중구 을지로2가 SK텔레콤 T타워 미디어앤드퓨처 사업부문장실. 설원희 부문장과 SK텔레콤 미래기술원 김민석 원장이 머리를 맞대고 있었다. SK텔레콤은 말로 문자메시지를 보내고 무선인터넷을 음성으로 검색하거나 녹음된 음성파일을 자동으로 문서로 바꿔주는 휴대전화 음성인식 서비스를 비롯해 자동번역, 자연어 검색 등 세 가지 서비스를 3년째 개발하고 있다. 내년 하반기에 상용화될 이 프로젝트의 구체적인 내용이 이날 처음 공개됐다.
○ 1억 개 문장으로 음성 DB 만들다
SK텔레콤의 휴대전화 음성인식 서비스 기술은 크게 휴대전화에 장착될 하드웨어와 무선인터넷에서 실행될 소프트웨어로 나뉜다. 기술의 주요 뼈대는 3개로, 음성을 문자로 전환해주는 핵심 엔진과 구어체와 문어체를 합친 한글 데이터베이스(DB), 그리고 그 위에 얹어질 소프트웨어다. 그간 핵심 엔진 기술이 약해 개발에 애를 먹은 SK텔레콤은 미국 음성인식 전문기업인 ‘뉘앙스’사(社)와 기술 협력을 해왔다. 현재 음성인식 서비스는 80% 정도 완성됐다.
휴대전화 음성인식의 목표는 사용자가 하는 말을 띄어쓰기까지 고려해 자동으로 문자화하는 것이다. “아버지가방에들어가신다”라고 붙여 말해도 ‘아버지가 방에 들어가신다’로 나타낼 수 있는 똑똑한 DB를 만드는 것. 김 원장은 “말로 거는 휴대전화가 나왔고 목적지를 말로 지시하는 내비게이션도 나타났지만 여전히 단순한 단어, 문장을 인식하는 수준에 머물러 있다”고 말했다.
SK텔레콤은 국어학자, 언어학자 등 한국어 전문가 섭외에만 1년을 쏟았다. 사내·외 60명으로 2007년 라인업을 만든 개발팀은 10만 개의 단어를 기반으로 1억 개 이상의 문장을 추출했다. 이를 통해 각 음운에 대한 수학적 모델링과 단어 간의 관계, 형태소 분석, 동음이의어, 발음, 속도 등 갖가지 변수를 고려해 최대한 다양한 음성 및 문자 샘플을 1년간 만들었다. 또 사용자마다 발음이 다른 것을 감안해 지역별, 연령별, 성별 음성인식률 조사도 했다.
○ 자판, 터치, 다음은 음성인식
이 프로젝트의 애초 취지는 자판(1세대), 터치(2세대)로 이어지는 모바일 패러다임에 3세대 ‘음성’ 기술을 선보이고 이를 문자로 나타내려 한 것. 시각장애인이나 고령층을 위해서도 기술개발이 필요했다. 물론 궁극적인 목표는 음성인식 기술을 통해 모바일업계를 선도하는 것이다. ‘애플’의 아이폰도 최근 음성으로 전화를 걸 수 있는 음성인식 기술을 장착해 선보였다. 설 부문장은 “국내 음성인식 기술은 불확실한 시장성으로 지속적인 연구, 투자가 이뤄지지 않았다”며 “이번 기회를 통해 정부, 학계, 산업계가 함께 협력 모델을 만들었으면 한다”고 말했다.
이와 함께 SK텔레콤이 선보일 기술은 온라인 웹 페이지를 자동으로 한글로 번역해주는 ‘자동번역(머신 트랜슬레이션)’과, 기업 간 거래(B2B) 시장을 겨냥해 내놓는 ‘자연어 검색(텍스트 마이닝)’이 있다. 이 중 텍스트 마이닝은 기업이 소비자 선호도 조사 또는 마케팅 자료 조사 시 원하는 데이터만 검색해주는 시스템으로 지난달 ‘시맨틱 검색’을 선보인 SK커뮤니케이션즈와 공동으로 연구 중이다. 예를 들어 영화 ‘해운대’의 온라인 평가를 조사하기 위해 ‘해운대 영화 평가’로 검색하면 ‘해운대’ ‘영화’ ‘평가’란 말이 각각 들어 있는 모든 검색 결과가 아닌 사용자가 의도한 것만 제시하는 시스템이다. 이를 위해 SK텔레콤은 가격을 표현할 때, 맛을 평가할 때 쓰는 말 등 표현별 지식체계를 분류했으며 감정이나 선호에 대한 표현 역시 8만3000여 개의 DB를 만들었다.
김범석 기자 bsism@donga.com
홍석민 기자 smhong@donga.com
댓글 0