8일(현지 시간) 미국 라스베이거스에서 열린 ‘CES 2019’에서 프랑스인 제빵사가 구글 스마트홈 기기의 ‘통역사 모드’를 이용해 영어 구사 고객의 주문을 받는 서비스를 시연하고 있다. 라스베이거스=AP 뉴시스
지난해 7월 이집트 카이로 특파원 부임 전까지 약 4년 동안 산업부에서 기업들을 취재했다. 삼성과 LG, 네이버와 카카오, 스타트업까지 두루 취재하며 기술 발전상을 현장에서 목격했다.
쏜살같이 진화하는 기술이 많았지만 그중에서도 ‘음성인식기술’의 발전은 놀랄 정도였다. 사람과 컴퓨터(기계)가 대화하는 방식은 키보드, 마우스에서 스마트폰으로 바뀌었고, 점점 최종 목표인 ‘목소리’에 다가가고 있다. 인간이 가진 가장 본질적인 커뮤니케이션 도구인 ‘음성’으로 할 수 있는 일들이 점점 많아지고 있다.
‘세상의 새로운 기술들은 모두 모인다’는 세계 최대 가전 박람회 CES를 올해는 현장 방문 대신 아프리카에서 유튜브로 보다 보니 새삼 기술의 변화가 피부로 느껴졌다. 전자·정보기술(IT) 산업에서 뒤처진 아프리카는 아직 인터넷 속도 경쟁에 애쓰는 반면 바다 건너 미국에서는 로봇과 대화를 나누고 있다니…. 멀어도 너무 먼 세상 이야기 아닐까.
올해 CES에서 음성인식기술의 경쟁은 치열했다. 몇 가지 정형화된 단어, 문장으로 제한됐던 명령 방식은 이제는 목소리와 발음, 억양이 걸림돌이 되지 않을 정도까지 발전했다. 날씨를 묻는 데 그쳤던 질문은 쇼핑, 의료 영역으로 확장됐다. 자주 쓰는 단어의 사용빈도, 생활습관을 데이터로 기록해 맞춤형 정보를 제공하는 ‘개인화’ 단계도 시작된 지 오래다.
전 세계에서 통용되는 언어는 7000여 개라고 한다. 음성인식기술 분야에서 연구하는 언어는 이 중 약 2%에 불과하다. 신기술 발표회장에선 “기술이 우리의 삶을 더 편리하게 만들고 있습니까”란 질문이 많이 나온다. 만약 객석에 앉은 청중이 전 세계 언어들로 고루 분포됐다면 이 중 98%는 “아니요”라고 답할 수밖에 없는 상황이다.
사람의 언어와 목소리를 분석하는 기업들의 도전이 성공할수록 소득이 낮고 기술 발전이 뒤진 국가들의 언어는 무대 뒤편으로 사라진다. 케냐에서는 영어와 스와힐리어(아프리카 동부에서 통용되는 언어)를 함께 쓰는데 몇 년이 지난 뒤 음성인식기술이 이 나라를 지배한다면 과연 스와힐리어는 살아남을 수 있을까? 가능성이 그리 높지 않아 보인다.
기업에 대해 돈을 벌어다줄 수 있는 언어를 무시하고 소수의 언어를 지키라고 요구할 수도 없는 노릇이다. 그럼에도 언어야말로 사람의 삶과 역사를 선명하게 드러내는 거울이라는 점에서 아쉬움이 크다. 북극에는 얼음과 눈에 대한 다양한 명칭이 있고, 아프리카에는 계절에 따라 나무를 지칭하는 이름들이 있다. 이런 언어에 담긴 감정과 정서, 지혜와 삶의 방식마저 모두 사라질 것이라는 걱정이 커진다.
위키피디아에 따르면 스와힐리어는 500만여 명이 첫 번째 언어로, 5000만여 명이 두 번째 언어로 사용한다고 한다. 기계가 언어를 배우려면 데이터가 있어야 한다. 하지만 스와힐리어뿐 아니라 아프리카 토착민이 많이 쓰는 하우사어, 요루바어 등을 다룬 연구 문헌도, 영상도 거의 없다. 데이터 양에 따라 기술의 진보는 배가 아닌 제곱의 속도로 성장하는 법인데 이런 언어들은 출발선조차 불분명하다.
3, 4년 전 페이스북, 구글 등은 전 세계를 인터넷으로 연결하겠다며 아프리카 하늘에 태양열로 움직이는 무인기나 대형 풍선을 띄우는 프로젝트를 계획했다. 이른바 ‘디지털 소외 현상’을 막으려는 노력이었다. 유튜브 영상 한 편 보기도 여의치 않은 아프리카에서 바다 건너 미국 라스베이거스의 대형 기술 박람회를 보며 ‘데이터를 쌓기 위해 수백, 수천 명에 이르는 아프리카인의 목에 마이크를 걸어 언어를 수집하는 또 하나의 프로젝트가 곧 시작되지는 않을까’ 하는 엉뚱한 상상을 해본다.
서동일 카이로 특파원 dong@donga.com