KT ‘AI 원팀’ 10배 빠른 음성합성 기술 개발

  • 동아일보
  • 입력 2021년 1월 8일 03시 00분


코멘트

출범 10개월만에 산학연 첫 성과
무빙 픽처 기술은 IPTV 등 활용
AI 로봇 고장진단, 현대重에 적용

KT의 인공지능(AI) 스피커 플랫폼 ‘기가지니’에는 ‘아빠 목소리로 동화책을 읽어주기’ 서비스가 있다. 아빠가 300문장 정도를 스피커에 녹음하면 AI 딥러닝 음성합성 기술을 통해 다른 모든 콘텐츠의 음성을 아빠 목소리로 바꿔준다. 이용자들의 관심이 높지만 아빠가 직접 300문장을 읽어야 하는 번거로움이 적지 않았던 것도 사실이다.

이에 KT는 김회린 KAIST 교수 등 ‘AI 원팀’과 함께 딥러닝 음성합성 기술을 혁신해 속도는 10배가량 높이고 비용은 4분의 1 수준으로 줄였다. ‘아빠 목소리 음성합성’도 기존 300문장에서 70문장으로 대폭 줄였다. 이 기술은 AI 스피커의 안내 음성을 연예인 목소리로 바꿔주는 음성합성에도 활용할 계획이다.

KT는 현대중공업그룹, LG전자, LG유플러스, 한국투자증권, 동원그룹, KAIST, 한양대 등과 함께 구성한 ‘AI 원팀’이 출범 10개월 만에 첫 공동 연구개발 성과를 내놨다고 7일 밝혔다. 음성합성, E2E(End-to-End) 음성인식, 무빙 픽처, AI 기반 로봇 고장 진단 기술 등 4종의 혁신 기술이다.

E2E 음성인식은 KT가 장준혁 한양대 교수와 함께 개발했다. 사양과 데이터를 늘려 기존 방식보다 단어 정확도를 7% 이상 향상시켰다. KT는 이 기술을 활용해 AI 스피커 기기 등의 자유 발화 음성 인식률을 끌어올릴 계획이다.

KT가 한양대 김태현 교수와 연구한 무빙 픽처 기술은 이미지에 모션 효과를 적용해 영상으로 바꾸는 솔루션이다. KT는 이를 인터넷TV(IPTV)를 비롯해 포스터, 웹툰, 광고 등 다양한 분야에서 활용할 계획이다.

현대중공업그룹이 한양대 장 교수와 개발한 AI 기반 로봇 고장 진단 기술은 AI가 산업용 로봇의 고장을 진단할 수 있는 기술이다. 진동 신호에 음성처리 기술과 딥러닝 기술을 적용해 핵심 구동 부품인 감속기의 이상 유무를 탐지할 수 있다. 현대중공업그룹은 이 기술을 다양한 로봇 제품에 적용해 자동화 라인의 유지보수 효율을 극대화할 수 있을 것으로 기대하고 있다.

AI 원팀은 이번에 공개한 4개 프로젝트 외에도 올해 AI 로봇 등 다양한 분야에서 7개 프로젝트를 추가로 추진할 계획이다.

유근형 기자 noel@donga.com
#kt#ai원팀#음성합성
  • 좋아요
    0
  • 슬퍼요
    0
  • 화나요
    0
  • 추천해요

댓글 0

지금 뜨는 뉴스