터틀맨이 부르는 ‘새로운 시작’, 김광석이 부르는 김범수의 ‘보고 싶다’…. TV 프로그램 속 무대에서 고인이 된 가수들이 그들의 사후 발매된 노래를 부릅니다. 김광석의 떨리는 미성, 터틀맨의 굵직한 랩이 울려 퍼지자 몇몇 관객은 놀라움에 두 손으로 얼굴을 감싸 쥐거나, 눈물을 훔칩니다. 이젠 들을 수 없을 거라 생각했던 고인의 목소리가 달팽이관을 타고 흘러 들어가 잊힌 기억을 소환했기 때문입니다.
고인의 생전 목소리를 알고리즘에 학습시켜 새로운 노래를 부르게 한 곳은 2020년 세워진 AI 오디오 기업 수퍼톤입니다. 창업자인 이교구 대표는 대학에선 전기공학을 전공했지만, 음악은 늘 삶의 한 축을 차지했습니다. 2000년대 초반부터 ‘사람같이 자연스러운 노래 부르는 기술을 만들 수 있을까?’라는 호기심을 품습니다. 록 음악에 빠져 밴드 보컬을 했을 정도로 음악에 매료된 삶을 살아온 그에게는 자연스러운 물음이었습니다.
음악을 사랑한 공학도는 일탈을 감행합니다. 많은 기술 기업이 TTS(Text To Speech·텍스트 음성 변환)에 매달려 ‘말하는 AI’를 개발할 때 그는 학계도, 시장도 관심이 없던 ‘노래하는 AI’로 눈을 돌립니다. ‘소리의 힘’으로 창작의 모든 한계를 허물겠다는 꿈을 품고 20여년간 묵묵히 한 길을 걸었습니다. AI가 그야말로 세상을 뒤흔드는 와중에 수퍼톤은 지난달 실시간 음성 변환 서비스 ‘시프트’를 내놓았습니다. 그동안의 스토리를 들어보았습니다.
이 대표는 2002년 대학 졸업 후 미국으로 넘어가 뉴욕대 음악 기술 석사, 스탠퍼드대 컴퓨터음악·음향학 박사 과정을 밟았습니다. 7년 동안 학계와 시장, 어디서도 주목받지 못했던 오디오 머신러닝 기술을 파고들었습니다. ‘남들이 뭐라 하든 내가 원하는 건 계속 밀고 나간다’는 관성. 그는 2009년 귀국해 모교인 서울대 융합과학기술대학원 지능정보융합학과 교수를 맡으면서 본격적으로 자신의 화두에 천착하기 시작합니다. 그건 바로 ‘음성 합성 기술’이었습니다.
내면의 호기심을 집요하게 파고드니 시장의 수요는 자연스럽게 따라왔습니다. 가창 합성 기술로 그는 창작의 한계에 끊임없이 도전했습니다. 교통사고로 사지마비 장애를 입어 전성기 수준의 고음을 낼 수 없는 ‘더 크로스’ 김혁건의 샤우팅 창법을 구현한 것이 대표적입니다. 음성 합성 기술로도 영역을 넓히고 있습니다. 디즈니플러스 드라마 ‘카지노’ 속 최민식의 30대 시절 목소리를 만드는가 하면, 넷플릭스 드라마 ‘마스크걸’ 속 BJ 마스크걸의 목소리도 창조했습니다. 잠재력을 엿본 하이브는 총 490억 원을 투자해 수퍼톤을 인수했습니다.
‘기술이 올바르게 쓰이면 이리도 아름답구나.’ 2008년 심근경색으로 세상을 떠난 터틀맨이 수퍼톤의 AI 기술로 부활해 그의 사후 발표된 노래 ‘새로운 시작’을 부르는 영상에는 이런 댓글이 달렸습니다. 이 대표가 지향하는 목표도 이와 맞닿아있습니다. 그의 목표는 음성 합성 기술로 창작자의 창의성을 제한하는 벽을 무너뜨리고 확장하겠다는 것입니다.
아침 식사가 왜 영어로 Breakfast인지 아시나요? Fast는 ‘금식’이란 뜻입니다. Break Fast는 ‘금식을 깬다’는 의미죠. BreakFirst는 이른 아침 당신의 허기를 가장 먼저 깨주는 뉴스레터입니다. 초심을 잊은 당신, 관성에 매몰된 당신을 위해 다양한 업계에서 ‘처음’을 만들어낸 이들을 만납니다.
매주 월요일 오전 7시 30분 발송되는 ‘관성을 깨는 1분, BreakFirst’ 뉴스레터를 구독하고 권태와 졸음을 영감과 혁신으로 채워 보세요. 구독자에게만 공개된 영상 인터뷰도 확인할 수 있습니다.
▶뉴스레터 구독
https://www.donga.com/news/Newsletter?p0=70010000001050&m=list
댓글 0