안녕하세요 스테파니 독자 여러분! 동아일보에서 스타트업 취재를 담당하고 있는 김하경 기자입니다. (스테파니는 ‘스’타트업과 ‘테’크놀로지를 ‘파’헤쳐보‘니’의 준말입니다.)
여러분이 평소에 주로 쓰는 소통 도구는 무엇인가요? 상당히 많은 분들이 카카오톡과 같이 문자를 주고받는 메신저를 꼽지 않을까 싶은데요. 업무적으로도, 사적으로도 메신저를 많이 쓰는 한 사람으로서 문자의 장점을 꼽자면 1)대화가 끝난 후에도 다시 내용을 꼼꼼하게 확인할 수 있다 2)대화 내용 중 필요한 부분만 다시 추려낼 수 있다 인 듯합니다.
반면 업무적인 전화를 할 때는 혹시 놓치는 내용은 없을지 메신저로 소통할 때보다 더 바짝 긴장하며 메모하게 되고요. (그렇게 타자치는 속도가 빨라지게 됐다는 슬픈 전설…)
그런데 전화 통화 내용이 날아갈세라 이를 문자로 변환해 마치 상대방과 메신저 대화를 한 것처럼 들여다볼 수 있도록 서비스하는 스타트업이 있습니다. 바로 ‘리턴제로’인데요. 요즘 인공지능(AI)을 활용해 통화 음성을 텍스트로 변환시켜주는 서비스를 일부 대기업에서도 제공하고 있지만, 이같은 서비스를 가장 먼저 출시한 회사는 리턴제로라고 합니다.
AI가 핫해진 것을 계기로 최근 리턴제로의 이참솔 대표(39)를 만나 창업기를 들어봤는데요. 이번 스테파니에서는 13년 전 첫 창업과 카카오 입사, 퇴사 후 리턴제로 창업까지 그의 이야기를 소개하려 합니다.
―‘리턴제로’라는 사명의 의미는 뭔가요. 공동창업자 3명이 같이 정한 이름인데요. 옛날 스타일이긴 하지만 C언어 스타일로 코딩할 경우 ‘인클루드(include)’라는 말로 시작해서 ‘리턴제로(return zero)’로 끝내거든요. 저희가 KAIST 전산학과에서 전산동아리를 함께 만든 적이 있었는데, 그 이름이 ‘인클루드’였습니다. 이후 다시 모여서 만든 이 회사는 에러 없이 잘 끝내자, 성공적으로 잘 해보자는 기원을 담아 ‘리턴제로’로 정했습니다. 그런데 투자자분들이, ‘투자를 했는데 그 투자금이 0(제로)이 돼라는 거냐’면서 싫어하시더라고요(웃음).
―대표적인 서비스가 눈으로 보는 AI전화 ‘비토’인데, 아이디어를 처음 떠올리게 된 계기는 뭔가요. 저는 스마트폰이 나오기 전, PDA폰을 사용했었는데요. 당시 PDA폰에 전화 통화 녹음기능이 있었습니다. 유용하겠는데 싶어서 통화들을 녹음하기 시작했는데, 결국 이걸 다시 듣는 일이 없더라고요. 그러다 스마트폰 시대 되면서 아이폰을 사용하다가, AI가 사람들에게 직접 기여하는 서비스는 뭘지 고민하다가 PDA폰을 사용했던 기억이 떠올랐습니다. 주변을 둘러보니 사람들의 이용 방식이, 통화 녹음을 하는데 쌓아두기만하고 다시 듣지 않는 게 과거의 저랑 완전히 똑같더라고요. 결국 통화 녹음은 죽어있는 데이터로 전락하고요. AI를 활용한 간단한 앱서비스를 통해 이 문제를 해결해줄 수 있지 않을까 싶어서 서비스를 만들게 됐습니다.
특히 텍스트로 변환한 통화 음성을 메신저의 말풍선 형태로 보여주고 있는데요. 이 말풍선을 클릭하면 부분 재생도 가능합니다. 비토 이용자들이 가장 많이 사용하는 기능이기도 한데요. 처음 비토를 출시했을 때는 해당 기능이 없었습니다. 하지만 (문자로 변환된 것이) 부정확할 수도 있고 어조를 듣고 파악해야할 때도 있잖아요. 해당 기능을 넣으면 좀 더 편하게 이용할 수 있을 것 같다는 생각에 서비스 출시 한 달 뒤에 추가했더니 그 기능을 메인 기능으로 쓰고 계시더라고요.
―그런데 시장이 작은 것 아닌가요. 주요 고객층으로 기업, 기자, 변호사, 보험설계사, 배달직군을 꼽으셨던데요. 큰 시장이 아닌 것은 맞습니다. 다만 국내에서 업무전화를 활발히 사용하는 사람이 300만 명에서 500만 명 정도로 추산되고 있고요. 업무를 실제로 돕는 서비스, 뾰족하고 유용한 서비스를 만들자는 취지에서 출시했습니다.
―리턴제로의 경쟁력은 뭔가요. 한국어 음성 데이터로는 가장 많은 데이터를 보유하고 있고요. 그렇다보니 한국어 통화에서는 압도적으로 음성인식을 잘하고 있습니다. 또 최근 AI 모델들이 GPU를 사용하면서 비싼 서버 가격을 감당해야 하는 반면 저희는 엔진을 경량화하면서도 정확히 전달하는 기술을 개발했습니다.
―실용주의 스타트업을 지향한다고 하던데. 어떤 의미죠? 저처럼 공대 출신들이 빠지는 함정이기도 한데요, 새로운 기술이 나오면 얼마나 대단한 진보인지에 눈길이 먼저 가게 됩니다. 그런데 기술이 가치를 발휘하기 위해서는 얼마나 대단한 진보이냐보다는, 사람들에게 정말 필요하고 편리하고 문제를 해결해줄 수 있는 것을 만들어야 하는데요. 그런 의미에서 사람들이 실제로 필요로 하는게 뭔지 제품으로 끝까지 만들어내자는 취지를 담아서 실용주의 스타트업이라고 표현했습니다.
―그렇게 ‘실용주의 스타트업’을 내걸 때는 과거의 얻은 어떤 교훈이 영향을 줬을 것 같은데요. 2011년 즈음 ‘로티플’이라는 위치 기반의 모바일 소셜 커머스 스타트업을 창업했어요. 현재 리턴제로의 멤버인 정주영 CTO와 이현종 개발팀장도 로티플의 공동창업자였는데요. 당시에는 지금처럼 ○○페이가 있었던 것도 아니고, 컴퓨터에 액티브X를 설치하고 구매하던 시절이라 서비스가 현실에서 너무 앞서나간 측면이 컸습니다. 결국 잘 안됐죠.
피벗(pivot·방향전환)을 해야하던 시점에 카카오로부터 인수제안을 받게 되면서 카카오로 입사하게 됐습니다. 당시 카카오는 직원 100명 수준의 회사였고, 저희가 카카오에서 인수한 첫 회사였습니다. 그런데 당시 인수도 서비스가 아닌 인재 인수에 훨씬 더 가까웠어요. 모바일 앱을 만들어본 개발자가 굉장히 적었던 시절이었는데, 그런 개발자가 로티플에는 10여 명이 모여있었거든요. 이후 카카오가 다음과 합병하고 상장한 뒤인 2016년정도까지 카카오에서 근무했습니다.
―많은 청년들이 입사를 갈망하는 카카오에서는 왜 퇴사하신건가요. 카카오를 제일 즐겁게 다녔을 때가 2012년즈음으로, 직원 수가 200명 정도로 성장할 때였던걸로 기억해요. 그런데 회사가 점점 성장해서 직원 수가 1000명을 넘어가니 모르는 얼굴이 많아졌고, 좀 다른 방식으로 일하고싶다는 생각이 들더군요. 그래서 좀 쉬면서 1년 2개월간 발길 닿는 대로 세계여행을 다니며 창업의 기회를 모색했어요.
큰 회사가 탄생할 때는 사람들의 역량도 작용하지만 시대흐름도 큰 영향을 미친다고 생각하거든요. 크게 한번 바뀌는 시대의 파도에 잘 올라탄 회사 중에 좋은 플레이를 하는 회사가 아주 큰 기업으로 성장할 기회를 얻게 되고요. 반대로 말하면 그런 기회가 없을 때 창업하는건 쉽지 않고 더 지루한 일이 될수있다고 생각했어요.
그러다 2016년 알파고가 세상에 나온 것을 보면서 AI가 재밌어보여서 공부하기 시작했습니다. 이제 이 기술이 세상을 몇 년 안에 바꾸겠다는 확신이 들었을 때 창업했고요. (리턴제로는 2018년 3월에 설립됐다.)
―그런데 비토만으로는 리턴제로의 AI 기술이 다소 단순해보이기도 합니다. 비토가 B2C 서비스라면, 지난해 말부터는 B2B 서비스에도 집중하고 있는데요. 기업 전용 회의 기록 서비스 ‘콜라보’의 경우 화상회의를 아카이빙하고 보기 좋은 형태로 회의록을 만들어줍니다.
특히 세일즈콜에서 활용될 경우 발화 내용을 분석해 인사이트를 제시하기도 하는데요. 예컨대 ‘좋은 세일즈는 고객의 발화비율의 몇%인데, 이번 세일즈에서는 다른 사람이 너무 많이 말했다’라거나, ‘가격정책에 대해 논의하는 시간은 전체 회의의 3분의 2 수준이 좋은데 너무 일찍 끝내버렸다’ 등의 분석을 해줍니다.
―초거대언어모델(LLM)이 빠르게 발전하는 상황에서 리턴제로의 계획은 뭔가요. 그동안 주력해왔던 음성인식은 로컬 사업에 가까운 측면이 있었는데요. LLM이 발전하면서 이제는 잘 받아적는 것을 넘어 내용을 잘 이해하고, 지식 베이스를 포함해 어떤 의미를 갖는지 넓게 파악하는 능력이 강화되고 있습니다. 앞으로는 음성을 넘어 업무를 더 넓게 파악할 수 있는 AI를 만드려고 합니다.
댓글 0