국내 AI 합성데이터 스타트업 ‘씨앤에이아이(CN.AI)’ 이원섭 대표
깊은 밤, 당신은 지방 국도를 운전하고 있다. 갑자기 천둥 번개를 동반한 폭우가 쏟아지더니 야생 고라니가 도로로 뛰어든다. 이토록 운전하기에 위험천만한 상황은 현실에서 다양한 형태로 벌어질 수 있다. 폭우가 폭설이 될 수도, 고라니가 토끼가 될 수도 있다.
테슬라, 엔비디아, 메타 등 글로벌 빅테크들은 인공지능(AI)을 요즘 새로운 방법으로 학습시키고 있다. 실제 이미지를 얻으려면 시간과 비용이 많이 들지만 고라니를 토끼로 바꿔 넣는 식의 합성 데이터를 만들면 무궁무진한 ‘경우의 수’를 통해 미래를 대비할 수 있기 때문이다. MIT 테크놀로지 리뷰는 미래를 이끌 ‘2022년 10대 기술’ 중 하나로 AI를 위한 합성 데이터를 꼽았다. 국내에서는 2019년 설립된 AI 합성데이터 스타트업 ‘씨앤에이아이(CN.AI)’가 이 시장에 도전하고 있다. 이 회사 이원섭 대표(36)를 서울 서초구 사옥에서 만났다.
서울 서초구 씨앤에이아이 사옥에서 만난 이원섭 대표가 회사 로고 앞에서 환하게 웃고 있다. 안철민 기자 acm08@donga.com
―어떻게 AI 시장에 눈을 떴나.
“미국 인디애나대 경제학과 졸업을 앞두고 있던 2013년, 당시 삼성전자의 SCSA(삼성 컨버전스 소프트웨어 아카데미) 채용 소식을 접했다. 인문계 졸업생을 뽑아 융합형 소프트웨어 엔지니어로 키우는 제도였다. 대학 동창들은 주로 금융이나 컨설팅 분야로 진출했지만 ‘기술을 잘 아는 인문계 출신’이 되면 나만의 미래를 만들 수 있을 것 같아 도전했다. 삼성전자 메모리사업부 소프트웨어 개발자로 일하며 AI를 접했다.”
“삼성전자의 사내외 벤처육성 프로그램인 C랩에서 AI 관련 과제를 수행하다가 ‘AI로 내 사업을 하면 승산이 있겠다’는 확신이 들어 회사를 나와 창업했다. 원본 이미지와 영상에서 사람이나 사물을 지운 뒤 배경을 채워 복원하는 ‘이미지 인페인팅’이란 기술을 개발했다.”
―그런 합성 데이터 기술을 개발한 계기는.
“고객 회사의 AI 업무를 하다보니 필요한 데이터는 없거나 너무 적었다. AI의 성능은 ‘좋은’ 데이터를 ‘많이’ 확보하는 게 관건인데 쟁쟁한 대기업들조차 데이터를 다 사 모으려면 ROI(투자자본수익률)가 안 나온다. 개인정보 보호 이슈가 커져 돈을 붓는다 해도 데이터를 구하기 어렵다. 합성 데이터는 기존의 판도를 뒤엎고 AI 시장을 활성화시키는 ‘게임 체인저’가 될 것이다.”
시장조사회사 가트너에 따르면 고품질 AI 모델이 합성 데이터를 사용하지 않고는 불가능하기 때문에 2026년이 되면 합성 데이터 활용이 실제 데이터를 추월할 것으로 예측한다. 2030년까지 AI 학습 데이터 세트 시장이 86억 달러(약 12조 원) 이상에 달한다는 전망(그랜드뷰 리서치)도 있다.
―합성 데이터는 어디에 쓰이나.
“의료, 금융, 제조 등 다양한 분야에서 활용되고 있다. 예를 들어 위암을 진단하는 AI 엔진이 약 95%의 정확도를 보이려면 수십 만 개의 위암 환자 내시경 이미지가 필요하다. 그런데 5000장의 실제 이미지에 수 만 장의 합성 데이터를 추가해 AI를 훈련시키기만 해도 의료시장에서 기대하는 상용화 수준(정확도 90%)에 근접한 89%의 정확도가 나온다.”
씨앤에이아이의 합성 데이터 기술로 원본 사진에서 사람 이미지를 없앤 복원 이미지. 씨앤에이아이 제공
“지난해 나이지리아의 데이터 사이언스 연구팀은 아프리카 옷에 대한 데이터가 서양에 비해 절대적으로 부족한 사실에 주목해 가상의 아프리카 옷 이미지들을 AI로 만들어냈다. 합성 데이터는 현실의 데이터 불균형과 편견을 해결해주는 미래지향적 기술이다.”
―CN.AI의 차별적 경쟁력은.
“어려운 문제에 도전하는 수준 높은 인재들이다. 미국 스탠퍼드대 박사를 비롯해 46명의 직원 중 절반 이상이 서울대와 KAIST를 나와 미국 아마존과 삼성전자 등에서 일했다. 최근엔 개발자들의 요청에 따라 사옥 1층에 피아노를 두고 원하는 때에 칠 수 있도록 했다. 최고의 인재가 행복하게 일해야 AI가 상용화하는 미래를 꿈꿀 수 있다.”
―꿈꾸는 미래를 위해 어떤 준비를 하고 있나.
“이스라엘의 관련 기업들이 규모를 키우면서 시장의 영향력을 키우고 있다. 지금이 우리가 앞선 나라들을 따라잡을 수 있는 골든타임이다. 경쟁력 있는 K콘텐츠가 글로벌 미디어 시장에 선보일 때 합성 데이터와 만나면 파괴적인 힘을 낼 수 있다. 그걸 준비하고 있다.”
김선미기자 kimsunmi@donga.com