뉴스 트렌드 생활정보 International edition 매체

카카오도 AI-이용자 대화 자회사 통해 녹취…“0.2% 무작위 추출”

입력 | 2019-09-04 06:46:00

카카오의 인공지능(AI) 스피커 ‘카카오 미니 C’© News1


네이버가 자사 인공지능(AI) 서비스 ‘클로바’와 이용자가 나눈 대화 내용을 녹취하는 것으로 알려진 가운데 카카오도 ‘카카오 미니’ 등 AI 스피커와 이용자가 대화한 내용을 자회사를 통해 일부 녹취하고 있는 것으로 확인됐다. 다만 카카오 측은 해당 음성 데이터에서 개인을 특정할 수 있는 정보를 모두 제거했고 음성 자체도 변조해 개인정보 유출이나 사생활 침해 우려는 없다고 설명했다. 네이버도 약관에 녹음 사실을 명시하는 등 적법한 절차를 준수한다고 강조했다.

4일 카카오에 따르면 이 회사의 AI 스피커 ‘카카오 미니’는 음성인식 개선 등 서비스 품질 향상을 위해 음성명령 데이터를 수집하고 있다.

카카오가 수집하는 음성정보는 ‘헤이 카카오’ 등 호출명령 이후에 입력되는 음성정보로, 동작을 하지 않는 ‘대기모드’에선 데이터를 수집하지 않는다.

카카오는 수집한 음성 데이터 중 0.2% 미만의 데이터를 무작위로 추출한 뒤, 자회사 ‘링키지랩’을 통해 사람이 직접 듣고 글로 옮기는 ‘전사 작업’을 실시한다. 이 결과물을 기반으로 AI를 학습시키고 음성인식 성능을 높인다.

카카오 관계자는 “자회사로 가기 전 음성 데이터에서 개인정보에 해당되는 내용은 자동으로 가려지도록 처리된다”며 “전사 작업에 사용되는 음성 또한 변조 등의 조치를 통해 철저히 비식별처리 하고 있다”고 설명했다.

카카오는 AI 스피커를 사용하기 전 개인정보 수집 및 이용에 대한 동의를 받을 때 음성정보 수집과 활용을 서비스 이용을 위한 필수 사항으로 명기하고 있다. 수집한 음성 데이터는 개인정보와 음성정보를 분리해 보관하고 있으며, 이용자가 서비스를 탈퇴하면 즉각 파기한다.

카카오 관계자는 “사생활 침해에 대한 이용자들의 우려를 인지하고 있다”며 “향후 이용자가 음성명령어 저장 허용 여부를 직접 선택할 수 있는 추가기능을 도입할 예정”이라고 말했다.

네이버도 이와 유사하게 AI 서비스 ‘클로바’와 이용자가 나눈 대화 내용 중 1% 미만에 한해 자회사를 통한 전사 작업을 하고 있다. 네이버 측은 음성 데이터를 전부 비식별 처리하고 있으며, 데이터 활용에 대한 내용을 약관에 모두 명시했다고 설명했다.

AI 서비스 이용자들의 음성 데이터 녹취 문제는 애플, 페이스북 등 해외 거대 IT 기업들의 무단 녹취 사실이 연이어 폭로되면서 불거졌다.

최근 애플은 자사 AI 비서 ‘시리’가 이용자와 나눈 대화를 이용자 동의 없이 협력사 직원에게 제공해 성능 개선에 활용한 사실이 언론을 통해 폭로되자 공식 사과 한 바 있다.

또 페이스북은 이용자들의 음성 녹취를 서버에 저장한 후 수백명의 외부 직원을 고용해 녹음 내용을 글로 옮겨 보관했으며, 아마존은 수천명의 외부 직원을 동원해 AI 스피커 알렉사‘를 사용하는 이들의 음성 명령을 녹음한 사실이 드러났다.

국내 업체들은 약관과 개인정보 수집 동의서 등을 통해 음성 데이터 수집·활용에 대한 동의를 받았고, 해외 업체들의 사례에서 문제가 됐던 대기모드에서의 녹음은 없었다고 강조하고 있다. 다만 음성 명령어 저장 허용 여부를 직접 결정하는 ’옵트아웃‘ 기능은 해외 업체들은 이미 대부분 도입한 반면, 국내 업체 중엔 아직 채택한 곳이 없다.

업계 관계자는 “음성 정보를 글로 옮기는 작업은 AI를 학습시켜 음성인식 성능을 개선하기 위해 반드시 필요한 과정”이라며 “이번 일을 계기로 국내 업체들의 옵트아웃 기능 도입 시기가 앞당겨질 것으로 보인다”고 말했다.

(서울=뉴스1)