인공지능(AI) 챗봇 ‘이루다’ 개발사 스캐터랩이 계속되는 논란에 사과문을 발표했다. 또한 현재 ‘연애의 과학’ 데이터의 개인정보처리와 관련해 개인정보보호위원회 및 한국인터넷진흥원(KISA)에서 진행하는 조사에 성실히 참여하겠다고 밝혔다.
13일 밤 스캐터랩은 “현재 논란이 되는 모든 사항에 대해서 진상조사위원회를 구성해 사내에서도 철저히 조사하는 한편, 외부 전문가를 포함한 상시개인정보보호체계를 구축하고 재발 방지를 위한 강화된 보안 교육을 실시하는 등 자체적인 노력도 게을리 하지 않겠다”라고 말했다.
이어 “이번 사안에 대하여 깊은 책임감을 느끼고 있으며, 이 자리를 빌려 그동안 저희의 서비스를 이용해 주신 모든 이용자 여러분들께 진심으로 사과드린다”라며 “사용자 분들의 마음에 흡족해하실 때까지 뼈를 깎는 노력을 통해 해당 사항들을 보완할 수 있도록 최선의 노력을 다하겠다”라고 덧붙였다.
이날 스캐터랩은 이루다 관련 개발 기록을 오픈소스 공유 플랫폼 ‘깃허브’에 공유할 때 일부 정보에 비식별화 조치가 제대로 이뤄지지 않았다는 논란에 대해 인정했다.
스캐터랩은 “2019년 ‘깃허브’에 오픈 소스로 공개한 인공지능 한국어 자연어처리(NLP) 연구모델에서 내부 테스트 샘플(100건)이 포함된 사실을 확인했다”라며 “대화 중 실명과 숫자는 각각 <NAME>과 <NUM>으로 자동화 비식별 처리하였으나 기계적인 필터링 과정에서 미처 걸러지지 못한 부분이 일부 존재하였음을 확인하게 됐다”라고 설명했다.
이어 “한국어 자연어처리(NLP)와 관련된 기술 개발 및 공유를 위한 것이었으나, 데이터 관리에 더 신중하지 못했고, 일부 민감할 수 있는 정보가 포함된 대화 패턴이 노출된 점에 대해서 진심으로 사과드린다”라고 덧붙였다.
하지만 “이루다의 DB는 개별적이고 독립적인 문장DB로 관리되고 있어 기사에서 인용되는 바와 같이 대화 패턴으로 존재하지 않는다. 이에 이루다DB를 통해 사람들의 관계나 생활 반경 등이 추정될 여지는 없다”라고 전했다.
조사위원회에 따르면 과거부터 현재까지 지속되고 있는 스캐터랩 전 팀원이 참여하고 있는 카카오톡의 대화의 조사가 완료 단계에 있으며, 당해 연도 카카오 단체대화방에서는 해당 내용이 없다는 것이 확인됐다. 또 다른 사내 메신저 채널인 슬랙에 대해서는 다수의 대화 채널이 있는 관계로, 현재 계속해서 조사를 진행 중인 상태다.
한편, ‘이루다’는 AI 전문 스타트업 스캐터랩이 2020년 12월 23일 출시한 AI챗봇으로 최근 성희롱을 비롯해 장애인·성소수자·인종 혐오 관련한 대화 내용이 공개되며 논란이 됐다. 또한 ‘이루다’를 둘러싼 개인정보 유출 논란이 도마에 올랐다.
조유경 동아닷컴 기자 polaris27@donga.com