개인정보유출·성희롱 논란에…‘이루다’ 개발사 “DB 폐기”

개인정보 유출과 혐오 발언 학습으로 서비스가 중단된 인공지능(AI) 챗봇 ‘이루다’의 개발사 스캐터랩이 결국 ‘이루다’의 데이터베이스(DB)와 학습에 사용된 딥러닝 대화 모델을 폐기하기로 했다.

스캐터랩은 15일 보도자료를 통해 “자사는 현재 개인정보보호위원회와 한국인터넷진흥원(KISA)의 조사를 받고 있으며 조사가 종료되는 즉시 이루다 DB와 딥러닝 대화 모델의 폐기를 진행할 방침”이라고 밝혔다.

이어 “이루다 DB는 비식별화(익명화) 절차를 거쳐 개별적이고 독립적인 문장 단위로 이뤄져 개인 식별이 가능한 데이터는 포함돼 있지 않다. 또 딥러닝 대화 모델은 비식별화 절차를 거친 데이터를 토대로 대화 패턴만을 학습하고 AI는 데이터를 벡터값으로 기억하기 때문에 개인정보가 유출될 위험이 전혀 없다”면서도 “이용자들의 불안감을 고려해 이번 폐기를 결정했다”고 설명했다.

또 스캐터랩은 “기존 ‘연애의 과학’과 ‘텍스트앳’에서 이용자의 동의를 받고 수집됐던 기존 데이터는 데이터 활용을 원하지 않는 이용자로부터 신청을 받은 후 해당 이용자의 데이터를 모두 삭제할 예정이며 이는 향후 딥러닝 대화 모델에도 이용되지 않는다”고 말했다.

그러면서 “관련 후속 조치는 각 애플리케이션(앱) 공지를 통해 안내받을 수 있으며 향후 신규 가입 및 서비스 이용시에는 개인정보 수집과 이용 동의 절차를 강화할 계획”이라고 덧붙였다.

이루다는 스캐터랩의 또 다른 서비스 ‘연애의 과학’에서 수집된 카카오톡 대화 내용을 제대로 된 고지 없이 수집·활용했다는 의혹을 받았다. 또 ‘연애의 과학’ 가입자들에게 개인정보 이용 동의를 받을 때 필수, 선택 항목 구분 없이 포괄 동의를 받았다는 비판도 있다.

이와 관련해 스캐터랩은 2019년 개발자드르이 오픈소스 공유플랫폼 ‘깃허브’에 실명 등 개인정보가 포함된 샘플을 올린 사실을 인정했다. 이 과정에서 비실명화 처리를 제대로 하지 않은 대화 샘플 100건(문장 약 1700개)도 공유한 것으로 알려졌다.

최근 성희롱 및 장애인·성소수자·인종 혐오 관련 대화 내용까지 공개돼 논란에 휩싸인 이루다는 출시 3주 만인 지난 12일 서비스를 잠정 중단했다.

윤우열 동아닷컴 기자 cloudancer@donga.com