개인정보 유출과 혐오 발언 학습으로 서비스가 중단된 인공지능(AI) 챗봇 ‘이루다’의 개발사 스캐터랩이 2019년 개발자들의 오픈소스 공유플랫폼 ‘깃허브’에 실명 등 개인정보가 포함된 샘플을 올린 사실을 인정했다. 이 과정에서 비실명화 처리를 제대로 하지 않은 대화 샘플 100건(문장 약 1700개)도 공유된 것으로 알려졌다. 깃 허브는 전 세계 소프트웨어 프로그래머들이 코딩에 필요한 소스를 공유하는 서비스다.
스캐터랩은 14일 개인정보 유출 논란에 대해 사과문을 발표하면서 이 같이 밝혔다. 스캐터랩은 “개인정보 처리와 관련해 정부 기관의 조사를 받고 있다. 데이터 관리에 신중하지 못했다”고 덧붙였다.
스캐터랩이 자사의 다른 서비스인 ‘연예의 과학’ 가입자들에게 개인정보 이용 동의를 받을 때 필수, 선택 항목 구분 없이 포괄 동의를 받았다는 비판도 제기되고 있다. 이용자들이 제공한 카카오톡 대화가 이루다 개발에 쓰인다는 사실을 충분히 고지하지 않았다는 의혹도 받고 있다.
이건혁 기자 gun@donga.com