이탈리아는 왜 챗GPT를 차단했을까[씨즈더퓨처]

동아일보
입력 2023년 4월 17일 13시 40분

코멘트: 개

좋아요: 개

스페인이 챗GPT에 대한 조사에 착수했다. 4월 13일, 스페인 데이터 보호국(AEPD)이 “챗GPT 소유주인 미국 회사 오픈AI의 규정 위반 가능성에 대해 사전 조사를 시작했다”고 발표한 것이다.

이탈리아가 챗GPT를 차단한 뒤, 이탈리아 사용자에게 뜨는 화면. 씨즈 유튜브 캡처

개인정보 보호당국이 챗GPT를 조사하는 건 처음이 아니다. 3월 31일, 이탈리아의 데이터 보호청(GPDP)이 오픈AI에 대한 조사 착수를 알리며 서양 국가 최초로 챗GPT에 대한 접속을 차단해 주목을 끌었다. 이후 캐나다와 프랑스의 개인정보 보호당국도 각각 4월 4일과 5일에 불편 사항을 접수해 챗GPT에 대한 조사를 시작했다고 알렸다.

우리나라 역시 챗GPT를 주시하고 있다. 이정은 개인정보보호위원회 조사1과장은 씨즈와의 통화에서 “본격적인 조사를 시작한 건 아니지만, 개인정보 보호 관련 체계가 잘 갖춰져 있는지 규약 등을 확인하고 있다”고 말했다.

이처럼 세계 각국의 개인정보 보호당국이 챗GPT를 주시하는 건 개인정보 침해 위험 때문이다. 챗GPT는 매우 많은 양의 글을 모두 암기해 새로운 글을 생성해내는 인공지능 챗봇인데, 암기시킨 학습데이터에 개인정보가 섞일 수 있어서다.

임준호 ETRI 언어지능연구실 책임연구원이 챗GPT의 개인정보침해 위험을 설명하고 있다. 씨즈 유튜브 캡처

오픈AI가 2020년 발간한 보고서에 따르면, 챗GPT의 기반이 된 알고리즘 모델인 GPT-3는 학습데이터의 약 60%가 온라인에서 긁어모은 ‘크롤링 데이터’다. 임준호 ETRI 언어지능연구실 책임연구원은 “온라인에서 데이터를 수집하면 개인정보들이 섞여 들어간다”며, “그것들을 다 걸러내는 것은 기술적으로 불가능”이라고 말했다.

이처럼 개인정보를 허락 없이 활용하는 건 개인정보보호법 위반이 될 수 있다. 이탈리아가 주요하게 확인하겠다고 나선 것도 챗GPT에 활용된 학습데이터가 유럽 일반개인정보보호법(GDPR)을 위반했는지 여부이다.

그러나 챗GPT와 같은 인공지능을 만들 때 학습데이터에 있는 모두에게 개인정보 사용 허락을 받긴 어렵다. 데이터에 있을 수천, 수백만 명에게 일일이 연락하는 건 불가능에 가깝기 때문이다. 그렇다면 챗GPT와 같은 인공지능을 차단할 수밖에 없을까. 다른 선택지는 없는지 씨즈가 알아봤다. 영상에서 자세한 내용을 확인할 수 있다.