5대 언론단체 “AI 학습데이터 공개 의무화해야”

동아일보
입력 2024년 12월 16일 18시 52분

김기윤 기자

코멘트: 개

좋아요: 개

한국신문협회 등 5개 언론단체는 인공지능(AI) 사업자가 학습 데이터를 의무적으로 공개하도록 법제화해야 한다는 의견을 국회와 정부에 16일 전달했다.

신문협회와 한국신문방송편집인협회, 한국기자협회, 한국온라인신문협회, 한국인터넷신문협회는 이 같은 내용이 담긴 의견서를 국회 과학기술정보방송통신위원회와 법제사법위원회, 문화체육관광부에 제출했다. 이들 단체는 현재 국회에서 논의 중인 ‘인공지능 발전과 신뢰 기반 조성 등에 관한 기본법(AI 기본법)’ 제정안에 “생성형 AI 사업자가 AI 제품 및 서비스 개발을 위해 사용한 학습용 자료에 관한 기록을 수집·보관하고 공개하도록 하는 규정이 빠져 있다”고 지적했다. 학습 데이터 공개를 의무화하지 않는 것은 생성형 AI 사업자의 데이터 무단 이용을 허용해 저작권자의 권리를 심각하게 침해할 수 있다는 것. 다만, “해당 법안이 AI 사업자가 지켜야 할 투명성, 안전성, 의무사항과 딥페이크 범죄 예방을 위한 AI 생성물 워터마크 의무화를 규정한 것은 적절하다”고 덧붙였다.

이들 언론단체는 학습 데이터의 출처가 공개되지 않을 경우 저작권자가 자신의 저작물이 어디에, 어떻게 사용됐는지 알권리를 잃게 될 뿐만 아니라, 정당한 대가 요구도 어려워진다고 강조했다. 언론단체들은 “생성형 AI 사업자 입장에서도 본인들의 기술에 대한 신뢰도를 높이려면 학습 데이터와 학습 방식 등을 투명하게 공개하는 것이 바람직하다”고 밝혔다.

이에 따라 AI 기본법 제31조에 △AI 사업자는 생성형 인공지능 제품 및 서비스 개발을 위해 사용한 학습용 자료에 관한 기록을 수집·보관 및 공개 △AI 사업자는 저작권자가 학습용 자료에 대해 열람을 요청할 경우 관련 자료 제공 등의 조항을 추가할 것을 요구했다.

언론단체들에 따르면 국내외 생성형 AI 개발에 학술 자료와 함께 언론 보도가 주된 학습 데이터로 활용된 것으로 나타났다. 예를 들어 최근 AI 검색엔 언론 보도를 인용한 데이터가 포함돼 있다.

주요국들에선 관련 입법이 이미 이뤄진 상태다. 미국에선 올 4월 하원에서 발의된 ‘학습 데이터 공개 법안’에 의해 AI 사업자가 학습 데이터 요약본을 저작권청에 제출하도록 돼 있다. 유럽연합(EU)도 AI 사업자가 학습 데이터 내용을 공개하도록 한 ‘AI 법’을 올 3월 제정했다.

#한국신문협회 #5개 언론 단체 #한국신문방송편집인협회 #한국기자협회 #한국온라인신문협회 #한국인터넷신문협회 #AI 법안 #학습 데이터 #저작권 #생성형 AI #딥페이크

김기윤 기자 pep@donga.com