“AI 학습 위한 데이터 수집-저장 땐
저작권 침해에 해당 않도록 법 개정”
상업적 활용 등 제한 안둬 논란 예상
WSJ-CNN, AI 개발사 소송 검토
《AI 학습용 저작권 침해 ‘면책’ 논란
생성형 인공지능(AI) 챗GPT 열풍과 함께 AI 학습용 데이터를 둘러싼 저작권 문제가 새로운 쟁점으로 떠오르고 있다. 해외에서 AI 개발사를 상대로 한 저작권 침해 소송이 잇따르고 있는 가운데 정부는 21일 AI 학습을 위해서라면 타인의 저작물을 활용하더라도 저작권 침해로 보지 않는 면책 기준을 마련하겠다고 밝혔다. AI 산업을 발전시키겠다는 취지지만 허용 범위가 모호한 데다 사회적 논의도 무르익지 않은 상황이라 논란이 예상된다.》
정부가 인공지능(AI) 학습을 위해서라면 타인의 저작물을 활용하더라도 저작권 침해로 보지 않는 면책 기준을 마련하기로 했다. 미국 월스트리트저널(WSJ)과 CNN방송이 생성형 AI 챗GPT 개발사를 상대로 소송을 검토하는 등 해외에선 저작권 침해 분쟁이 잇따르고 있다. 이런 상황에서 정부가 AI 학습의 저작권 침해에 면죄부를 주는 방안을 추진해 이를 둘러싼 논란이 거셀 것으로 전망된다.
● ‘크롤링’에 저작권 침해 면책
정부는 21일 추경호 부총리 겸 기획재정부 장관 주재로 비상경제장관회의 겸 수출투자대책회의를 열고 이 같은 내용의 ‘서비스산업 디지털화 전략’을 발표했다. 우선 정부는 AI 학습을 위한 ‘크롤링(crawling)’은 저작권 침해에 해당하지 않도록 저작권법을 개정하기로 했다. 크롤링은 웹사이트에서 필요한 데이터를 자동으로 수집, 분류해 데이터베이스에 저장하는 기술이다. 지금은 이 같은 행위가 저작권 침해에 해당하는지에 대한 명확한 규정이 없다.
현재 AI 학습을 위한 크롤링이 이뤄지더라도 ‘저작물에 포함된 사상이나 감정을 향유하지 않는다’는 조건에 해당하면 저작권 침해로 보지 않는 내용이 포함된 저작권법 개정안이 국회에 계류 중이다. 저작물의 구체적인 내용이 아니라 수많은 저작물을 결합해 패턴을 찾아 활용하면 저작권 침해로 보지 않겠다는 것이다.
하지만 정부가 추진하고 있는 개정안은 면책 기준이 구체적이지 않은 데다 AI 개발사들이 데이터를 상업적으로 활용하는 경우에 대한 제한이 명확하지 않아 콘텐츠 회사들의 피해로 이어질 수 있다는 지적이 나온다. 염흥열 순천향대 정보보호학과 교수는 “인터넷에 공개된 데이터라 할지라도 AI 접근을 차단할 길을 열어 놓는 등 AI 학습이 허용되는 범위에 대한 사회적 합의가 필요하다”며 “이와 함께 데이터를 활용하는 기업들의 책임 범위에 대해서도 규정할 필요가 있다”고 지적했다.
● 해외에선 AI 저작권 갈등 심화
해외에서는 AI 개발사를 상대로 한 저작권 침해 분쟁이 소송전으로까지 번지고 있다. 유명 코미디언이자 작가 세라 실버먼은 동료 작가들과 함께 챗GPT 개발사인 오픈AI와 메타가 “AI의 언어 모델 훈련을 위해 동의 없이 저작권 있는 자료를 사용했다”며 손해배상 소송을 냈다.
영국 일간 데일리메일도 최근 구글이 대화형 챗봇 AI 서비스 학습을 위해 자사 기사 수십만 건을 허가 없이 사용하고 있다며 소송을 준비하고 있다고 밝혔다. WSJ와 CNN방송은 챗GPT 개발사인 오픈AI에 관해 비슷한 내용의 소송을 검토하고 있다. 또 뉴욕타임스(NYT)를 비롯해 미국과 캐나다 2000여 언론사가 소속된 뉴스미디어연합(NMA)도 AI의 저작권 침해에 대해 집단 대응을 고심 중이다.
하루 5700만 명이 찾는 미 소셜미디어 레딧도 올 4월 자사 사이트에 있는 기사를 비롯해 대화 데이터를 빅테크 기업들이 AI 학습 과정에서 상업적으로 사용하려면 비용을 지불해야 한다고 밝혔다.
21일 미국 백악관은 오픈AI, 마이크로소프트(MS), 구글 모회사 알파벳, 메타 등 7개 생성형 AI 개발사들이 AI가 생성한 모든 콘텐츠에 워터마크를 표시하기 위한 시스템을 개발하기로 약속했다고 밝혔다. 콘텐츠에는 텍스트, 이미지, 오디오, 영상 등 모든 형태가 포함된다고 로이터통신이 전했다. 앞서 이들 업체는 올 5월 백악관에서 조 바이든 미 행정부가 요청한 ‘AI 안전 서약서’에 서명할 것으로 알려졌다.
댓글 0