글로벌 AI 경쟁, 저작권 문제 해결이 늦어서는 안 된다[동아시론/이상직]

동아일보
입력 2023년 9월 22일 23시 39분

코멘트: 개

좋아요: 개

뉴스 등 우량 데이터 많으면, AI 고도 창작 가능
개인정보, 저작권 가져다 쓴다면 보답 필요해
개발자-저작권자, 활용 및 보상 논의 적극 임해야

식당을 운영하는 사람이 식재료를 구입하면 대가를 내야 한다. 제지회사가 원료가 되는 목재, 펄프를 구입하는 경우도 마찬가지다. 지식 콘텐츠로 가보자. 온라인에 공개된 뉴스 기사는 어떤가. 사상과 감정을 표현한 저작물이다. 누구든 자기가 쓴 것처럼 표절하면 저작권 침해다. 인공지능(AI)은 뉴스 기사를 비롯한 데이터를 대량 학습해 이전에 없던 창작물을 내놓는다.

올해 초 이미지 플랫폼업체 게티이미지사는 AI 이미지생성 업체 스태빌리티AI사에 소송을 제기했다. 이미지 수백만 장을 무단 복제, 전송하여 AI 학습에 이용함으로써 저작권을 침해했다고 한다. 세라 실버먼 등 유명 작가들도 오픈AI사의 챗GPT가 허락 없이 AI 학습에 저작물을 이용했다며 소송을 제기했다. 국내외 언론사는 뉴스 기사를 AI 학습용으로 이용할 수 없게 차단하거나 합리적인 대가 지급을 요구하고 있다.

AI의 저작물 학습이 저작권법에 의한 ‘공정한 이용(fair use)’에 해당하면 적법하다. 저작자 보호와 저작물 이용의 균형을 중시한다. 요건을 보자. 저작물의 일반적인 이용 방법과 충돌하지 않아야 한다. 저작자의 정당한 이익을 해치지 않아야 한다. 구체적인 고려 요소는 뭘까. 저작물 이용 행위가 비평, 논평, 시사, 보도, 교육, 연구 또는 조사 목적인지 본다. 저작물의 성격, 종류와 용도를 본다. 이용하는 부분이 저작물 전체에서 차지하는 비중과 중요성도 본다. 저작물 이용이 현재 또는 잠재적인 시장에 미치는 영향까지 꼼꼼히 확인한다.

AI의 저작물 학습은 공정한 이용의 요건을 충족할까. AI 개발사의 주장은 이렇다. AI 성과를 위해선 대량 데이터의 학습이 중요하다. 전체 데이터의 결합, 연계 분석이 중요하므로 뉴스 기사 등 개별 데이터의 영향력은 낮다. 저작물 중 단어, 패턴, 아이디어 등을 이용하는 것에 그친다. 표절처럼 저작물을 그대로 베낀 작품을 만들지 않는다. 대량 데이터 수집 과정에서 일일이 개별 동의를 받는 것은 어렵다. 수집만 되었을 뿐 AI 창작을 위한 이용에서 제외된 데이터도 있다. 국가경제에 기여하는 산업연구의 일환으로 데이터를 학습했다. AI의 저작물 학습은 성장이 멈추거나 더딘 경제에 활력을 준다. 공정한 이용으로 평가받아야 한다. 이런 것들은 AI 개발사들의 주요 입장이다.

물론이다. 데이터, AI산업과 성장을 위해선 대량의 데이터 수집, 분석 및 활용이 필수적이다. 그러나 데이터 중 저작물은 저작권법의 보호를 받는다. 무단으로 학습하면 저작자의 복제, 전송권을 침해한다. 저작물을 가져와 실질적으로 비슷한 창작을 하면 2차적 저작물 작성권을 침해한다. 창작시장을 AI가 주도하면 저작자의 창작 기회와 경제적 이익이 줄어든다. 저작권법에 따른 공정한 이용이라고 마냥 단정하기 어렵다.

그래서인지 정부는 저작권법 개정을 추진하고 있다. AI에 의한 대량 데이터 처리에서 생기는 저작물 복제, 전송의 법적 허용 근거를 마련하고 있다. 그러나 저작권자 등의 반대로 표류하고 있다. 이들의 주장은 이렇다. 저작권자가 창작물을 공개하면서 제3자의 무단 복제, 전송 등 이용을 금지하는 뜻을 밝혀둘 수 있다. 사전 협의를 요구하거나 출처 표시를 요구할 수 있다. 물론 아무런 표시가 없어도 저작물을 함부로 이용할 수 없다. 위반하면 저작권 침해다.

어떻게 해야 할까. AI는 우리가 육성해야 할 산업이다. 퇴로가 없다. AI를 위한 데이터 학습이 원활해야 한다. 뉴스 기사 등 우량 데이터가 많을수록 고도의 창작물을 만들 수 있다. AI는 공동체의 협력과 합의가 필요하고, 서로 양보도 필요하다. 연구개발, 실험단계라면 더욱 그렇다.

AI는 상용서비스가 출시된 이후에도 고객의 피드백과 다양한 이용 활동을 통해 고도화한다. 학습데이터에 포함된 개인정보, 초상권, 저작물 등 공동체의 가치와 자산을 끌어와 쓴다면 보답이 필요하다. 개별 보상에 나설 수도 있겠지만 성질상 어렵다면 집단 보상, 기금 조성 및 지원 등 다양한 방법을 고민해 보자.

AI 산업은 이제 시작이다. 개발자와 저작권자가 학습데이터 생산, 활용, 가치 평가 및 대가 논의에 적극 임해야 한다. 국내 AI업체에만 혜택을 주도록 대가를 정할 수 없고, 반대로 저작권자도 지나친 대가를 요구해선 안 된다. 저작물 등 학습데이터의 가치를 끊임없이 높여야 AI 창작의 수준도 높아진다. 글로벌 경쟁을 하는 AI 시장에서 시기를 놓치면 낙오한다. 수준 높은 학습데이터 발굴에 대한민국의 미래가 있다.