시 짓고 그림 그리는 생성AI의 저작권 문제[동아광장/이성주]

  • 동아일보
  • 입력 2023년 3월 14일 03시 00분


코멘트

예술 영역의 AI 활용 빠르게 확산하면서
무작위 데이터 수집 저작권 문제 대두
AI산업 대응하는 명확한 기준 필요하다

이성주 객원논설위원·서울대 산업공학과 교수
이성주 객원논설위원·서울대 산업공학과 교수
챗GPT 열풍으로 생성AI에 대한 관심이 뜨겁다. 생성AI란 텍스트, 이미지 등의 데이터를 학습하여 기계가 새로운 콘텐츠를 ‘생성’해 주는 기술이다. 이제 인공지능 기술은 단순반복 업무나 지식 집약적 업무를 넘어 창작과 예술의 영역으로 진입하고 있다. 자율주행이나 의료 분야에서 인공지능의 활용은 잘못된 알고리즘이 가져올 결과에 대한 파급효과가 크다. 보행자를 제대로 인식하지 못해 치어 숨지게 한 2018년 우버 자율주행차의 사례에서처럼 말이다. 의료 분야에서 영상 판독을 잘못하여 병을 정확히 진단하지 못하는 경우도 마찬가지이다. 문제가 생겼을 경우 그 책임소재도 아직 명확하지 않다. 반면 창작과 예술 영역에 있어서 인공지능은 잘못된 결과의 파급효과나 책임소재에 대한 부담이 덜하다. 이에 전문가들은 창작과 예술 영역에 있어 인공지능의 활용이 빠르게 확산될 것이라 전망하고도 있다.

그러나 이 영역에서 인공지능의 활용은 인공지능이 저작물을 만드는 과정과 결과물에 있어 여러 이슈를 가져왔다. 관련 논의는 다양하지만 크게 두 가지로 요약된다. 첫째는 인공지능이 만든 결과물을 저작물로 인정할 것인가이다. 인공지능이 만든 음악, 시, 글을 어떻게 받아들인 것인지, 인공지능을 논문이나 책의 저자로 인정할 것인지 등이다. 이와 더불어 최근 활발히 논의되는 또 다른 이슈는 인공지능 모델의 학습에 이용된 데이터의 저작권 문제이다. 챗GPT를 포함하여 최근 집중적으로 연구되고 있는 초거대 AI의 학습에는 방대한 데이터가 필요하다. 챗GPT의 전신인 GPT-3의 경우 무려 45TB(테라바이트·1TB는 1024GB)의 학습 데이터를 활용했다. 데이터는 주로 웹사이트 등에서 수집 후 정제하여 학습에 활용한다. 이 과정에서 사용자가 비용을 내고 사용하는 논문이나 도서, 출처 표기가 필요하거나 허가를 받아야 하는 이미지, 공개 소프트웨어 등이 학습 데이터에 포함됨으로써 저작권 이슈가 등장하는 것이다.

생성AI 서비스와 관련된 저작권 소송은 이미 시작되고 있다. 오픈AI에서 출시한 ‘코파일럿(Copilot)’은 사용자가 원하는 소스코드의 내용을 입력하면 이를 만들어준다. 서비스를 구현하기 위해 코파일럿은 ‘깃허브’(GitHub·오픈소스 소프트웨어 저장소) 데이터를 학습에 활용하였는데, 깃허브를 활용하는 프로그래머들은 ‘오픈소스 라이선스가 위반되었고 프로그래머들의 권리가 침해되었다’는 이유로 오픈AI, 깃허브 등을 상대로 미국 법원에 집단소송을 제기하였다. ‘스테이블 디퓨전(Stable Diffusion)’은 문자를 입력하면 그림을 생성해 주는 서비스로 모델 구축 과정에서 대량의 이미지 데이터를 학습하는데 이때 저작권자의 동의 없이 인터넷에 공개된 저작물들이 수집되었다. 이에 게티이미지는 올해 1월 영국 법원에 관련 소송을 제기하였다. 이처럼 초거대 AI 모델을 활용한 상용서비스가 확대되면서 학습에 활용된 데이터의 저작권을 둘러싼 이슈는 더욱 심화될 것이다.

저작권이란 창작물을 만든 사람, 즉 저작자가 자신이 창작한 저작물에 대해 갖는 배타적 법적 권리로, 저작권법은 저작자의 권리를 보호하면서도 문화 및 관련 산업의 발전을 촉진하는 것을 목적으로 한다. 공개된 출처의 데이터 수집·활용을 인공지능 학습에 광범위하게 허락할 경우 학습 데이터의 양과 질을 높여 산업 발전이 촉진된다. 이에 일본은 인공지능 학습에 저작물을 원활하게 이용하기 위한 정책을 도입한 바 있다. 그러나 산업 발전을 이유로 창작자들의 노력과 역할이 간과되어서는 안 될 것이다. 중장기적으로 학습에 필요한 양질의 데이터를 지속적으로 만들어 내기 위해서는 창작자의 역할이 필요하다.

이러한 상황에서 생성AI가 창작자의 창작 활동을 지원하며 산업 발전에 기여하려면 생성AI를 중심으로 한 혁신적이고 효율적인 산업생태계의 구성 방안에 대한 더욱 활발한 논의가 필요하다. 오랜 논의를 거쳐 음반업계에서는 음반의 수익 배분 구조가 만들어졌다. 기술표준 업계에서는 ‘특허 풀(pool)’이라는 제도를 통해 특허사용자와 특허제공자 등의 이해관계자를 연계하고 있다. 영국에서는 인공지능과 관련된 이슈를 다루기 위해 인공지능청(Office for AI)을 신설했다. 우리나라에서도 저작권법 개정을 위한 노력을 기울이고 있으나 빠르게 변화하는 기술에 선제적으로 대응할 수 있는 명확한 가이드라인이 필요하다. 지금 우리가 논의하고 만드는 이 생태계가 미래 인공지능 산업의 국가경쟁력을 결정지을 것이다.

#생성ai#저작권문제
  • 좋아요
    0
  • 슬퍼요
    0
  • 화나요
    0
  • 추천해요

댓글 0

지금 뜨는 뉴스