[단독]네이버 ‘자사 AI 학습에 블로그-카페 글 이용’ 약관… 공정위, 불공정 여부 조사

  • 동아일보
  • 입력 2023년 8월 5일 01시 40분


네이버 이용자가 블로그, 카페 등에 올린 글을 자사가 개발하는 인공지능(AI) 학습 등에 쓸 수 있도록 한 네이버 약관에 대해 공정거래위원회가 불공정 여부를 들여다보고 있는 것으로 확인됐다. 네이버는 내달 초거대 AI ‘하이퍼 클로바 X’ 공개를 앞두고 AI 개발에 박차를 가하고 있는데, 공정위의 판단에 따라 이런 네이버의 행보에 제동이 걸릴지 관심이 쏠린다.

4일 관련 업계 등에 따르면 공정위는 네이버 이용자의 콘텐츠를 AI 등의 연구개발 목적으로 사용할 수 있도록 한 네이버의 이용약관이 불공정 약관에 해당한다는 신고를 올 상반기(1∼6월) 중 접수해 이에 대한 조사를 진행하고 있다.

문제가 된 약관은 ‘이용자가 제공한 콘텐츠는 서비스 개선 및 새로운 서비스 제공을 위해 AI 기술 등의 연구개발 목적으로 네이버 및 네이버 계열사에 사용될 수 있다’는 부분이다. 이는 2018년 5월 네이버가 이용약관을 개정하면서 새롭게 포함시킨 내용이다. 당시 네이버는 자사 블로그·카페·지식인 플랫폼에 올라온 글들을 AI 학습에 활용하기 위해 이 같은 문구를 넣었다. 네이버는 이 약관을 근거로 2018년 이전에 작성된 글들까지 AI 학습에 활용하고 있다.

공정위 조사의 핵심 쟁점은 해당 약관이 네이버 이용자들의 저작권을 과도하게 침해하는지 여부가 될 것으로 보인다. 통상 저작물을 이용할 때는 저작권자에게 이용 허락을 받아야 하고, 저작물 사용으로 경제적 대가가 생기면 이 역시 지급해야 한다. 개별적 이용 허락과 보상 없이 연구개발에 쓰도록 한 부분이 불공정 약관에 해당할 수 있다는 것이다.

네이버 ‘남의 저작물로 AI 학습’… 공정위, 국내 첫 제동 움직임


공정위, 네이버 약관 조사
네이버, 2018년 “블로그 활용” 약관
내달 출시 AI에도 활용 가능성 높아
‘AI 학습용 데이터’ 저작권 침해 논란

● ‘타인 저작물로 AI 학습’ 공정위 조사

만약 공정위가 해당 약관을 불공정 약관이라고 판단해 네이버가 약관을 고치게 되면 앞으로 네이버가 자사 플랫폼에 게재된 저작물을 AI 학습용으로 쓰는 데 제약이 생길 수 있다. 네이버는 2021년 출시한 초거대 AI ‘하이퍼 클로바’를 개발하면서 자사 블로그 게시물 등을 AI 학습에 이용했다고 공식적으로 밝힌 바 있다. 다음 달 공개되는 ‘하이퍼 클로바 X’에 대해선 학습 재료로 무엇을 사용했는지를 밝힐지 아직 정하지 않았다는 게 네이버의 설명이다. 다만 네이버 관계자는 “네이버는 사용자에게 동의를 받은 서비스 이용약관에 근거해 사용자가 생성한 콘텐츠를 AI 연구개발에 활용하고 있다”고 설명했다. 결국 이번에도 블로그나 카페 글 등이 AI 학습에 사용됐을 가능성이 높다.

공정위는 사업자 및 전문가들의 의견을 들은 뒤 약관심사자문위원회에서 불공정 약관 여부를 결론짓게 된다. 불공정 약관이라고 판단하면 사업자는 약관을 바꿔야 한다. 그러지 않으면 시정명령 등 제재가 따를 수 있다. 신고 사건은 3개월 안에 처리하는 것이 원칙이라 이르면 올해 안에 결론이 나올 가능성이 있다. 다만 약관이 위법하다고 판단하더라도 이전 약관에 따른 계약을 무효화시킬 수는 없다. 지금까지 저작물을 AI 개발에 활용한 것에 대해 저작권자들이 손해배상을 청구하기는 어렵다는 얘기다.

● 해외서도 잇달아 저작권 소송

향후 내려질 공정위 판단은 AI 학습용 데이터를 둘러싼 저작권 침해 논란에 대한 일종의 나침반 역할을 할 것으로 보인다. 네이버를 넘어 국내 AI 산업 전반에 영향을 미칠 수 있다는 의미다. 현행법에서는 AI 학습용으로 남의 저작물을 복사·저장하는 것이 저작권 침해인지 가늠할 명확한 법 조항이 없다. 정부는 AI 학습을 위해서라면 타인의 저작물을 활용하더라도 저작권 침해에 해당하지 않도록 저작권법 개정을 추진 중이지만 국회 논의가 본격적으로 이뤄지진 않았다.

특히 네이버 플랫폼이 가진 방대한 한글 텍스트는 네이버뿐만 아니라 다른 AI 업체들도 눈독을 들이는 데이터라는 점에서 공정위 판단의 파장은 클 것으로 예상된다. 과학기술정보통신부 관계자는 “학습용 데이터를 갖고 있지 않은 AI 스타트업이 네이버 블로그 글을 AI 학습에 이용할 수 있도록 해달라고 문의하는 경우가 많다. 네이버 콘텐츠의 저작권 문제를 푸는 게 업계의 숙원인 셈”이라고 분위기를 전했다.

하지만 창작자들의 입장은 엇갈리고 있다. 고도로 발달한 생성형 AI가 창작자들에게 경제적 손해를 끼칠 수 있는 만큼 학습용 데이터 목록을 공개하고 나아가 무분별한 AI 학습을 규제해야 한다는 것이다.

김혜창 한국저작권위원회 정책연구본부장은 “챗GPT 등장 이전에는 AI 산업 발전을 위해 저작권자들이 양보해야 한다는 인식이 있었는데, 지금은 저작권자 권리를 보호해야 한다는 목소리가 점점 높아지고 있다. 사회적 논의가 필요한 때”라고 했다. 해외에서는 유명 작가, 언론사 등이 AI 개발사를 상대로 자신의 저작물을 동의 없이 사용했다며 잇따라 손해배상 소송을 벌이고 있다.

앞서 네이버는 계열사가 AI 개발을 위해 언론사의 사전 동의 없이 뉴스 콘텐츠를 이용할 수 있도록 약관을 바꾸며 불공정성 논란에 휩싸인 바 있다. 당시 공정위도 이를 들여다봤지만 네이버가 해당 약관을 수정하면서 일단락됐다.

#네이버#자사 ai 학습에 블로그-카페 글 이용#약관#불공정 여부
  • 좋아요
    0
  • 슬퍼요
    0
  • 화나요
    0

댓글 0

지금 뜨는 뉴스

  • 좋아요
    0
  • 슬퍼요
    0
  • 화나요
    0