“가비지 인, 가비지 아웃” 콘텐츠가 살아야 AI도 산다
Posted August. 29, 2024 09:12,
Updated August. 29, 2024 09:12
“가비지 인, 가비지 아웃” 콘텐츠가 살아야 AI도 산다.
August. 29, 2024 09:12.
.
한국인 이승윤 씨(34)가 2022년 미국에서 창업한 ‘스토리’라는 회사는 기업 가치가 3조 원에 이른다. 창업 2년 만에 유니콘 기업(기업 가치 1조 원 이상 비상장 기업)이 된 것이다. 한국에서 중고거래 신드롬을 일으킨 ‘당근마켓’과 비슷한 규모다. 스토리는 콘텐츠를 만드는 창작자들의 지식재산권(IP) 보호를 목표로 한다. 이렇게 보호된 IP를 통해 수익을 내는 것이다. 이 대표는 “빅테크 기업들이 인공지능(AI)을 학습시키려 콘텐츠를 무단 사용하고 있다”고 비판했다. 그러면서 “모든 콘텐츠가 적절한 보상을 받을 수 있는 방안을 고민 중”이라고 했다. 스토리가 주목한 것은 기술은 빠르게 발전하는데 IP는 제대로 보호받지 못하는 현실이었다. 그리고 이 문제가 더 심각해질 것이란 점이었다. 스토리는 최근 8000만 달러(약 1064억 원)를 투자받아 그 가치를 다시 한번 입증했다. 스토리의 성공은 역설적으로 콘텐츠의 위기를 뜻한다. AI의 등장으로 ‘콘텐츠 르네상스’라고 불릴 정도로 콘텐츠가 주목받고 있다. 하지만 AI 시대를 주도하는 빅테크들은 AI를 학습시킬 양질의 콘텐츠를 원하면서도 창작자들을 보호하고 생태계를 만드는 일에는 별 관심이 없어 보인다. 가비지 인, 가비지 아웃(Garbage In, Garbage Out). ‘쓰레기를 넣으면 쓰레기가 나온다’는 뜻이다. 정보기술(IT) 업계에서 많이 쓰는 이 말은 “입력 데이터가 좋지 않으면 출력 데이터가 좋지 않다”는 의미다. 최첨단 반도체와 최고 기술로 만들어진 AI라 해도 쓰레기를 입력하면 쓰레기가 나올 수밖에 없다. 반대로 좋은 콘텐츠를 많이 흡수한 AI는 더 강력해진다. 구글의 ‘제미나이’와 오픈AI의 ‘챗GPT’ 등 글로벌 선두권 AI들은 이미 지구상에 있는 모든 정보를 다 섭렵한 것처럼 보인다. 책과 백과사전, 뉴스 기사, 소셜네트워크서비스(SNS)에 올라온 대화와 게시물 등 디지털화할 수 있는 모든 자료를 학습하고 있다. 2032년에 AI 학습 자료가 고갈될 것이라는 전망까지 나온다. 문제는 AI가 공부한답시고 양질의 콘텐츠를 공짜로 무차별적으로 빨아들이는 것이다. 이 과정에서 웹상의 정보를 무작위로 탐색하는 ‘크롤링’이나 ‘웹스크레이핑’ 등의 방법도 동원된 것으로 알려졌다. 이런 행태들은 필연적으로 창작자들의 의욕 감소와 창작 포기를 불러온다. 일부 창작자들은 자신의 디지털 창작물에 일종의 독극물(독성 픽셀)을 풀어 놓고 AI가 이를 학습할 경우 바보가 되도록 함정을 파기도 한다. 21세기 디지털 고육지책(苦肉之策)이다. 이렇게 창작자들이 무너지면 그다음엔 AI다. 창작자들의 빈자리엔 쓰레기만 남고, 쓰레기로 학습한 AI는 쓰레기를 내놓을 수밖에 없다. 한국 정부는 1년여 전부터 AI 관련 저작권 제도 개선 연구를 시작해 지난해 말 ‘생성형 AI 저작권 안내서’를 발간하기도 했다. 하지만 너무 늦고 너무 느슨해 보인다. 창작자들을 보호하는 것은 AI 규제가 아니라 AI를 살리는 길이다. 콘텐츠와 AI의 선순환 생태계를 구축하는 것은 AI 강국으로 가기 위한 기본 조건이기도 하다. 한국 AI가 쓰레기를 학습하지 않도록 더 서둘러야 하는 이유다.
日本語
한국인 이승윤 씨(34)가 2022년 미국에서 창업한 ‘스토리’라는 회사는 기업 가치가 3조 원에 이른다. 창업 2년 만에 유니콘 기업(기업 가치 1조 원 이상 비상장 기업)이 된 것이다. 한국에서 중고거래 신드롬을 일으킨 ‘당근마켓’과 비슷한 규모다.
스토리는 콘텐츠를 만드는 창작자들의 지식재산권(IP) 보호를 목표로 한다. 이렇게 보호된 IP를 통해 수익을 내는 것이다. 이 대표는 “빅테크 기업들이 인공지능(AI)을 학습시키려 콘텐츠를 무단 사용하고 있다”고 비판했다. 그러면서 “모든 콘텐츠가 적절한 보상을 받을 수 있는 방안을 고민 중”이라고 했다. 스토리가 주목한 것은 기술은 빠르게 발전하는데 IP는 제대로 보호받지 못하는 현실이었다. 그리고 이 문제가 더 심각해질 것이란 점이었다. 스토리는 최근 8000만 달러(약 1064억 원)를 투자받아 그 가치를 다시 한번 입증했다.
스토리의 성공은 역설적으로 콘텐츠의 위기를 뜻한다. AI의 등장으로 ‘콘텐츠 르네상스’라고 불릴 정도로 콘텐츠가 주목받고 있다. 하지만 AI 시대를 주도하는 빅테크들은 AI를 학습시킬 양질의 콘텐츠를 원하면서도 창작자들을 보호하고 생태계를 만드는 일에는 별 관심이 없어 보인다.
가비지 인, 가비지 아웃(Garbage In, Garbage Out). ‘쓰레기를 넣으면 쓰레기가 나온다’는 뜻이다. 정보기술(IT) 업계에서 많이 쓰는 이 말은 “입력 데이터가 좋지 않으면 출력 데이터가 좋지 않다”는 의미다. 최첨단 반도체와 최고 기술로 만들어진 AI라 해도 쓰레기를 입력하면 쓰레기가 나올 수밖에 없다. 반대로 좋은 콘텐츠를 많이 흡수한 AI는 더 강력해진다.
구글의 ‘제미나이’와 오픈AI의 ‘챗GPT’ 등 글로벌 선두권 AI들은 이미 지구상에 있는 모든 정보를 다 섭렵한 것처럼 보인다. 책과 백과사전, 뉴스 기사, 소셜네트워크서비스(SNS)에 올라온 대화와 게시물 등 디지털화할 수 있는 모든 자료를 학습하고 있다. 2032년에 AI 학습 자료가 고갈될 것이라는 전망까지 나온다.
문제는 AI가 공부한답시고 양질의 콘텐츠를 공짜로 무차별적으로 빨아들이는 것이다. 이 과정에서 웹상의 정보를 무작위로 탐색하는 ‘크롤링’이나 ‘웹스크레이핑’ 등의 방법도 동원된 것으로 알려졌다. 이런 행태들은 필연적으로 창작자들의 의욕 감소와 창작 포기를 불러온다. 일부 창작자들은 자신의 디지털 창작물에 일종의 독극물(독성 픽셀)을 풀어 놓고 AI가 이를 학습할 경우 바보가 되도록 함정을 파기도 한다. 21세기 디지털 고육지책(苦肉之策)이다.
이렇게 창작자들이 무너지면 그다음엔 AI다. 창작자들의 빈자리엔 쓰레기만 남고, 쓰레기로 학습한 AI는 쓰레기를 내놓을 수밖에 없다.
한국 정부는 1년여 전부터 AI 관련 저작권 제도 개선 연구를 시작해 지난해 말 ‘생성형 AI 저작권 안내서’를 발간하기도 했다. 하지만 너무 늦고 너무 느슨해 보인다. 창작자들을 보호하는 것은 AI 규제가 아니라 AI를 살리는 길이다. 콘텐츠와 AI의 선순환 생태계를 구축하는 것은 AI 강국으로 가기 위한 기본 조건이기도 하다. 한국 AI가 쓰레기를 학습하지 않도록 더 서둘러야 하는 이유다.
アクセスランキング