AI 데이터 수집료는 공짜?

동아일보
입력 2021년 3월 16일 03시 00분

이호재 기자

코멘트: 개

좋아요: 개

‘인공지능, 법에게…’ 펴낸 정상조 교수
인공지능 기술 발달에 따른 데이터 저작권 문제 등 다뤄
“AI시대, 법 제도 개선 필요”

2016년 인공지능(AI) 알파고는 이세돌 9단과의 바둑 대결에서 4 대 1로 이겼다. 알파고의 승리 비결은 기계가 스스로 학습하는 ‘머신러닝’. 수많은 바둑 기보 데이터를 학습한 끝에 알파고는 이세돌보다 몇 수 위가 됐다. 알파고는 바둑 관련 데이터를 어디서 수집했을까. 데이터 수집 시 저작권이나 프라이버시 등을 침해할 소지는 없을까.

AI 기술 발달에 따른 법적 문제를 다룬 ‘인공지능, 법에게 미래를 묻다’(사회평론)를 10일 펴낸 정상조 서울대 법학전문대학원 교수(사진)는 15일 동아일보와의 인터뷰에서 “AI가 데이터를 수집하고 이용하는 과정에서 법적 문제는 언제든 생길 수 있다”고 말했다. 만약 알파고가 바둑 데이터를 수집할 때 해당 데이터를 작성한 사람에게 허락을 받지 않았다면 저작권법 위반 소지가 있다는 것.

보통 정보기술(IT) 기업은 소프트웨어인 크롤러나 스파이더를 이용해 인터넷에 퍼진 데이터를 수집한다. AI는 이 데이터로 학습을 한다. 만약 AI가 공익에 이바지하는 일을 수행하면 공적 이용에 해당해 저작권료를 지불하지 않아도 된다. 반면 사적 이익을 추구하기 위해 무단으로 데이터를 수집하면 저작권 분쟁 여지가 생긴다.

정 교수에 따르면 일본은 저작권법을 개정해 AI가 학습하기 위해 데이터 사본을 만드는 행위를 적법하도록 했다. 반면 우리는 관련 법 정비가 이뤄지지 않은 상태다. 정 교수는 “우리나라는 AI가 학습하기 위해 데이터를 이용하는 상황에서 적용할 수 있는 법률 조항이 추상적”이라며 “우리나라도 데이터 이용 조건과 범위를 명확히 규정하는 방향으로 법 제도를 개선해야 한다”고 강조했다.

그는 공공분야 데이터를 개방하는 것도 중요하다고 말한다. 이미 국내에서도 공공 데이터를 활용하는 사례가 늘고 있다. 다만 AI가 제대로 학습하기 위해선 더 많은 빅데이터가 필요하다. AI의 공공 빅데이터 학습을 활성화해야 국내 IT 업계의 경쟁력이 높아질 수 있다는 것이다. 정 교수는 “사생활을 침해하거나 국가안보를 해치지 않는 선에서 공공 데이터가 많이 공개될수록 AI가 더 발전할 수 있다”고 말했다.

그는 법원 판결에도 AI가 도입될 수 있다고 내다봤다. 판결문을 공개하고 이를 AI가 학습한다면 기초 수준의 판결을 대신할 수 있는 ‘로봇 판사’가 등장할 수 있다는 것. 지난해 인터넷을 통해 외부에 공개된 법원 판결문은 전체의 0.003%에 불과하다. 정 교수는 “AI는 판결문과 사건 관련 서류를 학습하고 분석할 수 있다”며 “개인정보 유출을 막는 전제하에 판결문 공개를 늘리면 법률 서비스의 품질을 높일 수 있다”고 말했다.

이호재 기자 hoho@donga.com

#ai #데이터 #법 #정상조