뉴스 트렌드 생활정보 International edition 매체

尹 극찬한 AI혁명 ‘챗GPT’…대한민국 대통령 묻자 ‘오류’

입력 | 2023-02-01 09:34:00

인공지능 챗봇 ‘챗GPT’를 개발한 미국 AI 연구소 ‘오픈AI’ 홈페이지(웹사이트 갈무리)


미국의 인공지능(AI) 연구소 오픈AI가 개발한 ‘챗GPT’가 연일 세간의 주목을 받고 있다. 이전까지 존재했던 AI 챗봇들보다 뛰어난 성능을 갖췄다고 평가받으면서 2016년 이세돌과 바둑을 둔 ‘알파고’에 이은 또 다른 ‘AI 혁명’이라는 이야기까지 나오고 있다.

최근 윤석열 대통령이 새해 업무보고를 받던 자리에서 챗GPT를 거론하며 신년사를 써보도록 했더니 “정말 훌륭하더라”며 감탄했다는 소식까지 전해지며 관심이 더 커졌다.

챗GPT는 이용자가 간단한 질문을 입력하면 학습된 데이터를 바탕으로 자연스러운 답변을 내놓는다. 창의성이 필요한 시나 소설 등 작문 분야까지 수준급으로 해내면서 미국의 일부 학교에서는 챗GPT의 활용을 금지하기도 했다.

지난해 11월30일 처음 등장한 챗GPT는 출시 40일 만에 일일 이용자가 1000만명을 넘어섰다는 관측이 최근 나오기도 했다. 챗GPT의 기술력을 확인하고자 하는 이용자들이 대부분일 것으로 추정되지만 그만큼 AI의 활용이 우리 일상에 성큼 다가온 모습이다.

하지만 챗GPT는 자연스러운 답변을 만들어내는 것과 별개로 부정확한 정보를 생산하기도 한다. 가장 근본적인 문제는 챗GPT가 2021년까지 학습한 데이터를 토대로 서비스를 시작했다는 점이다. 학습된 데이터가 2021년에 머물러 있다 보니 최신 정보를 묻는 질문에는 정확한 답변이 불가능하다.

예를 들어, ‘대한민국의 대통령은 누구입니까’라는 질문에 ‘대한민국의 현재 대통령은 문재인입니다’라고 답변을 하는 식이다. 윤석열 대통령은 지난 2022년 5월10일 취임했다. 챗GPT가 학습한 시기에는 문재인 전 대통령이 재임 중이었다.

여러 정보값이 혼재된 모습을 보여주기도 한다. ‘2023년 대한민국의 최저시급은 얼마입니까’라는 질문에 챗GPT는 ‘2023년 대한민국의 최저시급은 8590원’이라고 대답했다. 현재 시점을 기준으로 ‘2023년’이라고 답변은 했지만 최저시급 액수는 2020년 정보에 멈춰 있었다.

혐오 표현을 학습할 수 있다는 문제점도 있다. 챗GPT는 정보를 스스로 생산하는 것이 아니라 기존에 존재하는 데이터들을 학습하기 때문이다. 지금까지 챗GPT가 학습한 데이터에 현재의 시대상과 맞지 않은 차별적이거나 혐오 표현이 담겨 있을 가능성이 있다.

오픈AI 측 역시 “(대화) 출력은 부정확하고 진실하지 않으며 때때로 오해의 소지가 있을 수 있음을 명심하는 것이 중요하다”고 설명하고 있다. 또한 “2021년 이후의 세계와 사건에 대한 지식으로 제한돼 있으며 때때로 유해한 지침이나 편향된 콘텐츠를 생성할 수도 있다”고 주의한다.

이와 같은 이유로 챗GPT를 둘러싼 최근 분위기가 과대평가됐다는 시각도 있다. 메타의 수석 AI과학자 얀 르쿤은 최근 “기본적인 기술 측면에서 챗GPT는 특별히 혁신적이지 않다”며 “이전에도 비슷한 AI 연구소에서 구축됐던 시스템”이라고 짚기도 했다.

특히 챗GPT가 ‘인터넷 검색’을 대신할 수 있다는 우려는 구글로 인해 고조된 측면이 있다. 지난달 미국 뉴욕타임스는 구글이 자사의 검색 서비스에 위기감을 느끼고 ‘코드 레드’를 선언했다는 소식을 전한 바 있다. 하지만 정보의 ‘신속성’과 ‘정확성’을 요구하는 검색 포털의 역할을 챗GPT가 대체하기는 어려울 것이라는 분석이다.

김명주 서울여자대학교 정보보호학과 교수는 “챗GPT의 가장 큰 문제점은 정확성”이라며 “(해당 기술이) 구글 검색을 대체할 수 있다는 전망이 나오는데 개인적으로는 불가능하다고 생각한다”고 말했다. 답변에 활용되는 정보가 실시간으로 업데이트되지 않는 이상 정확성 문제는 해결될 수 없다는 이야기다.

김 교수는 “과거의 정보가 시간이 지나면서 달라지기도 하기 때문에 예전 데이터를 대량으로 학습한 AI는 검색 기능을 대체하기보다 보조하는 역할을 할 것”이라고 덧붙였다.

국내에서 AI 챗봇 서비스를 제공하는 스캐터랩의 고상민 머신러닝 리서처는 “실시간으로 정보가 학습돼서 AI 모델이 업데이트되고 있는 경우는 없는 것으로 알고 있다”며 “다만 최신 정보들을 직접 모델 입력으로 넣어서 이를 보완하는 시도와 근본적으로 해결하기 위한 연구들도 이뤄지고 있다”고 말해 추가적인 연구 필요성을 강조했다.

(서울=뉴스1)