뉴스 트렌드 생활정보 International edition 매체

마이크로소프트, 일반인공지능 개발 진전 주장…“홍보용” 비판도

입력 | 2023-05-17 10:13:00


마이크로소프트사의 인공지능(AI) 개발자들이 자신들이 개발하는 새로운 인공지능이 사람과 같은 방식으로 사고하는 능력을 가지고 있다고 주장하고 있으나 비판자들은 개발자들이 스스로를 속이는 것이라고 비판한다고 미 뉴욕타임스(NYT)가 16일(현지 시간) 보도했다. 다음은 기사 요약.

마이크로소프트 개발자들이 지난해 사물에 대한 직관력이 있어야 해결할 수 있는 문제의 답을 내도록 인공지능에 요구하는 실험을 했다.

◆사물에 대한 직관력이 있어야 낼 수 있는 답

예컨대 “책 한 권, 달걀 9개, 노트북 컴퓨터, 병, 못을 흔들리지 않게 쌓는 방법을 알려 달라”고 하는 식이다.

AI는 책을 깔고 그 위에 달걀을 세 줄 간격을 두고 배열하되 깨지지 않도록 조심하라고 했다. 그 위에 노트북 컴퓨터를 접은 상태로 책 크기에 맞춰 정확하게 놓으면 흔들리지 않아 다른 것들을 놓을 수 있다고 답했다.

개발자들은 이 같은 답이 새로운 지능 형태일 수 있다고 판단했다. 지난 3월 발표한 보고서에서 이들은 새 인공지능이 일반인공지능으로 한발 나아간 것이라고 주장했다. 일반인공지능은 사람의 두뇌와 같은 일을 할 수 있는 인공지능을 가리킨다.

이 발표가 큰 논쟁을 불러 일으켰다. 실제 사람과 같은 인공지능이 개발되고 있다는 주장과 개발자들이 지나치게 상상력을 발휘했다는 주장이 맞부닥친 것이다.

마이크로소프트의 인공지능 개발을 책임지는 피터 리는 “처음엔 믿지 않았는데 갈수록 공포스러웠다. 어떻게 이런 일이 벌어질 수 있는가라고 생각했다”고 했다.

마이크로소프트의 보고서는 “일반인공지능 불똥”이라는 도발적 제목으로 돼 있다. 개발자들이 인간 두뇌 만큼 나아가 더 잘 작동하는 인공지능을 개발하는데 성공한다면 세상이 크게 달라지고 위험해질 수 있다.

◆과학자들 “일반인공지능 가능하지 않다”

다만 보고서의 내용이 터무니없는 것일 수도 있다. 컴퓨터 과학자들은 일반인공지능이 가능하다는 주장을 믿지 않는다. 지난해 구글은 감각을 가진 인공지능을 개발했다고 주장한 개발자를 해고했다. 감각 인공지능은 일반인공지능을 뛰어넘어 환경을 직접 인지하고 느낄 수 있는 인공지능을 말한다.

그러나 지난해의 인공지능 발전은 설명하기 어려운 수준까지 진전됐다. 프로그램으로 입력되지 않은 사고 내용을 사람처럼 답으로 제시하고 있는 것이다.

약 5년 전 구글, 마이크로소프트, 오픈AI 등의 회사가 대언어모델(LIM) 구축을 시작했다. 책, 위키피디아 문서와 채팅 글 등 엄청난 양의 디지털 문장을 분석함으로써 학교 과제에서 시, 컴퓨터 프로그램 등 각종 문장을 생성할 수 있게 됐다. 심지어 대화도 이끌 수 있다.

마이크로소프트 개발자들이 연구하고 있는 오픈AI사의 챗GPT-4가 가장 강력한 대언어모델 인공지능이다.

연구자들은 챗GPT-4에 무리수의 존재를 증명하되 운율을 달아달라고 주문했다.

GPT-4는 수학적인 동시에 언어학적인 증명의 답을 내놨다. 개발자들은 처음엔 무슨 소리를 하는지 몰랐으나 몇 달 뒤 GPT-4가 사람의 생각과 기량을 “심오하고 유연하게 이해하고 있음”을 알게 됐다.

◆내놓은 답의 배후엔 심오하고 유연한 이해력

리 박사는 GPT-4가 내놓는 문장은 보기보다 훨씬 더 깊이 분석하고 종합하고 평가하는 과정을 통해 내놓는 것이라고 강조했다.

개발자들이 TiKZ라는 프로그램 언어를 사용해 유니콘을 그려 달라고 주문하자 곧바로 유니콘을 그려내는 프로그램을 짜서 제시했다. 프로그램에서 유니콘을 그리는 부분을 지운 뒤 프로그램을 수정해달라고 요구하자 정확히 지운 부분을 채웠다.

또 나이, 성별, 체중, 신장, 혈액검사 결과를 근거로 당뇨에 걸릴 위험을 평가하는 프로그램을 짜기도 하는 등 수많은 요구를 하는 실험을 했다, 심지어 대언어모델 개발과 오용에 관한 소크라테스식 대화글을 써달라고도 했다.

모든 질문에 GPT-4는 정치, 물리, 역사, 컴퓨터 과학, 의학, 철학 지식을 모두 동원해 답을 냈다. 모두 답을 내지 못할 것으로 예상한 문제들이지만 대부분 답을 낸 것이다.

◆“마이크로소프트 발표는 경쟁 의식한 홍보용” 비판

이 같은 발표 내용에 대해 일부 인공지능 전문가들은 비판적이다. 카네기멜런대 마르텐 샙 교수는 “마이크로소프트의 발표는 홍보용이다. 서문에서 자신들의 연구가 주관적이며 비공식적이어서 과학적 평가 기준에 미치지 못한다고 밝히고 있다”고 지적했다.

마이크로소프트 개발자들이 낸 보고서는 증오 발언, 허위 정보 등을 배제하지 못하는 GPT-4는 초기 버전을 사용한 것이기 때문에 다른 전문가들이 평가할 수 없는 상황이다. 사람 수준의 답을 내는 때도 있고 터무니없는 답을 내는 때도 있기 때문이다.

버클리대 인공지능 연구자이 앨리스 곱닉 심리학 교수는 GPT-4와 같은 인공지능이 강력하긴 해도 인공지능이 생성한 문장이 사람과 같은 추론과 상식을 바탕으로 한 것은 아니라고 지적했다.

그는 “우수한 성능을 보이는 기계에 대해 사람들은 쉽게 의인화한다. 인공지능을 사람과 비교하는 것은 경쟁에 앞서고 있음을 강조하는 것일 뿐”이라고 말했다.


[서울=뉴시스]