뉴스 트렌드 생활정보 International edition 매체

“내 기분 맞혀봐” “신나 보여”…영화 ‘그녀’ 속 AI가 현실로

입력 | 2024-05-14 10:19:00

영화 ‘그녀’ 스틸컷


챗GPT 개발사 오픈AI가 사람처럼 보고 듣고 말하며 실시간으로 대화할 수 있는 새로운 인공지능(AI) 모델을 개발했다.

오픈AI는 13일(현지시간) 라이브 행사를 통해 ‘GPT-4o’(GPT-포오)라는 이름의 신형 AI 모델을 공개했다.

GPT-4o는 기존에 텍스트로 유저와 대화하던 방식과 달리 실시간으로 음성 대화를 주고받는 AI 모델이다.

이에 더해 청각과 시각 데이터를 분석해 이를 말할 수 있으며, 실제 사람과의 대화처럼 자연스럽게 말을 끊거나 다시 이어가는 기능도 탑재됐다.

이날 시연에서 개발자가 GPT-4o에게 “오늘 발표 때문에 긴장했는데 어떻게 해야 할까”라고 묻자 “천천히 심호흡해야 한다”라고 답했다.

이에 개발자가 숨을 거칠게 몰아쉬자 GPT-4o는 즉각적으로 “그렇게 하면 도움이 안 된다”라며 “천천히 숨을 들이마시고 내뱉어야 한다”라며 시간을 세주기도 했다.

또 다른 개발자는 카메라로 자신이 웃고 있는 모습을 보여주며 “내가 어떤 기분인지 맞혀봐”라고 하자 GPT-4o는 “상당히 즐거워 보이고 약간 신난 것처럼 보인다”라고 답했다.

이외에도 시각 기능을 이용해 종이에 적힌 수학 문제를 풀거나 어린이를 위한 잠자리 이야기를 다양한 목소리와 감정을 담아 들려주기도 했다.

13일(현지시간) 챗GPT 개발사 오픈AI가 새로운 인공지능(AI) 모델인 ‘GPT-4o’(GPT-포오)를 공개했다. 2024.05.13 (오픈AI 유튜브 갈무리)



아울러 GPT-4o가 50개 언어에 대한 실시간 통역 기능도 갖췄다며 이탈리아어와 영어를 동시통역하는 모습도 보였다.

오픈AI는 GPT-4o가 기존 GPT-4 터보보다 두 배 더 빠르면서도 비용은 절반 수준이라고 설명했다. GPT-4 터보는 오픈AI가 지난해 11월 공개한 최신 모델이다.

특히 GPT-4o의 응답 시간은 최소 232㎳(밀리초·1000분의 1초), 평균 320㎳로, 사람의 반응 시간과 비슷한 수준이라고 오픈AI는 설명했다.

이번 발표와 관련해 샘 올트먼 오픈AI 최고경영자(CEO)는 사람과 AI가 자연스럽게 음성으로 대화하는 모습이 담긴 영화 ‘그녀(Her)’를 언급하며 “컴퓨터와 대화하는 것이 자연스럽다고 느껴진 적이 없었는데 이제는 자연스럽다”라고 말하기도 했다.

한편 오픈AI의 발표는 AI 개발에 뛰어든 구글의 연례 개발자 회의 I/O 행사 하루 전에 진행됐다. 구글도 올해 행사에서 새로운 AI 모델을 내놓을 것으로 전망된다.

(서울=뉴스1)