뉴스 트렌드 생활정보 International edition 매체

‘AI 비서’ 대격돌… ‘GPT-4o’ 맞설 ‘프로젝트 아스트라’ 공개

입력 | 2024-05-16 03:00:00

구글 “텍스트-영상-음성 한번에 처리”
10여년전 실패 ‘글라스’ 부활 예고
메타 “카메라 장착 AI이어폰 개발중”




오픈AI가 인공지능(AI) 비서 ‘GPT-4o’를 발표한 지 하루 만에 구글이 AI 비서 구현을 위한 ‘프로젝트 아스트라’를 공개했다. 사람과 AI 간 음성 대화는 물론이고 이미지와 영상까지 인식하며 기술이 고도화되는 가운데 애플과 메타도 경쟁에 합류할 것으로 보인다.

구글이 14일(현지 시간) ‘구글 I/O 2024’에서 발표한 프로젝트 아스트라는 텍스트뿐만 아니라 이미지, 영상, 음성 등을 한 번에 처리할 수 있는 미래형 AI 비서 서비스다. 데미스 허사비스 구글 딥마인드 최고경영자(CEO)가 구글 합류 이후 처음으로 공식 무대에 올라 프로젝트 아스트라를 소개했다. 그는 “우리는 오랫동안 일상생활에서 도움이 될 수 있는 범용 AI 에이전트를 만들고 싶었다”며 “휴대전화나 안경과 같은 폼팩터를 통해 전문가 역할을 하는 비서를 곁에 둘 수 있는 미래를 쉽게 상상할 수 있다”고 강조했다.

시연 영상에는 AI 비서를 실행한 후 휴대전화 카메라로 주변 상황을 보여주고 ‘안경이 어디에 있는지 기억해?’라고 묻자 “아까 테이블에 놓여진 사과 옆에 있었다”고 답하는 모습이 담겼다. 또 컴퓨터 화면에 있는 코드를 분석해서 문제점을 짚어 주기도 했다.

구글은 프로젝트 아스트라 구현을 위한 스마트안경을 착용하고 AI와 대화하는 영상도 공개했다. 이에 블룸버그 등 외신들은 10여 년 전 구글이 야심 차게 내놓았지만 실패했던 ‘구글 글라스’가 AI 덕분에 부활할 것이라는 전망을 내놓기도 했다. 구글은 중간 단계로 수개월 내 ‘제미나이 라이브’를 먼저 공개하기로 했다.

다만 프로젝트 아스트라의 대부분 기능이 오픈AI가 전날 공개한 ‘GPT-4o’와 거의 흡사해 놀라움이 반감됐다는 평가가 나온다. 오픈AI ‘GPT-4o’도 사람처럼 보고 듣고 말하는 AI 음성비서다. 실시간 통역을 제공할 뿐만 아니라 휴대전화 카메라 렌즈로 이용자의 감정을 파악해 목소리를 바꾸며 대화를 한다. 사람과 AI 모델 간 다자 대화도 가능하다.

디인포메이션에 따르면 페이스북의 모회사인 메타는 ‘카메라 버드’라는 프로젝트명으로 AI 비서와 카메라 기능이 장착된 이어폰을 개발 중이다. 카메라로 주변 환경을 파악해 목표 지점과 얼마나 떨어져 있는지 안내해주거나 외국어를 실시간으로 번역하는 등 다양하게 활용될 것으로 알려졌다.

애플은 다음 달 열리는 연례 개발자 콘퍼런스에서 음성비서 ‘시리’에 AI 기능을 접목한 서비스를 공개할 것으로 전망된다.



남혜정 기자 namduck2@donga.com