생성형AI 기업들 창작 툴 경쟁 창작자들 핵심도구로 급부상 구글, 오픈AI 대항마 ‘비오’ 공개… 어도비, AI기술 강화 포토샵 KT, 미디어특화 ‘매직플랫폼’… 네이버, 이미지AI 기업 투자
영상이나 이미지, 음성을 만들어내는 생성형 인공지능(AI) 기술 경쟁이 치열해지고 있다. 콘텐츠 창작에서 AI가 핵심 도구로 급부상하면서다. 기업들은 생성형 AI 이용자를 확보하기 위해 기존 서비스에 AI 기술을 결합해 활용도를 높이거나 간단한 명령어만으로 전문가 수준의 결과물을 손쉽게 만들어 낼 수 있는 서비스 개발에 박차를 가하고 있다. 오픈AI가 2월 텍스트를 입력하면 동영상을 만들어주는 ‘텍스트 투 비디오’ AI 모델인 ‘소라’를 공개한 이후 창작 툴 개발 경쟁이 본격화하는 모양새다.
포토샵으로 잘 알려진 이미지·영상 편집 서비스 제공 기업 어도비는 최근 생성형 AI 기능을 강화한 새로운 포토샵 베타 버전을 공개했다. 정식 버전은 올해 말 출시된다. 이번에 선보인 포토샵 베타 버전은 어도비가 신규 개발한 ‘파이어플라이 이미지3’ 파운데이션 모델이 적용됐다. 이를 통해 포토샵 이용자들은 △참조 이미지 △이미지 생성 △비슷하게 생성 △배경 생성 △디테일 강화 등 새로운 AI 기능을 활용할 수 있게 됐다.
어도비는 지난달 16일 영상 편집 도구인 프리미어 프로에 도입될 생성형 AI 기능을 공개했다. 어도비는 오픈AI ‘소라’와 동영상 생성 AI 업체인 런웨이, 피카랩스 등을 프리미어 프로에 결합해 프리미어 프로 하나만으로도원활한 창작 활동을 하도록 지원할 계획이다.
이미지 생성 엔진 ‘스테이블 디퓨전’을 만든 스태빌리티AI가 지난해 11월 비디오 생성 모델을 내놓은 데 이어 이미지 생성 AI로 유명한 미드저니도 ‘텍스트 투 비디오’ 모델을 준비하고 있다.
국내 기업 KT도 미디어 특화 AI 기술 ‘매직플랫폼’을 선보였다. AI를 활용해 이미지나 음악을 만들거나 오래된 사진을 고화질 사진으로 복원해주는 기능 등이 담겼다. 특정 인물이나 특정 행동, 특정 음악 등 원하는 구간을 AI가 찾아주는 ‘장면 인식 기능’, 두 이미지에서 얼굴을 검출해 2세 얼굴 등을 예측해 보는 ‘AI 페이스 기능’도 담겼다.
KT는 이 기술을 활용해 전자책에서 AI가 핵심 키워드를 뽑아내고 이를 AI가 제작한 음성으로 읽어주는 ‘AI 오브제북’ 제작에 활용했다. 장면 인식 기능은 하반기 지니TV ‘AI 골라보기’ 서비스에 적용될 예정이다.
남혜정 기자 namduck2@donga.com