[생성 AI 길라잡이] 3세대로 업그레이드된 인공지능 콘텐츠 생성 ‘런웨이ML’

동아닷컴
입력 2024년 7월 4일 23시 24분

코멘트: 개

좋아요: 개

※ 생성 인공지능이 세계를 뜨겁게 달굽니다. 사람만큼, 더러는 사람보다 더 그림을 잘 그리고 글을 잘 쓰는 생성 인공지능. 생성 인공지능을 설치하고 활용하는 방법과 최신 소식을 매주 전합니다.

생성형 인공지능으로 영상을 만들 수 있었던 런웨이ML이 3세대 영상 생성 서비스를 공개했습니다. / 출처=IT동아

영상 편집은 기본이고 텍스트와 이미지로 영상을 만들어 주는 등 생성형 인공지능을 기반 서비스를 제공하는 런웨이(Runway)ML이 3세대 서비스를 시작했습니다. 기존 2세대 서비스 대비 처리 속도가 빨라지고 제어 가능한 일부 기능을 추가한 점이 특징입니다. 최소 월 15달러(원화 약 2만 1000원)를 지불해야 쓸 수 있는 유료 서비스지만, 업그레이드된 서비스가 보여주는 결과물이 궁금합니다. 현재 알파 버전이지만 향후 무료 사용자에게도 적용될 가능성이 있으니까요.

그렇다고 무료 사용자에게 적용되는 2세대 서비스가 성능, 기능적 요소 등이 부족하다는 이야기가 아닙니다. 명령어를 입력하면 영상을 만들어주고 음성 파일을 등록하면 그에 맞춰 사람이 말하는 영상을 만드는 립싱크 비디오 역시 그대로입니다. 1세대 서비스에 해당하는 이미지 합성, 인페인팅, 3D 효과, 해상도 향상도 제공합니다. 무료 가입자에게는 125 크레딧이 제공됩니다. 영상 기준으로 최대 16초 가량 생성이 가능하니 생성형 인공지능 맛을 보기에 충분합니다.

런웨이ML 3세대 서비스는 주 화면 상단을 클릭해 들어가면 됩니다. / 출처=IT동아

사용 방법도 기존과 다르지 않습니다. 런웨이ML 홈페이지에 접속하면 상단에 ‘3세대 알파를 소개합니다.(Introducing Gen-3 Alpha)’ 항목이 있고 바로 아래에 ‘시작하다.(Get Started)’를 클릭하면 됩니다. 바로 클릭하면 이전과 마찬가지로 3분할 화면이 반겨줍니다. 하지만 이전과는 사뭇 다른데요. 기존에는 이미지를 등록하고 화면 효과 등을 사전에 설정할 수 있었습니다. 3세대에는 이 부분들이 빠졌는데요. 화면 좌측의 메뉴는 텍스트 입력과 해상도 설정, 프리셋 적용 등 3가지만 제공됩니다. 매우 단순하네요.

런웨이ML의 3세대 생성 서비스는 구조가 간단합니다. 명령어만 입력하면 되는 방식인데 유료 사용자라면 3세대 생성 서비스를 즉시 사용할 수 있습니다. 반면 무료 사용자는 2세대 생성 서비스로 자동 전환됩니다. / 출처=IT동아

이제 런웨이ML의 3세대 서비스는 오로지 텍스트에만 집중하면 됩니다. 어떤 명령어를 넣어야 멋진 영상을 만들 수 있을지 말이죠. 그래서 화면 좌측에는 텍스트 입력만 가능합니다. 런웨이ML 내 가이드를 보면 기본 명령어를 입력할 때 영문 기준으로 카메라 이동, 주요 장면, 추가 요소 순으로 입력하라고 합니다.

예로 ‘어깨 위 구도로 촬영(Over the shoulder shot)’이라는 카메라 이동 명령어를 넣습니다. 이어 주요 장면으로 ‘여성이 뛰어간다(woman running)’라는 문구를 입력합니다. 이것만 해도 영상을 만들 수 있습니다. 하지만 여성이 뛰는 모습을 어깨 위 각도로 보여주는 심심한 영상이 나올 겁니다. 이 때 추가 요소 명령을 뒤에 입력합니다. 예로 ‘로겟을 바라보다(watching a rocket)’을 적으면 로켓이 발사되는 모습을 보며 여성이 달려가는 영상이 나올 겁니다.

영상 구성에 필요한 명령어를 꼼꼼히 입력하면 끝입니다. 10초 영상이 생성되는 데에 약 30초 가량 소요됩니다. / 출처=IT동아

실제 로켓을 바라보며 달려가는 여성을 어깨 위 구도로 촬영(Over the shoulder shot of a woman running and watching a rocket in the distance)하라고 입력하겠습니다. 이제 명령어창 아래에 영상 생성 시간을 설정해야 됩니다. 5초와 10초가 있는데 여기에서는 10초를 선택하겠습니다.

2세대에 비해 3세대는 영상 생성 시간이 크게 줄었습니다. 2세대는 4초짜리 짧은 영상 하나 만드는데 약 3분 정도의 시간이 필요했으나 3세대는 약 30초 정도 소요됐습니다. 다만 10초 영상 하나를 생성하는데 100 크레딧을 씁니다. 4초 영상에 25 크레딧을 쓰던 2세대 영상과 비교하면 부담스러운 부분입니다. 영상의 용량은 약 3MB 정도로 가벼운 편이었습니다. 결과물에 따라 용량은 차이가 있겠지만, 영상 품질이나 용량 자체는 아쉬움이 없었습니다. 현재 결과물은 조금 엉성한데 명령어를 더 구체적으로 적는다면 좋은 결과물을 기대할 수 있겠습니다.

생성된 영상에는 음성이 없습니다. 음성을 추가하려면 2세대 생성 서비스인 ‘립 싱크‘를 활용해도 됩니다. 물론 크레딧을 지불해야 됩니다. / 출처=IT동아

결과물에는 음성이 없기에 런웨이ML의 3세대 생성 서비스는 ‘립싱크(Lip Sync)’ 기능으로 음성을 넣을 수 있습니다. 이건 2세대 생성 서비스에도 있던 기능입니다. 음성 파일을 가지고 있다면 넣어보세요. 가급적 말하는 동작이 있을 때 적용하면 좋겠습니다. 기사 작성을 위해 생성된 영상은 뒷모습만 보이기 때문에 영상을 자유롭게 넣기는 어려워 보이네요.

또한 유료 사용자는 영상에 워터마크가 없습니다. 2세대 생성 서비스가 적용된 무료 사용자는 영상 생성 시에 워터마크가 있다는 점 참고하세요. 영상은 상업 및 비상업용으로 사용이 가능하다고 합니다. 그래도 아직 인공지능 생성 영상에 대한 논란은 남아있으니 주의가 필요합니다.

런웨이ML의 3세대 서비스는 텍스트만으로 쉽게 영상 생성이 가능한 인공지능 서비스입니다. 장시간 영상이 아닌 초 단위의 짧은 영상 위주로 생성 가능하지만, 이 부분은 점차 개선될 것으로 예상됩니다. 여전히 한글 인식이 안 되는 부분은 아쉽지만, 영어 문장을 잘 활용하면 멋진 영상 생성을 할 수 있습니다. 인공지능이 만든 영상이 궁금하다면 한 번 도전해 보는 것은 어떨까요?

IT동아 강형석 기자 (redbk@itdonga.com)