※생성 인공지능이 세계를 뜨겁게 달굽니다. 사람만큼, 더러는 사람보다 더 그림을 잘 그리고 글을 잘 쓰는 생성 인공지능. 생성 인공지능을 설치하고 활용하는 방법과 최신 소식을 매주 전합니다.
지난 5월 13일, 오픈 AI가 기존 GPT-4에 멀티모달(Multi Modal) 기능을 접목한 GPT-4o를 공개했습니다. GPT-4o의 핵심은 문장만 인식하는 것이 아니라, 자연어나 오디오를 결합해서 인식하거나, 이미지를 보고 설명하는 등으로 데이터를 조합한다는 점입니다. 성능 면에서는 텍스트 인식 정확도가 84%에서 98%로 개선됐고, 오디오 처리 속도는 기존 5.4초에서 232밀리 초로 빨라져 실시간 대화가 가능한 수준으로 발전했습니다.
그런데 오픈AI의 챗GPT가 대화형 생성AI의 대명사처럼 쓰이지만, 이것 말고도 다른 고성능의 대화형 생성AI도 무료로 활용할 수 있다는 사실을 알고 계신가요? 대표적인 서비스가 구글 제미나이, 그리고 앤스로픽의 클로드입니다. 두 서비스 모두 GPT처럼 가입 후 누구나 사용할 수 있고, 유료 버전도 따로 제공됩니다. 동작 방식이 다른 만큼 GPT에서 얻지 못한 해답을 다른 생성AI에서 구할수도 있고요. 주요 대화형 생성AI에 대한 활용 방법을 소개해드리겠습니다. 대화 생성형A의 원조격, 오픈AI GPT-4o
오픈AI의 챗GPT는 홈페이지를 통해 웹 상에서 사용하거나, 스마트폰 애플리케이션으로 사용할 수 있습니다. 활용 방법은 오픈AI 홈페이지로 진입한 다음, 상단의 ‘Research’에서 GPT-4o를 누르고, 다음 페이지에서 ‘Try on ChatGPT’를 눌러서 시작합니다. 계정은 회원으로 가입하거나, 구글 계정을 연동하면 됩니다. 기본 상태에서는 GPT-3 버전을 무료로 사용할 수 있고, 한시적으로 최근 출시된 GPT-4o 모델을 무료로 사용할 수 있습니다.
활용 방법은 채팅 방식에 가깝습니다. 기본 상태에서 아래 ‘메시지 ChatGPT’에 질문을 입력하면 GPT가 답안을 제시하는 식입니다. 활용 방법은 단순 대화부터 문제 풀이는 물론 이미지나 오디오 전달, 물리학 문제 분석이나 고급 논문 분석까지 어떤 것이든 질문할 수 있습니다. 최근 무료 모델인 GPT-3에도 이미지나 오디오를 첨부할 수 있게 된 점도 장점입니다.
GPT의 가장 큰 장점은 생태계입니다. 가장 먼저 상용화된 대화형 AI인 만큼 전반적인 활용 사례나 학습 과정 등이 모두 GPT에 초점을 맞추고 있습니다. 기사를 통해 소개했던 지피터스 역시 GPT의 활용 방법을 중점적으로 다루고, 인터넷을 통해 찾아볼 수 있는 많은 대화형 생성AI의 활용 사례들이 챗GPT를 기반으로 진행됩니다. 따라서 대화형 생성AI를 공부한다면 오픈AI의 GPT를 기반으로 하는 게 가장 좋습니다.
또 다른 장점은 ‘GPT 탐색’ 기능입니다. GPT 서비스 상에서는 사용자가 훨씬 더 쉽게 서비스를 이용할 수 있도록 웹앱 형태의 기능들을 설치해 쓸 수 있습니다. 예를 들어 대화로 이미지를 생성하려면 프롬프트 구성에 공을 많이 들어야 하지만, ‘이미지 생성기’ 같은 GPT 앱을 설치하면 더 쉽고 구체적으로 만들 수 있습니다. 또 논문 분석이나 데이터 정리, 글쓰기. 프레젠테이션 및 다이어그램 제작, 대화 기능을 활용한 외국어 학습 등 다양한 기능이 제공됩니다. 앤스로픽 클로드, 3.5 소네트로 성능 강화
클로드는 오픈AI의 경쟁사인 앤스로픽(Anthropic)에서 출시한 생성형 AI입니다. GPT와 마찬가지로 텍스트 및 코드 생성을 통해 문서나 기술 분석 등 다양한 작업을 수행할 수 있고, 이미지 인식을 통한 코드 생성 등도 지원합니다. 클로드 역시 구글 계정을 통한 연동 및 휴대폰 본인확인만 거치면 최신 모델인 클로드 3.5 소네트를 무료로 이용할 수 있습니다.
원래 클로드는 실시간 채팅이나 번역, 비정형 대체어를 다루는 하이쿠(Haiku)가 있고, 일반 연산 및 작업에 최적화된 클로드 3 소네트(Sonnet) 모델이 제한적으로 무료 제공됩니다. 그 위로 더 빠른 고성능 컴퓨팅과 5배 빠른 속도를 갖춘 클로드 3 오푸스(Opus)는 월 20달러의 유료 서비스입니다.
그런데 6월 21일 자로 클로드 3.5 소네트가 출시되면서 기존 클로드 3 소네트가 3.5 소네트로 업그레이드됐고, 웹 및 iOS앱에서 무료로 쓸 수 있습니다. 클로드 3.5 소네트는 대학원 수준의 추론과 학부 수준 지식, 코딩 능력에서 기존 클로드 3 오푸스보다 두 배 빠른 속도를 제공하며, 이미지 인식 완성도가 크게 올라갔습니다. 불완전한 이미지를 제공하더라도 더 텍스트를 정확하게 인식하므로 소매, 물류 및 금융 분야 AI에서 더 강력한 성능을 발휘하게 됩니다.
클로드는 GPT와 달리 이미지 생성을 지원하지는 않고, 무료 계정이 한 번에 너무 많은 대화를 입력하면 시간 제약이 걸립니다. 하지만 클로드3는 GPT와 비교해 다국어 이해도가 뛰어나 한국어나 한문으로 문서를 창작하거나, 이해하고 작업하는 데 효과적입니다. 문법의 이해 능력도 뛰어나서 생소한 외국어에 대한 설명을 요구하는 등의 작업에 좋습니다. 다만 기본 사용량이 많지 않고, 모두 소진하면 약 3~4시간 정도 사용할 수 없다는 게 단점입니다. 구글 제미나이, 멀티모달 및 데이터 접근에 용이
구글 제미나이(Gemini)는 지난해 공개된 구글 바드에서 이름이 바뀐 구글의 생성형 AI입니다. 구글 검색에서 제미니를 검색하면 최상단에 뜨고, 구글 계정으로 로그인해 바로 쓸 수 있습니다. 제미니 역시 기본은 무료로 제공되고, 월 2만 9000원에 차세대 모델인 1.5 프로 및 2TB 스토리지, 구글 독스 지원 등이 포함된 ‘제미나이 어드밴스드’를 쓸 수 있습니다. 구글은 제미나이가 1.0 프로 모델에 비해 최대 87% 성능이 더 높다고 말하며, 문서 업로드도 지원합니다.
제미나이의 장점은 빠르고 다양한 답변입니다. 마이크로소프트 코파일럿은 창의적인, 균형 있는, 정밀한 세 개의 대화 스타일을 골라서 질문해야 하지만, 바드는 세 개의 답안을 모두 생성한 뒤 한 번에 제공합니다. 덕분에 특정 정보 등을 찾을 때 다양한 입장과 시각을 더 빠르고 쉽게 파악할 수 있죠.
또한 특정 시점까지만 정보를 제공하는 GPT, 클로드와 달리 구글 검색을 통해 실시간으로 정보를 검색합니다. 현재 무료 제공되는 GPT-4o도 인터넷에서 자료를 찾아오지만 무료 계정으로는 사용량이 부족한 반면, 구글 제미나이는 기본 모델도 인터넷에서 자료를 가져오는 게 장점입니다. 덕분에 최근에 있었던 일이나 소식, 정보 등을 훨씬 더 정확하고 빠르게 가져옵니다. 다만 잘못된 정보가 정설로 인정되는 경우에도 그대로 가져오므로 사용자가 직접 사실여부를 확인해야 할 순 있습니다. 무료 모델로는 부족하지만, 적절히 섞어 쓰면 이득
대다수 AI 사용자들이 GPT만 사용하는 경향이 있으나, 작업 성향에 따라 다양한 AI를 사용하는 것도 좋습니다. 특히 GPT-4o와 클로드 3.5 소네트 모두 기본 계정으로는 사용량이 많지 않고, 구글 제미나이는 문서 인식 등이 유료여서 아쉬운 측면이 있습니다. 여러 생성형 AI를 복합적으로 사용하면 무료로도 고급 기능을 더 많이 쓸 수 있고, 작업 구성에 따라 더 효율적인 결과를 얻을 수 있습니다. 셋 다 구글 계정으로 연동할 수 있는 점도 편리합니다. 지금까지 GPT 기본 계정만 사용해 왔다면, 앤스로픽 클로드 3.5 소네트, 구글 제미나이도 함께 써보는 건 어떨까요?
댓글 0