카카오브레인은 지난해 연말부터 초거대 인공지능(AI) 모델을 오픈소스로 공개하고 있다고 밝혔다.
카카오브레인은 이달 초 개발자 전용 웹사이트인 ‘카카오디벨로퍼스’에 자체 개발한 한국어 특화 초거대 AI 언어모델 ‘KoGPT’를 오픈 응용프로그램 인터페이스(API)로 공개했다. 지난해 11월에는 최대 오픈소스 커뮤니티 ‘깃허브’에 KoGPT를 공개하기도 했다. 최고 수준의 자연어처리 모델로 꼽히는 ‘GPT-3’의 한국어 특화 AI 언어모델인 KoGPT는 300억 개의 매개변수와 2000개 토큰의 한국어 데이터를 바탕으로 만들어졌다.
특히 올해 8월에는 ‘KoGPT’를 기반으로 시 쓰는 AI 시인 ‘시아’를 선보였다. 시아는 인터넷 백과사전, 뉴스 등을 읽으며 한국어를 공부하고 1만3000여 편의 시를 읽고서 작법을 배워 시를 쓸 수 있다. 8월 첫 번째 시집 ‘시를 쓰는 이유’를 출간했으며 현재 1쇄가 완판됐다.
카카오브레인은 언어뿐 아니라 AI 멀티모달 이미지 생성 모델의 고도화에도 힘쓰고 있다. 지난해 12월에는 이용자가 텍스트로 명령어를 입력하면 실시간으로 원하는 이미지를 만들어주는 이미지 생성 모델 ‘민달리’를 공개했고, 올해에는 업그레이드 버전 ‘RQ-트랜스포머’를 공개했다. 이 두 모델을 발전시켜 하나의 페르소나로 재탄생된 AI 아티스트 ‘칼로’는 1억2000만 장 규모의 텍스트-이미지 데이터셋을 학습해 이해한 문맥을 바탕으로 다양한 화풍과 스타일로 이미지 생성을 할 수 있다.
카카오브레인 관계자는 “지속적으로 차별화된 연구기술을 선도하며 사람 같은 AI를 만들어가는 한편, 기술과 연구결과물을 사회의 다양한 문제해결에 기여하고 다양한 분야에 접목해 나갈 것”이라고 밝혔다.
댓글 0