메타-구글-佛 미스트랄AI 등 막대한 개발 비용에도 개방형 채택 서비스 이용 늘려 주도권 장악 의도 개발자들 ‘집단지성’ 활용 장점도
글로벌 빅테크들이 엔비디아에 대항하기 위한 인공지능(AI) 칩 공동 연구개발에 나설 뿐 아니라 AI 모델을 무료로 공개해 누구나 이용할 수 있게 하려는 움직임도 보이고 있다. ‘공짜 AI’를 내놓는 배경에는 스스로 AI를 개발할 수 없는 스타트업 등을 자체 생태계로 포섭해 폐쇄형 생태계를 갖춘 오픈AI에 맞서 헤게모니를 쥐겠다는 의도로 풀이된다.
2일 정보기술(IT) 업계에 따르면 페이스북 모회사 메타는 4월 대규모언어모델(LLM) ‘라마3’를 출시했다. 각종 정보를 공개했기에 개발자가 홈페이지 등에서 무료로 내려받을 수 있고, 데이터를 추가해 각 기업 목적에 맞는 ‘맞춤형 AI’를 만들 수 있다. 메타는 기존 라마와 라마2도 모두 개방형 모델로 내놨다.
라마3는 출시 일주일 만에 120만 회 이상 다운로드됐고, 개발자는 이를 기반으로 600개 이상의 파생 모델을 만들었다. 스위스 연방공과대 연구진이 의료 데이터를 학습시켜 만든 의료 특화 LLM ‘메디트론’이 라마를 이용한 대표적 사례다.
서민준 KAIST AI대학원 교수는 “현재 (학계에서) 개방형 모델 활용은 ‘필수’가 됐다”며 “라마에 새로운 기능을 넣거나, 라마를 분석해 AI의 작동 방식을 규명하는 등의 연구를 진행 중”이라고 말했다. 국내 AI 스타트업인 업스테이지, 매스프레소 등이 라마2를 기반으로 개발한 수학 특화 언어모델 ‘매스GPT(가칭)’는 올해 초 각종 언어모델의 수학능력평가인 ‘MATH 벤치마크’서 오픈AI의 GPT-4 등을 꺾고 1위에 오르기도 했다.
구글도 2월 개방형 AI 모델 ‘젬마’를 공개하며 개방형 모델 경쟁에 합류했다. 지난달 14일(현지 시간) 구글은 젬마가 출시 후 몇 달 만에 수백만 건의 다운로드를 기록했으며, 차세대 모델인 ‘젬마2’를 출시할 예정이라고 발표했다. 프랑스의 ‘국민기업’이라 불리는 AI 스타트업 미스트랄AI도 지난해 AI 모델을 개방형으로 공개했다.
구글 젬마를 활용한 특화 서비스 개발을 준비 중인 스타트업 레블업의 신정규 대표는 “폐쇄형 모델은 개발사의 클라우드를 활용하기 때문에 기업들로선 보안 문제를 항상 걱정해야 하지만 개방형 모델은 보안 문제에서 자유롭다”고 말했다.
비용 절감도 장점이다. 라마3 학습에는 엔비디아의 최신 그래픽처리장치(GPU) H100 2만4000여 장이 사용된 것으로 알려졌다. H100 개당 가격이 5500만 원 전후인 것을 감안하면 약 1조3200억 원이 들었다. 그걸 무료로 사용할 수 있는 것이다.
전남혁 기자 forward@donga.com