인공지능(AI) 기술 기업 업스테이지가 올 11월 출시 예정인 차세대 대형언어모델(LLM) ‘솔라 프로(Solar Pro)’의 초기 테스트용 모델 ‘솔라 프로 프리뷰(Solar ProPreview)’ 버전을 오픈소스 및 무료 API를 통해 전면 공개한다고 11일 밝혔다.
업스테이지는 솔라 LLM 시리즈의 상위 모델 솔라 프로의 프리뷰 버전을 오픈소스로 공개하는 한편, API 호출 비용까지 무상 지원할 예정이다. 프리뷰버전은 영어만 지원하며, 입력 토큰 수는 4096자로 제한된다.
업스테이지에 따르면 솔라 프로는 220억 매개변수를 갖춰 기존 ‘솔라 미니’(107억) 대비 두 배 이상 커지고 성능이 대폭 향상됐다. DUS(깊이 확장 스케일) 기술 등 자체 LLM 모델링 방법론을 고도화해 1개의 그래픽처리장치(GPU)에서 구동이 가능한 수준으로 경량화에 성공했다.
또한, 인문학뿐만 아니라 과학·기술·공학·수학(STEM) 종합 지식을 평가하는 ‘MMLU Pro’, 지시 이행 능력을 평가하는 ‘IFEval’ 등 최신 LLM 벤치마크(성능 평가) 지표에서 솔라 미니보다 평균 51% 이상 높은 성능을 보였다.
업스테이지 관계자는 “마이크로소프트의 ‘파이(Phi)-3 미디엄(Medium)’, 메타의 ‘라마(Llama)3.1 8B’, 미스트랄AI-엔비디아 ‘네모(NeMo) 12B’, 구글 ‘젬마(Gemma)2 27B’ 등 유사 사이즈의 빅테크 모델 성능을 모두 뛰어넘은 것”이라며 “매개변수가 3배 이상 큰 ‘라마 3.1 70B’ 등 다중 GPU를 요구하는 모델과 유사한 수준”이라고 자평했다.
김성훈 업스테이지 대표는 “솔라 프로는 자체 기술로 개발한 세계 최고 수준의 LLM”이라며 “글로벌 AI 시장 공략에 박차를 가할 것”이라고 말했다.
댓글 0