뉴스 트렌드 생활정보 International edition 매체

“비용 걱정 뚝”… 가성비 소형AI-양자AI가 뜬다

입력 | 2024-04-19 03:00:00

[새로운 인공지능 개발 경쟁]
“작은 AI가 맵다, 저비용 고효율”
고려대 개발 의료AI, 美기준 통과
법률-통신-금융 특화 모델 쏟아져




16일 서울 성북구 안암동 고려대 연구실. 컴퓨터학과 강재우 교수가 ‘관상동맥 스탠트 시술 후 2주가 지난 61세 남성 내원. 소변량 줄고 전신 불편감. 발에 그물 모양의 보라색 변색’이라고 환자의 상태를 입력했다. 그러자 강 교수 연구팀이 개발한 인공지능(AI) 언어모델 ‘미어캣’이 즉시 “콜레스테롤 색전증 증후군(Cholesterol Embolisation Syndrome)이 나타난 것 같다”고 답했다. 의사처럼 진단을 내린 것이다.

미어캣은 최근 미국 의사면허시험에서 74점을 받아 평균 합격선인 60점을 넘었다. 연구팀은 파라미터(매개변수)가 70억 개 이하인 소형언어모델(sLLM)로서는 최초로 시험을 통과했다고 설명했다. 파라미터는 인간으로 치면 정보를 학습하고 기억하는 ‘시냅스’의 역할을 한다. 강 교수는 “미어캣은 고급 사양 게임을 돌릴 수 있는 컴퓨터 1대만으로 가동이 가능하다”면서 “대형언어모델은 외부 클라우드를 사용하기 때문에 병원 등 개인정보에 민감한 기관들은 정보 유출을 우려하고 있지만, 소형언어모델은 기관 내부에 설치할 수 있기 때문에 이런 문제에서 자유롭다”고 말했다.

보안성이 높고 학습과 구동에 비교적 적은 비용이 드는 AI 소형언어모델 개발 경쟁이 치열하게 벌어지고 있다. 대형언어모델에 비해 가볍게 운용할 수 있는 이른바 ‘가성비 AI’에 대한 수요가 높아진 것이다. 대형언어모델이 세상 모든 영역을 다 아우른다면 소형언어모델은 법률, 의료, 통신, 금융 등 좁은 영역에서 특화된 서비스를 효율적으로 개발하고자 하는 기업에서 수요가 높다.

국내에서 대표적으로 소형언어모델 서비스를 개발 중인 기업은 업스테이지다. 107억 파라미터를 가진 ‘솔라’를 활용해 로앤컴퍼니, 케이뱅크 등과 함께 법률, 금융 등에 특화된 서비스를 개발하고 있다.

16일 1000억 원에 달하는 시리즈 B 투자 유치에 성공한 것도 효율적인 기업용 언어모델을 개발할 수 있는 기술력을 인정받았기 때문이다.

최근 업계의 최대 화두로 떠오른 AI 반도체 공급난과 전력난도 기업들이 소형언어모델에 집중하는 이유다. 업스테이지 관계자는 “현재 소형언어모델은 대형언어모델과 성능이 유사하면서도 학습 및 구동 비용이 10분의 1 수준으로 낮다”며 “데이터를 학습시키는 시간과 비용을 절감할 수 있다는 것이 소형언어모델의 가장 큰 장점”이라고 말했다.

미 스탠퍼드대 인간중심AI연구소의 ‘AI 인덱스 2024’에 따르면 1조 개 이상의 파라미터로 추산되는 오픈AI ‘GPT-4’의 훈련 비용은 약 7835만 달러(약 1077억 원)였지만 70억 파라미터 수준의 메타 ‘라마2’ 훈련 비용은 약 393만 달러(약 54억 원)에 불과했다.

국내 통신사들도 소형화에 주목하고 있다. KT는 2100억 개 이상 파라미터를 가진 대형언어모델 ‘믿음’을 70억∼400억 개 수준으로 경량화해 특정 분야에 제공할 계획이다. LG유플러스가 상반기 내 공개를 앞둔 언어모델 ‘익시젠’도 소형언어모델로 개발이 진행 중이다.

글로벌 빅테크들도 잇따라 소형언어모델을 공개 중이다. 구글은 앞서 2월 20억∼70억 파라미터 수준의 소형언어모델 ‘젬마’를 발표했다. 지난달 애플은 8000만∼30억 파라미터를 가진 소형언어모델 ‘렘’을 공개했다. 업계에서는 애플이 아이폰 등에 소형언어모델을 탑재해 인터넷 연결이 필요 없는 ‘온디바이스 AI’ 서비스에 나설 것으로 전망하고 있다. 삼성전자는 온디바이스 AI 스마트폰 ‘갤럭시 S24’에 자체 언어모델 ‘삼성가우스’의 일부 기능을 경량화해 탑재했다.



전남혁 기자 forward@donga.com