문헌 4500만건 등 학습량 4배 증가
분야별 최대 90% 전문 데이터 학습
국내 첫 이중언어-멀티모달 상용화
신소재-신물질-신약개발에 활용
“LG 엑사원(EXAONE)은 전문성과 신뢰성에 특화된 인공지능(AI)입니다. 파트너십을 통해 확보한 특허, 논문 등 약 4500만 건의 전문 문헌과 3억5000만 장의 이미지를 학습했습니다.”
배경훈 LG AI연구원장은 19일 서울 강서구 마곡동 LG사이언스파크에서 열린 초거대 AI ‘엑사원 2.0’ 발표회에서 이같이 밝혔다. 이날 LG는 2021년 12월 처음 선보였던 엑사원이 1년 반 동안 어떻게 진화했는지 설명했다. 엑사원 2.0은 한국어, 영어가 지원되는 이중언어 모델이면서 텍스트, 이미지 모두 처리 가능한 멀티모달 AI이다. 기존 버전의 엑사원과 비교해 학습 데이터 양이 4배 이상 늘어 추론 능력 등 성능이 향상됐다. 배 원장은 “이중언어 및 멀티모달 모델을 함께 상용화한 기업은 LG가 국내 최초”라며 “세상의 지식을 이해하고 발견하는 상위 1% 전문가들을 위한 AI다”라고 했다.
LG는 2시간 가까이 진행된 행사에서 ‘신뢰성’과 ‘전문성’을 끊임없이 강조했다. AI가 그럴듯한 표현으로 잘못된 정보를 전달하는 환각(hallucination) 현상을 최소화했다는 것이다. AI, 화학, 바이오, 의료, 금융 등 각 영역별로 학습 데이터의 50∼90%를 공신력 있는 전문 데이터로 채웠다고 한다. 이화영 AI 사업개발유닛장은 “타사 AI는 일반적으로 공유된 데이터를 중심으로 학습하지만 엑사원은 전문 데이터에 집중했다. 문헌 4500만 건은 글로벌 최대 규모의 학습 데이터”라고 설명했다.
LG는 각 산업 현장에 당장 적용할 수 있는 엑사원 2.0 기반의 3대 플랫폼도 공개했다.
전문가용 대화형 플랫폼 ‘엑사원 유니버스’는 챗GPT나 구글 바드와 유사하다. 다른 생성형 AI가 데이터 기반의 답변을 곧바로 생성한다면 유니버스는 사전 학습 데이터는 물론이고 최신 정보까지 비교, 분석하면서 답변을 추론한다. 결과값과 관련한 출처도 함께 제시된다. 31일 그룹 내 AI 연구자 대상으로 서비스를 시작하고 9월부터는 관심 있는 임직원도 쓸 수 있도록 할 계획이다.
‘엑사원 디스커버리’는 신소재·신물질·신약 개발에 활용될 예정이다. 사람이 무수히 실험과 검증을 반복하던 것을 AI 시뮬레이션이 대체할 수 있다. 이날 행사에서 LG는 엑사원을 통해 불소(F) 6개로 구성된 배터리 원재료 화합물을 불소 4개로 바꾸는 과정을 보여줬다. 한세희 MI 랩장은 “엑사원 디스커버리를 활용하면 마치 내비게이션을 켜고 소재를 개발하는 것과 같다”며 “1만 회가 넘던 합성 시행착오를 수십 회로 줄이고 연구개발 기간도 평균 40개월에서 5개월로 단축시킬 수 있을 것”이라고 말했다.
인간의 창의적 발상을 돕는 ‘엑사원 아틀리에’는 이미지를 언어로 표현하고 언어는 이미지로 시각화할 수 있는 플랫폼이다. 제품 마케팅, 광고, 소셜네트워크서비스(SNS)상의 문구 제작 등에 활용할 수 있다. 디스커버리는 4분기(10∼12월) 화학 및 바이오 연구진을 대상으로 제공하고 아틀리에는 3분기(7∼9월) 내 그룹 안팎의 전문 디자이너에게 서비스할 예정이다.
댓글 0