인공지능 환각 줄일 ‘그래프 신경망’에 주목

동아닷컴
입력 2024년 12월 6일 11시 29분

코멘트: 개

좋아요: 개

오픈AI의 챗GPT와 같은 인공지능 거대언어모델(LLM, Large Language Model)의 단점, 환각(Hallucination, 질문을 들은 인공지능이 사실과 전혀 다른 답변을 하는 현상)을 줄이려는 업계의 연구가 이어진다. 다양한 기술이 등장한 가운데 ‘그래프 신경망(GNN, Graph Neural Network)’이 새로운 대안으로 떠오른다. 이미 화학, 제약 부문에서 두드러진 성과를 낸 그래프 신경망은 활동 범위를 넓혀 초개인화 인공지능을 현실로 이끌 전망이다.

거대언어모델을 본 세계 IT업계는 큰 충격에 빠졌다. 언어를 이해하는 능력이 우수해 마치 사람과 이야기를 나누듯 자연스럽게 대화하는 점, 방대한 정보를 순식간에 다루면서 기존의 어떤 검색 엔진보다도 빠르고 정확하게 답변을 제시하는 점에 놀란 것. 덕분에 거대언어모델은 기존 산업과 자연스레 어우러져 불편을 줄이고 혁신을 일으킬 기술로 각광 받았다.

하지만, 산업에 적용하는 과정에서 거대언어모델의 단점이 나왔다. 환각이다. 거대언어모델의 대표인 챗GPT에게 ‘조선왕조실록에 기록된 세종대왕이 맥북 프로를 던진 사건을 알려줘’라고 질문하자, ‘15세기 세종대왕이 훈민정음의 초고를 작성하던 중, 문서 작성이 중단되자 분노해서 담당자에게 맥북 프로를 던진 사건입니다’라는 엉뚱한 답변을 내놓은 것이 유명한 환각 사례다.

거대언어모델은 질문에 담긴 단어와 문장을 분석하고, 확률과 통계에 기반해 가장 적합하다고 판단한 단어들을 조합해 답변을 만든다. 이 과정에서 거대언어모델은 질문의 전체 맥락과 흐름을 우선시하며, 개별 단어와 사건 간의 구체적인 상관 관계는 상대적으로 적게 반영한다. 그 결과 숫자 계산이나 세부 데이터 처리에서 종종 약점을 드러낸다.

이 문제를 해결하려고 인공지능 업계는 다양한 접근법을 연구한다. 이 가운데 새로운 가능성을 제시한 기술이 그래프 신경망이다.

그래프 신경망은 오래 전 제안된 개념이다. 하지만, 방대한 데이터와 복잡한 데이터간 관계를 학습하기 어려운 기술 한계 때문에 많이 쓰이지 못했다. 최근 딥러닝 기술과 병렬 컴퓨팅의 발전, 그래프 데이터를 효율 좋게 처리하는 새로운 알고리즘이 등장해 그래프 신경망의 가능성이 현실이 됐다. 이어 GPU(Graphics Processing Unit, 그래픽 처리 장치)와 같은 고성능 하드웨어가 등장했다. GPU가 대규모 데이터 처리 능력, 복잡한 데이터간 관계를 학습하도록 돕는 연산 능력을 제공한 덕분에 그래프 신경망은 점차 강력한 인공지능 기술로 자리 잡았다.

그래프 신경망 기술은 데이터와 데이터 사이 복잡한 관계를 그래프로 표현한다. 각 데이터는 노드(Node), 데이터와 데이터의 관계는 엣지(Edge)로 나타낸다. 이들 정보를 학습할 때 각 노드에 포함된 정보를 참고하므로, 개별 데이터를 분석하는 기존 방법을 넘어 데이터간 상호 작용과 연관성까지 이해한다. 이 장점을 앞세운 그래프 신경망은 분자 구조 예측, 소셜 네트워크 분석과 추천 시스템, 신약 개발 등 다양한 분야에서 활약하며 효용을 입증했다.

그래프 신경망은 데이터와 데이터 사이 복잡한 관계를 그래프로 표현한다 / 출처=엔바토엘리먼츠

그래프 신경망을 쉽게 이해하려면 전자상거래 플랫폼을 떠올리면 된다. 전자상거래 플랫폼은 사용자(노드)의 구매 기록과 선호도(정보)를 수집하고 사용자와 상품, 판매자 간의 관계(엣지)를 활용한다. 이를 통해 상품 리뷰와 평점 데이터를 분석하고 사용자의 취향에 맞는 상품을 추천한다. 예를 들어 사용자가 특정 카테고리의 상품을 자주 검색하거나 구매하면, 이 정보가 판매자와 상품과 연결되고 다른 사용자의 리뷰와 엮여 한층 개인화된 추천 결과를 만든다. 이것은 대형 쇼핑몰의 ‘추천 알고리즘’의 동작 원리이기도 하다.

그래프 신경망 기술은 환각 문제를 해결하기 위한 혁신 접근법으로 주목 받는다. 언어에서 단어들은 지프의 법칙(Zipf‘s law, 단어의 사용 빈도는 순위에 반비례한다는 원리)을 따른다. 그런데, 단어와 무관한 그래프 데이터 역시 지프의 법칙을 따르는 특성을 보인다. 이러한 공통점을 활용해 그래프 임베딩(현실 세계의 정보를 그래프로 옮기는 것)을 적용하면 언어 모델의 학습 과정을 최적화한다.

현실 세계의 데이터는 복잡하게 연결된 구조를 가진다. 이를 그래프 형태로 학습하면 비교적 적은 데이터와 연산으로도 언어 모델의 성능을 크게 높인다. 학습에 사용한 그래프 구조를 그대로 검증 모델로 활용하는 강화 학습 기반 모델을 사용하면, 거대언어모델의 환각 문제를 효과 좋게 해결할 가능성도 나온다.

그래프 신경망을 활용한 인공지능은 이미 주목할 만한 성과를 거뒀다. 2024년 노벨 화학상 수상자 데미스 허사비스(Demis Hassabis)가 이끄는 구글 딥마인드의 ’GNoME‘는 신소재 발견을 가속화하기 위해 설계된 딥러닝 기반 그래프 신경망 모델로, 첨단 기술 개발에 중요한 돌파구를 마련했다.

GNoME은 소재 데이터베이스를 기반으로 약 220만 개의 새로운 결정 구조를 예측했다. 이는 약 800년 동안 축적한 연구와 버금가는 규모와 정확도다. 그리고 새로운 결정 구조 가운데 약 38만 개가 안정적인 재료로 평가됐다. 이를 토대로 연구자들은 새로운 물질 구조 736개를 실험 합성하는데 성공했다. 인공지능 신소재 발견의 가능성을 입증한 것. 덕분에 GNoME은 배터리와 태양 전지, 컴퓨터 부품 등 다양한 첨단 기술 개발에 기여할 것으로 예상한다.

구글 딥마인드의 GNoME은 신소재 연구의 기폭제가 될 전망이다 / 출처=구글 딥마인드

업계는 그래프 신경망이 새로운 초개인화 서비스의 지평도 열 것으로 기대한다. 개인과 개인, 개인과 정보의 복잡한 데이터 구조를 원활하게 다루는 덕분이다. 특히 여행 부문에 큰 변화를 일으킬 것으로 예상한다. 그래프 신경망과 거대언어모델을 결합한 서비스를 쓰면, 소비자는 대화 몇 번 만으로도 개인 맞춤형 여행 일정을 짤 것이다.

예를 들어 소비자가 “일본으로 여행 가고 싶은데, 하루 예산은 10만 원이야”라는 간단한 질문을 하면, 그래프 신경망은 질문의 단어와 문맥을 토대로 가장 알맞은 일정과 여행 경로를 자동으로 만든다. 나아가 ▲실시간 피드백에 따라 여행 일정을 수정하고 관련 정보를 제공하는 기능 ▲현지 언어를 몰라도 원활히 소통하도록 돕는 번역 지원 ▲텍스트, 이미지, 음성 등 다양한 입력 방식에 따라 사용자에게 필요한 정보를 즉시 제공하는 기능 ▲여행 일정에 맞춘 최적화된 동선 설계와 여행 지원 프로그램 기반 비용 설계 등 다양한 초개인화 서비스도 기대 가능하다.

그래프 신경망으로 인공지능 여행 초개인화 서비스를 제작 중인 김무철 중앙대학교 교수는 “그래프 신경망 기술로 도메인 특화형 환각 없는 검색 모델, 제한된 정보 환경에서의 최적화 분류 모델, 특정 도메인에서 상용 거대언어모델 대비 비용을 70% 절감한 거대언어모델 설계 등 다양한 연구를 수행했다.“며, ”이들 기술을 여행 서비스에 적용하면, 소비자들이 정보를 찾고 정리하는 과정을 생략하고 여행 계획을 단시간에 세우도록 도울 것이다. 당일 즉흥 여행을 떠난 사람이 인공지능 여행 초개인화 서비스를 활용, 철저하게 여행을 준비한 사람과 비슷한 만족을 누릴 날이 머지 않았다.“고 밝혔다.

IT동아 차주경 기자(racingcar@itdonga.com)