챗GPT가 못 푸는 문제도 척척… 생성형 넘어 ‘추론형 AI’ 성큼

동아일보
입력 2024년 12월 27일 03시 00분

코멘트: 개

좋아요: 개

오픈AI, 추론형 AI 모델 ‘o3’ 공개… 수학-물리학 등 문제 대거 학습
인간처럼 사고의 세분화 거쳐 각각의 답 도출해 최종 답 추론
사실 검증 없이 거짓 답변하는 챗GPT ‘AI 환각’ 등 개선 기대
구글-메타 등도 개발 뛰어들어

20일 홍유 렌 오픈AI 연구원, 마크 첸 오픈AI 수석 부사장, 샘 올트먼 오픈AI 최고경영자(왼쪽부터)가 온라인 간담회를 열고 고급 추론형 AI 모델 ‘o3’를 공개했다. 오픈AI 제공

챗GPT 개발사 오픈AI가 20일 새로운 추론형 인공지능(AI) 모델인 ‘오픈AI o3(오스리)’를 공개했다. 핵심은 수학이나 과학과 관련된 문제를 스스로 생각하고 추론한 뒤 해결책을 찾는다는 점이다. 기존 AI 모델의 사고력을 높여 궁극적으로 인간 지능에 가까운 범용 인공지능(AGI)에 한 걸음 더 다가선 것으로 평가된다.

오픈AI의 o3 공개를 계기로 구글, 메타 등 빅테크 기업들은 4차 산업혁명의 ‘게임체인저’가 될 AGI를 내놓기 위해 기존 AI의 ‘환각(hallucination)’ 현상을 줄이는 추론형 AI 개발에 적극 나설 전망이다.

● 수학·과학 추론에서 압도하는 o3

o3는 9월 오픈AI가 출시한 추론형 AI 모델 ‘o1’의 업그레이드 버전이다. o3를 추론에 특화시키기 위해 논리적인 능력이 필요한 수학·물리학 등 문제를 대거 학습시킨 것으로 보인다. 오픈AI는 “o3는 응답하는 데 몇 초∼몇 분이 걸리지만 o1에 비해 물리학·과학·수학과 같은 분야에서 더 신뢰할 수 있다”라고 강조했다.

실제로 o3는 성능 측정 벤치마크에서 다른 모델을 압도한다. 올해 미국초청수학시험(AIME)에서 o3는 단 한 문제만 틀려 96.7%의 점수를 기록했다. 대학원 수준의 생물학, 물리학, 화학 문제 테스트(GPQA Diamond)에서는 87.7%의 성과를 거뒀다. 오픈AI에 따르면 자사의 최신 AI 모델인 ‘GPT-4o’는 AIME를 12%만 풀 수 있다.

o3는 o1과 마찬가지로 ‘생각의 사슬(chain of thought)’이라는 이름이 붙은 논증(reasoning) 기능을 갖추고 있다. 생각의 사슬이란 사람의 사고 과정을 모방한 기능으로 복잡한 작업을 여러 개의 하위 단계로 나눠 사고하는 것을 말한다. 수학 문제를 풀 때 문제의 의미가 뭔지 이해하고, 문제를 풀기 위해 어떤 과정을 거쳐야 하는지 고려해 차근차근 각각의 답을 도출해 최종 답을 내놓는 방식이다.

o3는 챗GPT처럼 학습한 대규모 언어 데이터에서 패턴을 찾아 답변을 내는 ‘확률적 언어 모델링’ AI 모델과 작동 방식이 아예 다르다. AI를 이용해 수학을 연구하는 이규환 미국 코네티컷대 수학과 교수는 “챗GPT는 논리적인 사고를 하지 않고 확률에 기반해 답변을 하기 때문에 환각 현상을 일으켜 답변의 신뢰도를 떨어뜨린다”면서 “인간의 지적 능력을 구성하는 요소가 ‘언어 능력’과 ‘논리적 사고’인데 추론형 AI가 논리적 사고를 보완해 줄 수 있다”고 말했다. 국내 1세대 AI 연구자인 김진형 KAIST 명예교수는 “오픈AI는 수학 문제를 푸는 단계 하나하나를 AI에 학습시켜 추론형 AI를 만들었을 것”이라고 설명했다. 수학 문제를 이용해 오픈AI의 부족한 사고력을 높여주는 것이다.

다만 o3는 챗GPT에 비해 답변을 내놓는 시간이 더 길다. 대답하기 전 여러 단계의 사고 과정을 거치기 때문이다. o3에서는 o1과 달리 ‘추론 시간 조정’이 새롭게 도입됐다. 이용자는 o3의 추론 시간을 ‘낮음, 중간, 높음’으로 설정할 수 있다. 추론 시간이 길수록 성능은 더 좋아진다.

● AGI 개발 경쟁으로 이어질 듯

오픈AI는 o3를 기반으로 인간의 지능과 유사하거나 그 이상의 지능을 갖춘 AGI 개발에 한 단계 더 나아간다는 계획이다. AGI가 보편화되면 연구부터 금융, 생산, 예술, 안보 등 인류 사회의 모습이 급격하게 바뀔 것으로 예상된다. 세계적인 빅테크 기업들이 추론형 AI 모델을 개발하는 데 앞다투어 뛰어드는 이유다. 구글은 10일 추론 능력이 강화된 AI 모델 ‘제미나이 2.0’을 발표했다. 메타도 내년 초에 추론 기능이 강화된 새로운 모델 ‘라마4’를 출시할 예정이다.

하지만 이 같은 추론형 AI를 학습시키기 위한 문제는 충분치 않은 것으로 보인다. 이 교수는 “AI가 수학적 사고력을 갖추려면 수학 문제를 AI가 이해할 수 있는 코드로 바꿔 ‘엄밀하게’ 이해시켜야 하는데 코드로 바꾸기 쉽지 않아 데이터 자체가 충분하지 않다”고 말했다. 수학에서 쓰이는 복잡한 개념과 용어를 AI가 이해할 수 있는 코드로 바꾸는 작업 자체가 까다롭기 때문이다.

오픈AI도 AI 추론 능력을 높이기 위해 수학 문제 수급에 적극 나서고 있다. 23일 미국 월스트리트저널(WSJ)도 오픈AI가 AI 모델의 사고 수준을 높이기 위해 필요한 데이터가 충분하지 않아 소프트웨어 엔지니어나 수학자들을 고용해 새로운 데이터를 직접 만들고 있다고 보도했다. 전 세계적으로 수학 문제를 AI에 학습시키기 위해 코드화하는 연구가 미국, 영국, 캐나다 등에서 활발히 진행되고 있다.

#챗GPT #추론형 AI #오픈AI #o3

이채린 동아사이언스 기자 rini113@donga.com