인간의 지성에 도전하는 초거대 AI[정우성의 미래과학 엿보기]

동아일보
입력 2021년 6월 14일 03시 00분

인류가 쓰는 언어는 원래 하나였는데, 바벨탑을 본 신이 사람들을 흩어놓고 각기 다른 말을 쓰게 하였다는 이야기가 성경에 있다. 정말 맞는 이야기인지 여부를 떠나, 서로 언어가 다른 탓에 불편한 점이 한두 가지가 아니다. 그래서인지 미래에는 기술의 도움으로 외국인뿐 아니라 외계인과도 어려움 없이 대화할 것이라는 공상과학(SF) 영화나 소설이 많다.

구글이나 네이버 등 정보기술(IT) 기업은 이미 상당한 수준의 번역 서비스를 제공한다. 아직은 영화에서처럼 완벽한 건 아니다. 특히 영어나 프랑스어 등에 비해 한국어의 번역은 더욱 만족도가 떨어졌다. 번역은 인공지능(AI)이 한다. 그리고 AI는 아주 많은 자료를 사전에 학습한다. 영어나 프랑스어는 학습할 자료가 많지만, 한국어는 그렇지 않았다. 가령 미국과 프랑스에서 동시에 발행되는 신문이 있다. 똑같은 기사가 미국에서는 영어로, 프랑스에서는 프랑스어로 실린다. 몇 달 치 신문기사만 쌓여도 인공지능이 학습할 양질의 자료가 많이 쌓인다.

가정에 보급되고 있는 AI 스피커도 번역을 한다. 원하는 음악을 틀어주고 뉴스도 들려주며, 묻는 말에 대답도 한다. 다만 가끔 의도를 파악하지 못하고 엉뚱한 답을 한다. 비슷한 질문을 하더라도 상황에 따라, 그리고 묻는 사람에 따라 원하는 답이 다른 탓이다. 여전히 이런 건 AI가 사람을 완전히 대신하지 못해서다. 그래서 예전에는 인터넷 검색엔진에서 어떤 답을 보여줄지 사람이 결정하기도 했다. 주로 많이 묻는 질문을 중심으로 사람들이 원하는 결과를 미리 분류해둔다. 즉 검색 결과 뒤에는 사람의 손길이 있었다. 차차 검색하는 양이 늘어나고 인터넷을 돌아다니는 정보가 많아지면서 일일이 분류하는 것이 불가능해졌다. 그래서 컴퓨터가 직접 가장 질문의 의도에 맞는 답을 찾도록 한다. 어떤 회사가 더 좋은 방법을 찾는지가 중요했다. 가장 좋은 방식을 찾아낸 구글이 전 세계의 검색엔진을 석권한 이유다.

지식은 학습으로 이루어진다. 이 과정에서 수많은 데이터를 뇌 속에 축적한다. 정보화시대가 되면서 데이터는 더욱 많아졌다. 태어난 도시를 떠나지 않고 평생 매일 규칙적인 일상생활을 한 것으로 유명한 철학자 칸트가 생애 동안 읽은 책은 상당히 많다. 그런데 칸트가 평생 본 책에 있는 정보보다 요즘 하루 만에 인터넷에 쏟아지는 데이터가 훨씬 많다. 데이터에 담겨 있는 지식은 인류의 역사를 거치며 축적된다. 과거의 지식이 사라지지 않고 그 위에 얹혀지는 것이니, 갈수록 알아야 할 것이 많아진다. 옛날 교과서보다 지금의 교과서가 어려운 이유이다. 이제는 아무리 노력해도 세상의 정보를 익히기에는 삶이 허락하는 시간이 턱없이 부족해졌다.

SNS에서 한때 유행했던 숨은 동물 사진 찾기 놀이. 인공지능(AI)은 강아지와 빵 사진을 보고 잘 구별하지 못하는 경우가 있다. 아직은 정보와 지식을 연결하고 유추하는 기능이 부족한 것으로 보인다. 사진 출처 인스타그램

컴퓨터는 사람보다 훨씬 빨리 많은 지식을 쌓을 수 있다. 더군다나 나이를 먹지 않으니 뇌의 능력이 떨어지는 일도 없다. 이제 컴퓨터에 엄청나게 많은 양의 강아지 사진을 보여주고 학습을 시킨다. 그리고 강아지와 비슷한 사진을 여러 장 두고, 어떤 것이 강아지인지 고르게 한다. 한 사람이 평생 봐도 다 못 볼 정도의 사진을 본 인공지능이지만, 어린아이도 구별하는 빵과 강아지 사진을 잘 구별하지 못하는 경우가 있다. 왜 여전히 인공지능이 사람의 지성을 따라오기엔 한계가 많은 것일까? 지식이란 끊임없이 위로 쌓기만 하는 것이 아니다. 수많은 지식을 서로 연결시키고 확장하며 유추한다. 지금까지는 사람이 강아지를 찾는 방법을 모두 컴퓨터에 가르쳐주면, 결국 인공지능이 강아지를 찾을 수 있을 거라 여겼다. 어쩌면 우리도 미처 깨닫지 못한 방법으로 강아지를 찾아냈던 건 아닐까? 그래서 세상에 존재하는 모든 방법을 컴퓨터에 가르쳐주지 못한 건 아닐까? 최근에는 강아지를 찾는 방법을 찾는 것마저도 AI가 하도록 한다.

한국어의 맥락을 읽어내는 네이버 하이퍼클로바와 대화하는 모습. 비교적 자연스러운 대화가 가능하다. 사진 출처 네이버

최근 네이버는 ‘하이퍼클로바’라는 서비스를 발표했다. 우리말을 가장 잘하는 첫 초거대 AI라고 한다. 이 외에도 KT, LG 등이 초거대 AI 개발에 뛰어들었다. 초거대 AI는 사람이 처리하기에는 도저히 불가능한 수준의 데이터를 분석한다. 엄청난 속도의 컴퓨터가 동원된다. 자료 사이의 연결 관계를 학습하고, 이를 종합적으로 판단하고 행동한다. 서서히 사람의 뇌와 비슷한 일을 하는 인공지능이 되어간다.

우리나라에서 개발 중인 서비스는 영어보다는 한국어를 집중적으로 학습시킨다. 그래서 자연스러운 대화가 가능한 인공지능 시대가 열렸다. 특히 초거대 AI는 과거에 나누었던 대화를 끄집어내어 대화의 맥락과 숨은 의도를 파악한다. 책이나 문서뿐 아니라 비디오, 오디오 등 다양한 형태의 자료가 활용된다. 물론 영어권의 서비스도 가만히 있는 건 아니다. 구글 역시 지난달 ‘람다’라는 새로운 인공지능 시스템을 발표했다.

과연 초거대 AI는 우리와 가벼운 대화만 하는 것일까? 그렇지 않다. 가령 인터넷에서 상품 판매하는 분도 돕는다. 인터넷에 게시된 상품 소개와 광고를 대신해준다. 예전에는 대형 광고대행사에 맡겨야만 했던 소비자 성향 분석과 맞춤형 광고 제작을 제공한다. 이뿐 아니라 백신이나 신약 개발에도 AI의 활약이 기대된다. 각 물질의 특성을 이미 알고 있는 AI가, 이들을 합성했을 때 어떤 반응을 보이고 병에 맞서 어떤 효과를 보일지 미리 계산해낸다. 심지어 그간 발표된 논문과 특허를 모두 학습시키면, 과학자보다 뛰어난 연구 성과를 낼 거라는 기대도 있다. 지난주 구글은 반도체를 설계하는 AI를 발표했다. 자신에게 꼭 필요한 반도체를 만드는 능력인데, 사람으로 치면 자신에게 필요한 뇌를 직접 설계하여 지능을 향상시키는 셈이다. 인간 지성을 향한 AI의 도전이 계속되고 있다.

정우성 포스텍 산업경영공학과 교수

#언어 #바벨탑 #성경 #번역 서비스 #ai 스피커 #정보화시대 #네이버 #하이퍼클로바 #초거대 ai