AI, 큐브까지 인간 눌렀다

동아일보
입력 2019년 7월 22일 03시 00분

코멘트: 개

좋아요: 개

코멘트: 개

인공지능(AI)이 인간을 제압하는 게임이 점차 늘고 있다. 바둑과 체스, 장기는 이미 AI가 일찌감치 인간을 눌렀다. 올해 1월에는 알파스타라는 AI가 ‘스타크래프트2’ 같은 전략 게임에서 프로게이머를 상대로 10승 1패를 기록하며 인간을 압도했다. 올해 5월에는 ‘포더윈’이라는 AI가 3차원 공간을 돌아다니며 총을 들고 싸우는 복잡한 게임인 ‘퀘이크 3 아레나’에서도 인간 고수를 이기기도 했다.

AI가 정복한 게임의 숫자가 늘어나는 데는 아이러니하게도 게임의 복잡성 때문이다. 바둑, 체스, 장기 같은 보드 게임의 경우 여러 수를 두면서 게임이 진행된다. 한 수를 둘 때마다 경우의 수가 발생하며 이는 AI의 학습 재료가 된다. 여러 수에 걸쳐 쌓인 데이터를 통해 스스로 학습하고 상황을 판단하는 것이다. 반복 과정을 거쳐 AI의 지식은 계속 강화된다. 강화된 지식을 확보한 AI는 게임 분야 외에 헬스케어, 보안, 연구 등 다양한 분야에 사용할 수 있는 범용 AI 개발의 기반이 된다. 게임이 복잡해지면 복잡해질수록 AI가 얻는 지식의 범위가 넓어지고 범용성도 함께 확대된다. 이런 이유로 게임을 학습하는 AI 연구가 진보하고 있다.

최근 AI가 정복한 게임 영역이 또 하나 늘었다. 피어 발디 미국 어바인 캘리포니아대 컴퓨터공학과 교수 연구팀은 루빅 큐브를 약 1초 만에 풀어내는 AI ‘딥큐브에이(DeepCubeA)’를 개발했다는 연구 결과를 국제학술지 ‘네이처 머신인텔리전스’ 15일자에 발표했다.

루빅 큐브는 퍼즐의 일종으로 6가지 색깔의 정육면체가 모여 만들어진 큰 정육면체 6면을 각각 하나의 색깔로 맞춰야 하는 게임이다. 1974년 헝가리의 건축학 교수인 루비크 에르뇌가 처음 개발해 시판됐다. 보통 한 큰 정육면체에 9개의 작은 정육면체가 존재하며 약 4300경의 경우의 수가 발생한다. 6면의 색깔이 같아지는 경우는 오직 하나뿐이다. 인간이 가장 빨리 루빅 큐브를 풀어낸 기록은 3.47초다.

연구팀은 루빅 큐브를 빠르게 풀어내는 AI를 개발하기 위해 100억 개의 루빅 큐브 조합을 보여주고 30회 이하로 퍼즐을 풀어내는 연습을 시켰다. 그런 다음 이런 과정을 1000번 반복하며 모든 조합을 딥큐브에이에 학습시켰다. 그 결과 딥큐브에이는 100% 모든 루빅 조합을 풀어냈으며 해법을 찾기 위해 평균 1.2초가 소요됐다. 인간의 경우 일반적으로 50회의 움직임이 필요하지만 딥큐브에이는 평균 20회의 조작으로 루빅 큐브를 맞췄다.

발디 교수는 “AI가 바둑과 체스 분야에서 인간 최고 실력자를 이겼지만 루빅 큐브 같은 어려운 퍼즐은 그전까지 해결하지 못했다”며 “루빅 큐브의 해법은 상징적, 수학적, 추상적 사고에 기반을 두고 있는데 AI의 능력은 점점 더 인간의 사고 능력에 가까워지고 있다”고 말했다.

고재원 동아사이언스 기자 jawon1212@donga.com

#인공지능 #루믹 큐브 #알파스타