레이싱게임도 자율주행 시대? 인공지능, 인간 게이머 압도

소니AI 연구팀, 연구 결과 발표

차량 두 대가 시속 300km 속도로 직선 도로를 달리다가 180도로 꺾인 커브 길에 진입한다. 두 차량은 앞서거니 뒤서거니 달리더니 이 중 한 대가 재빠른 가속과 정지를 반복하며 다른 한 대를 제치고 빠르게 코너를 빠져나갔고, 곧 결승선을 통과했다. 현란한 움직임에 숨이 막힐 지경이다. 이 박진감 넘치는 주행은 세계 최고 모터스포츠 대회인 포뮬러원(F1)을 그대로 옮긴 레이싱게임 ‘그란투리스모(GT)’에서 이뤄진 것이다. 사람이 아닌 인공지능(AI) 시스템이 조작한 차량이 세계 최고 수준의 선수가 조작한 차량을 꺾은 연구였다.

피터 워먼 미국 소니AI 총괄이사 연구팀은 AI가 바둑이나 체스와 같은 보드게임, 스타크래프트 같은 전략 시뮬레이션 게임에 이어 레이싱게임에서도 인간을 압도했다는 연구 결과를 국제학술지 ‘네이처’에 10일 공개했다.

게임은 반복 학습과정을 거쳐 지식을 강화하는 AI의 성능을 끌어올리는 데 적합한 분야다. 바둑, 체스, 장기 같은 보드게임의 경우 한 수를 둘 때마다 생기는 경우의 수가 AI의 학습재료가 된다. 수많은 데이터를 통해 스스로 학습하고 최선의 수를 판단한다. 영국 AI기업 딥마인드가 개발한 바둑 AI 알파고는 2016년 이세돌 9단과의 대결에서 4-1로 인간을 압도했다. 2019년 딥마인드가 개발한 알파스타는 스타크래프트 같은 더 복잡한 시뮬레이션 게임에서도 인간을 이겼다.

연구팀은 ‘GT 소피’라 이름 붙인 AI 레이서에 그란투리스모 경주트랙 3개를 학습시켰다. 충돌 없이 레코드 라인을 따라 빠르게 운전하면 GT 소피에게 보상을, 라인을 벗어나거나 속도를 줄이면 벌칙을 부여했다. 가속과 제동, 추월, 진로가 차단됐을 때 대체 경로를 찾는 방법 등도 총 20대의 게임기에서 동시 학습했다.

그 결과 GT 소피는 학습한 지 약 이틀 만에 게임 내에서 상위 5%에 속했다. 9일간 모두 약 4만5000시간을 학습한 후에는 세계 최고 수준의 인간 레이서와의 대결에서 승리했다. 인간 레이서 4명이 한 팀을, AI 레이서 4명이 한 팀을 이뤄 자동차 총 8대가 호각을 다퉜는데 GT 소피팀이 104점을 획득하며 승리했다. 점수는 레이서의 최종 순위에 따라 합산한 것으로 인간 팀은 52점을 얻는 데 그쳤다. GT 소피와 인간 레이서 3명이 펼친 일대일 대결에서도 모두 GT 소피가 승리했다.

GT 소피는 아직 부족한 점도 존재한다. 인간 레이서는 수동 변속기 조작이 가능한 반면 GT 소피는 자동 변속기만 사용한다. 또 직선 주로에서 ‘슬립 스트림’을 뒤차에 허용하는 경우가 잦다. 슬립 스트림은 고속 주행 중인 자동차의 기압이 낮아진 상태의 영역을 말한다. 이 공간에 뒤차가 진입하면 공기 저항이 작아진다.

소니는 GT 소피를 향후 그란투리스모 게임 안에서 볼 수 있을 것이라고 밝혔으나 정확한 일정은 공개하지 않았다.

워먼 총괄이사는 “GT 소피는 자율항법이나 기초 AI 연구에 도움을 줄 것”이라며 “휴머노이드 로봇공학, 무인항공기, 자율주행차 같은 실제 시스템에도 적용할 수 있을 것”이라고 밝혔다.

고재원 동아사이언스 기자 jawon1212@donga.com