[인공지능, 겁없는 진화]
이세돌 9단과의 대국에서 연승을 거둔 인공지능(AI) ‘알파고’의 태생에 대한 관심도 커지고 있다. 특히 구글이 미국 회사임에도 불구하고 대국장의 알파고 측 자리에는 영국 국기가 걸려 알파고의 정체에 궁금증이 더해졌다.
영국 국기가 걸린 이유는 알파고를 개발한 AI 스타트업 ‘딥마인드 테크놀로지’가 영국에서 창립됐기 때문이다. 실제로 대국장에서는 영국식 영어 발음이 자주 들린다. ‘알파고의 아버지’라고 불리는 데미스 허사비스 공동창업자 겸 최고경영자(CEO)도 1976년 영국에서 태어났다.
어린 시절 체스 영재로 주목받았던 그는 17세 때 시뮬레이션 게임 ‘테마파크’를 개발해 수백만 개를 판매하는 성과를 거뒀다. 영국 케임브리지대 컴퓨터공학 학사 과정을 마친 뒤에는 두뇌 게임계의 올림픽인 ‘마인드 스포츠 올림피아드’에서 다섯 차례 세계 챔피언 자리에 올랐다. 2009년 영국 유니버시티 칼리지 런던(UCL)에서 인지신경과학 박사학위를 취득하고 2010년 딥마인드 테크놀로지를 설립했다. 이후 미국 매사추세츠공대(MIT)와 하버드대에서 박사 후 연구원 과정을 밟으며 알파고 개발의 초석을 다졌다.
이 시기 그는 바둑에 강화학습(딥러닝)을 적용하는 연구에 빠져 들었다. 이 과정에서 알파고의 ‘형’ 격인 바둑 프로그램 ‘모고(MoGo)’가 탄생했다. 모고는 가로세로 9×9 바둑의 고수다. 2008년에는 한국의 김명완 9단과 9점 접바둑, 즉 모고가 먼저 바둑돌 9개를 놓고 두는 대국에서 승리를 거두기도 했다.
구글은 2014년 1월 4억 파운드(약 6830억 원)에 딥마인드 테크놀로지를 인수한 뒤 구글 딥마인드로 사명을 바꿨다. 이후 알파고 개발은 본궤도에 올랐다. 실버 박사는 모고 개발 경험을 되살려 바둑에서 돌을 놓을 때마다 경우의 수를 모두 따지기보다는 이길 확률이 높은 경우의 수만 골라내는 전략을 세웠다.
첫 번째 전략은 온라인 바둑 서버 ‘KGS Go’에서 아마 5단급 사용자들의 기보 16만 건을 보고 이들이 바둑돌을 놓는 위치(착점) 3000만 건을 토대로 강화학습을 해 고수들이 둘 만한 곳을 예측한 것이다. 여기에 ‘셀프 대국’을 통해 더 나은 전략을 찾았다. 승률이 가장 높을 만한 곳을 찾는 전략을 더하면서 ‘인류(人類) 최고수’를 꺾는 실력을 보유하게 됐다.
알파고의 실체를 궁금해하는 사람이 많지만 실체를 보긴 어렵다. 알파고는 1202개의 중앙처리장치(CPU)를 병렬로 연결한 분산형 컴퓨터이기 때문이다. 이마저도 어느 한 곳에 있지 않고 여기저기에 흩어진 채 인터넷으로 연결돼 있는 ‘클라우드 컴퓨팅’으로 작동한다. 다만 이 덕분에 알파고는 인터넷이 연결된 곳이라면 전 세계 어디에서라도 대국을 치를 수 있다.
이재웅 동아사이언스 기자 ilju2@donga.com