뉴스 트렌드 생활정보 International edition 매체

[동아광장/이광형]구글 ‘알파고’와 대국할 이세돌 9단에게

입력 | 2016-02-12 03:00:00

인간 영역 점령해가는 컴퓨터… 체스, 퀴즈 이어 바둑 도전
컴퓨터가 李 9단 기보 학습해… ‘가상 이세돌’과 24시간 훈련
완벽한 수읽기 이기려면 ‘과거 이세돌’ 방식 버리고 허 찌르는 창의력으로 승부를




이광형 객원논설위원·KAIST 문술미래전략대학원장

척사광의 칼끝은 역시 빈틈이 없었다. 무휼은 “검술은 완벽해도 칼을 잡은 사람에게는 약점이 있기 마련”이라는 스승의 말이 생각났다. 무휼은 칼을 버렸다. 그리고 맨몸으로 척사광에게 달려들었다. 뜻밖의 상황에 당황하는 척사광을 껴안고 절벽으로 굴러떨어졌다. 당대 최고의 무사인 척사광을 무너뜨리는 전략은 허를 찌르는 변칙이었다. 요즘 방영되고 있는 드라마 ‘육룡이 나르샤’의 한 장면이다.

다음 달 9일부터 15일까지 구글의 자회사인 딥마인드가 만든 바둑프로그램 알파고가 바둑 세계 최고봉인 이세돌 9단과 겨룬다고 한다. 모두 5판을 두는 이번 대국은 인간과 컴퓨터의 대결이라는 점에서 세계의 이목을 집중시키고 있다. 이미 컴퓨터는 인간의 영역을 하나씩 점령했다. 1997년에 IBM이 만든 딥블루가 체스 세계 챔피언을 꺾었고 2011년에는 IBM의 왓슨 컴퓨터가 퀴즈대회에서 챔피언을 눌렀다. 이제 마지막 고지라 일컫던 바둑에 도전장을 낸 것이다.

서양장기인 체스는 매번 둘 때 선택해야 할 수가 약 20가지로 알려져 있다. 장기를 두는 사람은 매번 20가지의 경우의 수 중에서 최선의 위치를 찾아서, 그곳에 적합한 말을 이동시킨다. 그러나 바둑은 19×19 좌표 위 어느 곳에 돌을 놓아야 최선인지 매번 계산하는 것은 사실상 불가능하다.

그러나 컴퓨터 기술의 발달로 계산속도가 빨라지고, 인공지능 기술의 발달로 정해진 시간 내에 최선의 수를 찾아내는 능력이 향상된 것이다. 알파고는 지난해 10월 유럽 바둑챔피언이자 중국 프로 기사인 판후이 2단을 5 대 0으로 격파했다. 알파고가 사용하는 기본적인 기법은 딥러닝 방법이다. 딥러닝은 인간의 뇌세포 사이에서 일어나는 현상을 모방한 인공지능 기술이다. 대규모 데이터를 이용하여 단계적으로 자율적으로 학습하는 장점이 있다.

일반적으로 인공지능 프로그램을 개발하고 성능을 향상시킬 때에는 상대방이 필요하다. 즉 내가 만드는 프로그램이 상대하며 연습을 하게 해줄 프로그램이 필요하다. 마치 운동선수가 훈련할 때 연습 상대가 필요하듯 말이다. 이를 에뮬레이터라고 부른다. 구글 알파고도 그동안 다양한 에뮬레이터를 상대로 훈련을 해왔을 것이다. 특히 이번에 대국이 결정된 다음에는 ‘가상 이세돌’을 만들어 연습하고 있을 것이다. 가상 이세돌은 그동안 이세돌 9단의 모든 기보를 수집하여 학습한다. 그래서 이 9단과 거의 비슷한 행보를 보이는 에뮬레이터가 된다. 아마 가상 이세돌은 진짜 이세돌보다 더 이세돌다운 프로그램일 것이다.

인간은 하루 24시간 중에서 실제로 일에 집중할 수 있는 시간이 매우 제한적이다. 밥도 먹고 잠도 자고 쉬기도 해야 한다. 그러나 컴퓨터는 중단 없이 하루 24시간 일한다. 이번 대국이 결정된 후 경기까지 약 두 달 동안 양측은 상대방을 연구하며 대응전략을 고심하고 있을 것이다. 알파고는 약 한 시간에 한 판씩 둔다고 하니, 가상 이세돌을 상대로 하루에 24판씩, 두 달 동안 약 1440판을 두며 학습하고 있을 것이다. 하지만 이 9단은 ‘가상 알파고’를 가지고 연습할 수도 없다. 오로지 공개된 알파고의 기보를 보면서 하루 몇 회씩 가상 대국을 하고 있을 것이다.

나는 척사광의 칼끝처럼 알파고의 수읽기는 거의 완벽할 것이라 생각한다. 여기서 무휼의 스승이 한 말을 상기할 필요가 있다. 알파고는 완벽할지라도 알파고를 움직이는 컴퓨터에는 약점이 있다. 컴퓨터는 암기력과 계산력에서는 인간을 능가했지만 창의력에서는 인간을 따라오지 못하고 있다. 이 9단은 과거 이세돌과 비슷하게 두어서는 안 될 것이다. 매우 창의적인 행보를 펼쳐서 알파고가 당황하게 만들어야 한다.

첫날 대국이 끝나면 인간은 대부분의 시간을 휴식으로 보내야 한다. 그러나 컴퓨터는 24시간 쉬지 않고 전날의 기보를 보며 학습한다. 물론 전날의 변칙적인 수까지도 익힌다. 그러니 이 9단은 매번 다른 행보를 보여야 할 것이다. 예를 들어 첫날은 조훈현 9단처럼, 둘째 날은 이창호 9단처럼, 셋째 날은 커제 9단처럼 말이다. 창의력은 아직 인간의 영역이다.

이광형 객원논설위원·KAIST 문술미래전략대학원장