허진석 채널A 차장
이런 상황을 직면했을 때 아내가 진짜로 바람을 피우고 있을 가능성은 얼마일까.
또 40대 여성이 X선 검사를 했더니 유방암 양성 판정이 나왔다. 이 경우 실제 유방암일 가능성은 얼마나 될까.
고등학교와 대학 때 한 번쯤 들어본 적이 있는 ‘조건부 확률’에 그 답이 있다. ‘베이스 정리’로도 불리는 이것은 ‘어떤 사건의 사전확률을 알 때, 특정 원인에 의한 해당 사건의 사후확률을 알 수 있다’로 설명할 수 있다.
미국에서 40대 여성이 유방암에 걸릴 확률은 1.4%다. 이게 사전확률이다. 필요한 추가 정보는 유방암에 걸린 여성이 X선 검사에서 양성 판정을 받을 확률(75%)과 멀쩡한 여성이 양성 판정을 받을 확률(약 10%)이다. 이를 알면 양성 판정을 받았을 때 진짜 유방암일 확률은 ‘1.4%×75%÷(1.4%×75%+98.6%×10%)’로 9.6%라는 결과가 나온다.
40대 여성이 유방암에 걸렸을 때 양성 판정이 나올 확률이 75%나 되기 때문에 양성 판정을 받으면 겁을 먹기 쉽지만, 실제 암일 확률은 9.6%에 불과한 것이다. 직감과 실상의 차이가 크다.
베이스 정리의 진짜 미덕은 ‘사전에 알던 가능성에 새로운 정보를 넣어 그 가능성을 정량적으로 개선시킬 수 있다’는 점이다.
미국의 예측 전문가 네이트 실버는 실제로 베이스 정리를 활용해 2008년 미국 대선에서 50개 주 중 49곳의 대선 결과를 정확히 예측했고, 총선에서도 상원 당선자 35명이 누구일지를 정확히 예측해 화제를 모았다.
베이스 정리는 최근에 나온 ‘신호와 소음’(네이트 실버·더퀘스트)과 작년에 나온 번역서 ‘불멸의 이론’(샤론 버치 맥그레인·휴먼사이언스)으로 다시 관심을 끌고 있다.
네이트 실버가 정치적 사건의 결과까지 정확히 예측할 수 있었던 것은 정치적 입장을 떠나 베이스 정리를 바탕으로 자신의 판단을 끊임없이 개선했기 때문이다. 선입견이나 편견을 버리고 새로 나타난 정보를 신중히 선택한 것도 주효했다.
데이터의 양이 폭발적으로 늘면서 ‘잡음’도 기하급수적으로 늘어나는 시대를 우리는 살고 있다. 큰 사건이 발생하면 근거가 부족한 ‘음모론’이 빠르게 확산되는 것을 보라. 자신에게 유리한 데이터만 선별해서 인지하려는 인간의 특성 때문에 정치적 당파성은 더 커지고 있다.
허진석 채널A 차장 jameshuh@donga.com