[멈춰선 ‘카톡 공화국’] 데이터센터 서버 4곳에 뒀지만 카톡 등 중요 서비스 서버 판교 몰려 사고때 대체할 ‘이중화 조치’ 미흡… 예비서버 연결도 늦어 복구 지연 같은 곳 이용 네이버는 복구 빨라… 자체 데이터센터 지어 위험 분산
15일 오후 경기 성남시 분당구 SK C&C 판교데이터센터 화재 현장에 출동한 소방대원들. 이 건물 지하 3층 전기실에서 화재가 발생하면서 건물에 있는 서버를 임차해 사용하던 카카오 서비스 상당수가 마비됐고, 많은 국민이 불편을 겪었다. 성남=뉴스1
“재난 대비를 한다면서 화재 위험을 고려하지 않았다는 게 이해가 되지 않는다.” 네트워크 설비와 체계에 밝은 정보기술(IT) 업계 관계자는 카카오 측이 데이터센터 화재에 대해 ‘이례적 상황’이라고 설명한 데 대해 이렇게 반문했다. 카카오의 재난복구(DR·Disaster Recovery) 준비가 기본도 되지 않았다는 비판이 나오는 이유다.
○ “화재 시나리오 예상 못 해”
문제는 카카오가 SK C&C 데이터센터에서만 3만2000대의 서버를 운용했다는 것이다. 판교 한 곳에 지나치게 많은 서버 시설을 배치하고 카카오톡, 카카오T 등 중요 서비스를 집중하다 보니 서버 이중화 조치의 실효성을 떨어뜨렸다는 지적이 나온다. 예비 서버로 연결하는 작업도 제대로 이뤄지지 않았다. 이러다 보니 20분 안에 복구한다는 내부 원칙과는 달리 임시 복구까지 10시간 넘게 걸렸다.
문제가 반복적으로 발생하는데도 근본적 대책 마련이 미흡했다는 비판도 있다. 이달 4일 카카오톡 PC 버전이 18분간 장애를 일으키는 등 이번 화재 전에도 올해만 5차례 카카오 서비스에서 장애가 발생했다.
○ 한발 늦은 인프라 투자
네이버 역시 이번 화재가 발생한 같은 데이터센터를 이용했지만 상대적으로 피해가 크지 않았다는 점도 카카오로서는 뼈아픈 부분이다. 업계에서는 자체 데이터센터 건립 등의 투자에서 카카오가 네이버에 비해 한발 늦었다고 지적한다.
홍진배 과학기술정보통신부 네트워크실장은 “네이버는 (예비 서버로 연결하는) 이중화 조치를 완료해 모든 서비스가 정상적으로 작동하는 것으로 파악하고 있다”고 말했다.
한편 카카오는 홍은택 각자대표가 총괄하는 비상대책위원회를 출범시켜 조사, 재난 대응, 보상 대책 등을 추진하기로 했다. 다음 주에 피해를 신고할 수 있는 채널을 마련해 신고 접수를 시작할 예정이다.
지민구 기자 warum@donga.com
성남=전남혁 기자 forward@donga.com