과기부, ‘카톡 먹통’ 부른 SK 판교데이터센터 화재 조사결과 발표
데이터센터, 배터리 방화설비 미비, 배터리 화재로 비상전원도 끊겨
카카오는 관리도구 등 핵심기능, 판교에 모아놔 서비스 복구 지연
10월 발생한 SK C&C 판교데이터센터의 화재 사고와 카카오 서비스 ‘먹통 사태’는 업체들의 부실한 재난 관리에서 비롯된 것으로 드러났다. 데이터센터의 구조 설계부터 화재 대응까지 전반적으로 부실했다. 대형 재난에 대비한 계획 및 훈련도 미흡했던 것으로 나타났다.
이종호 과학기술정보통신부 장관은 6일 정부서울청사에서 이러한 내용의 ‘디지털 서비스 장애 조사 결과’를 발표했다. 과기정통부에 따르면 10월 15일 오후 3시 19분 경기 성남시 SK C&C 판교데이터센터 지하 3층 리튬이온 배터리에서 원인 미상의 화재가 발생했다. 곧바로 소화 장비를 작동했지만 가스 소화가 어려운 리튬이온 배터리 화재 특성상 초기 진화에 한계가 있었다. SK C&C는 리튬이온 배터리를 설치했으면서도 이에 적합한 특수 방화 설비를 갖추지 않은 것으로 나타났다.
구조에도 문제가 있었다. 배터리 위쪽으로 전력선이 설치됐기 때문에 화재 초기에 전력선이 손상됐다. 비상시 전원을 공급하는 무정전전원장치(UPS)로도 화재가 번지며 전력 공급이 끊겼다. 화재가 처음 발생한 배터리실과 UPS 장치를 설치한 공간 사이에 격벽을 설치했지만, 두 공간을 완벽히 분리하지 않은 탓이다. 연결된 천장공간을 통해 불이 번졌다.
물을 뿌려야 화재 진압이 가능할 정도로 불이 번진 상황에서 데이터센터 내 특정 구역의 전력만 부분적으로 차단하는 것도 불가능했다. 현장 직원들이 전력 차단 스위치를 현장에서 바로 구분하기 어려웠기 때문이다. 과기정통부는 “실제 화재 상황까지 반영한 세부 대응 계획이 없었고 모의 훈련도 진행하지 않았던 것으로 확인했다”고 밝혔다.
카카오의 경우 판교데이터센터와 다른 데이터센터 간 이중화 시스템을 일부 갖추긴 했지만, 정작 예비용 서버를 가동하기 위한 관리 도구를 판교데이터센터에만 둔 탓에 장애가 길어졌던 것으로 파악됐다. 또 이미지나 동영상 송수신 시스템 등은 데이터센터 간 이중화가 이뤄지지 않아 완전 복구까지 더 많은 시간이 필요했다.
카카오의 핵심 기능과 서비스 등을 판교데이터센터에 집중적으로 모아놓은 것도 사태를 키운 원인 중 하나였다. 실제 여러 디지털 서비스의 관문 역할을 하는 ‘카카오 인증’ 등 핵심 기능은 판교데이터센터에서 주로 처리했다.
서비스 장애 탐지, 전파, 복구 등 각 대응 단계별 체계적인 조치 방안도 미흡했다. 또 일부 서버나 연결망 등 오류에 대비한 훈련은 했지만 1개 데이터센터 전체가 마비되는 대형 재난 상황에 대비한 훈련은 하지 않은 것으로 나타났다.
정부는 이번 사고 조사 발표에서 배터리에서 불꽃이 튄 근본적인 원인은 밝히지 않았다. 과기정통부는 SK C&C와 카카오, 네이버에 화재 및 서비스 장애 원인, 개선 조치 계획 등을 마련해 한 달 내 정부에 보고하도록 하는 행정지도를 내릴 예정이다.
지민구 기자 warum@donga.com
남혜정 기자 namduck2@donga.com
댓글 0