[단독]SK 데이터센터, 4시간前 ‘위험 경고’에도 배터리 화재 못막아

  • 동아일보
  • 입력 2022년 10월 20일 03시 00분


[멈춰선 ‘카톡 공화국’]
카카오 “망 전체 셧다운 대비훈련 안했다” 시인
SK, 2차례 경고에도 화재 못막아

고개 숙인 카카오… 남궁훈 대표 사퇴 19일 경기 성남시 카카오 판교캠퍼스에서 열린 기자회견에서 남궁훈(왼쪽), 홍은택 카카오 각자대표가 대국민 사과를 했다. 이날 남궁훈 대표는 이번 사태에 책임을 지고 사퇴했다. 성남=사진공동취재단
고개 숙인 카카오… 남궁훈 대표 사퇴 19일 경기 성남시 카카오 판교캠퍼스에서 열린 기자회견에서 남궁훈(왼쪽), 홍은택 카카오 각자대표가 대국민 사과를 했다. 이날 남궁훈 대표는 이번 사태에 책임을 지고 사퇴했다. 성남=사진공동취재단
국민들의 일상을 마비시켰던 ‘카카오 먹통’ 사태의 피해가 커진 것은 카카오의 부실 대비와 SK C&C의 관리 소홀 때문인 것으로 드러났다. 카카오는 극단적 재난 상황을 가정한 훈련을 전혀 하지 않았고, SK C&C도 두 차례나 사전 위험 경고가 있었음에도 화재를 막지 못한 것으로 나타났다.

19일 경기 성남시 카카오 판교캠퍼스에서 열린 기자회견에서 홍은택 카카오 각자대표는 “데이터센터 전체의 셧다운에 대비한 훈련을 한 적은 없다”고 밝혔다. 홍 대표는 “평소 연말 등 트래픽 폭증 상황에만 초점을 맞춰 재난 대비 훈련을 해 왔다. 판단 오류가 있었다”고 시인했다. 이중화 조치가 미흡한 점도 인정했다. 홍 대표는 “서비스 데이터와 운용 프로그램은 이중화돼 있었지만, 이를 다루는 개발자들의 작업 도구를 이중화하지 않았다는 점이 치명적인 실패”라고 밝혔다.

SK C&C 판교데이터센터 관리 문제와 구조적 결함 역시 이번 사태의 주요 원인으로 지목되고 있다. 본보 취재 결과 15일 화재 발생 4시간 전과 1시간 전 데이터센터 내 배터리관리시스템(BMS)이 두 번이나 이상 상황을 감지한 것으로 드러났다. 시스템 경고에 담당 직원이 바로 현장을 찾아 조치했지만, 결과적으로 화재를 막지 못했다.

메인 전기실과 무정전전원장치(UPS)실, 배터리실을 한 층에 둬 화를 불렀다는 지적도 나온다. 다른 회사 데이터센터들은 이 시설들을 서로 다른 층에 놓거나 아예 리튬이온배터리를 쓰지 않는 등 안전 확보를 위한 설계를 하고 있다.



배터리관리시스템서 이상 감지… 직원, 현장 조치했지만 다시 ‘경고’
2번째 조치 1시간 뒤 배터리 화재… 배터리실-핵심 전력시설 같은 층
불 끄려 중앙전원 차단… 피해 키워, 다른 업체들은 해당 시설 층 분리

초유의 카카오 서비스 중단 사태를 일으킨 SK C&C 데이터센터 화재 사고 당시 배터리에 불이 나기 몇 시간 전 내부 시스템에서 두 차례 위험 경고가 있었던 것으로 확인됐다. 담당 인력이 현장을 점검하고 돌아갔음에도 불구하고 화재를 막지 못했던 것으로 드러나면서 관리 소홀로 인한 사고라는 지적이 나온다.
○ 두 차례 위험 경고 떴지만…

19일 관련 업계에 따르면 15일 SK C&C 판교데이터센터 화재가 일어나기 4시간 전 정상 작동 중이던 배터리관리시스템(BMS)이 이상 상황을 감지하고 위험 경고를 울렸다. 담당 직원은 바로 현장을 찾아 조치한 것으로 드러났다.

당시의 구체적 조치 내용은 밝혀지지 않았다. 현장 직원의 한 차례 조치에도 불구하고 또다시 경고 메시지가 떴다. 담당 직원은 배터리실로 다시 내려가 2번째 조치를 취한 뒤 돌아갔다. 하지만 이로부터 1시간 뒤 결국 배터리에서 화재가 발생했다. 카카오 등 고객사들은 화재 이전 SK C&C 측으로부터 BMS 경고 상황에 대해 사전 고지를 받지 못했던 것으로 알려졌다.

BMS는 리튬이온 배터리의 전류, 전압, 온도 등을 측정해 화재 가능성을 사전에 차단하기 위한 시스템이다. 전기자동차와 에너지저장장치(ESS) 등 리튬이온 배터리가 탑재되는 모든 설비에 함께 들어가는 장치다. 사실상 배터리로 인한 화재 사고 예방의 마지노선인 셈이다.

이번에 폭발을 일으킨 배터리가 데이터센터의 무정전전원장치(UPS)용이었다는 점에서 BMS 관리 책임은 더욱 크다고 전문가들은 지적했다. UPS는 중앙 전원이 사고로 끊길 경우 전력을 일정 시간 대체 공급해주는 유사시 장비다. UPS용으로 배치된 배터리들은 유사시 전력 공급을 위해 충전 상태로 장기간 보관된다. 상시 사용되는 배터리와 비교할 때 불안정성이 커질 수밖에 없다. 그만큼 BMS의 역할과 관리 책임이 크다는 얘기다.

조재필 울산과학기술원(UNIST) 교수는 “배터리는 충전된 상태로 계속 유지하면 불안정해진다. UPS의 경우 BMS가 사전에 이상 신호를 보낼 경우 전문 인력이 즉시 셧다운 등 조치를 하는 게 중요하다”고 말했다.
○ 전기실-UPS실-배터리실 한 층에 몰아둬 논란
관련 업계에서는 사고가 난 데이터센터의 구조에도 주목하고 있다. 리튬이온 배터리를 사용함에도 불구하고 배터리실과 핵심 전력시설들을 하나의 층에 몰아둔 점 등이 지적된다.


SK C&C 데이터센터는 지하 3층에 메인 전기실과 UPS실, 배터리실이 함께 있다. UPS실과 배터리실은 별도 공간이긴 하지만 네 개의 출입문으로 연결돼 있다. 배터리에서 화재가 발생했을 때 소방수를 살포하기 위해선 중앙 전원까지 차단해야 하는 구조였던 것이다. SK C&C 관계자는 “소화 약제로 1차 진화를 했으나 소방수를 살포해야 하는 상황이 되자 안전을 위해 전체 전력을 차단할 수밖에 없었다”고 말했다.


반면 데이터센터를 운영 중인 다른 업체들의 경우 해당 시설들을 별도 층에 분리해 안전을 확보하거나 화재 위험을 고려해 리튬이온 배터리를 아예 사용하지 않는 것으로 나타났다.

LG유플러스는 메인 전기실과 배터리실·UPS실을 각각 다른 층에 배치해 중앙 전원과 유사시 전원을 물리적으로 분리하고 있다. KT의 경우 2020년 화재 위험 등을 고려해 리튬이온 배터리를 리튬인산철 배터리, 납축전지로 교체했다. 네이버는 회전형 다이내믹 UPS를 사용하고 있어 배터리가 필요 없는 구조라고 밝혔다.

이번 사고 후 삼성SDI와 LG에너지솔루션 등 다른 데이터센터에 리튬이온 배터리를 납품한 업체들도 운영사인 삼성SDS, LG CNS 등을 통해 추가적인 사전 점검 작업을 진행하고 있는 것으로 전해졌다.

#sk 데이터센터#위험경고#배터리 화재#셧다운#대비훈련
  • 좋아요
    0
  • 슬퍼요
    0
  • 화나요
    0

댓글 0

지금 뜨는 뉴스

  • 좋아요
    0
  • 슬퍼요
    0
  • 화나요
    0