공유하기
엔씨소프트는 인공지능(AI)의 윤리적 활용 중요성이 대두되는 사회적 요구에 발맞춰 AI의 기술 고도화뿐 아니라 AI 윤리정립에 앞장서고 있다. 엔씨는 AI기술이 ‘인간 중심의 AI’로 지속 성장할 수 있도록 ‘엔씨 AI 윤리 프레임워크’라는 이름으로 세 가지 핵심 윤리가치를 선정하고, AI 개발과 운영 과정 전반에 반영 중이다. 엔씨는 ‘데이터 보호’ ‘편향되지 않는’ ‘투명성’을 핵심 가치로 삼고 있다. 먼저 일반적으로 AI 개발에 쓰이는 수많은 데이터에는 개인정보가 포함될 가능성이 높고, 사용자에게 명확히 고지하거나 동의를 받지 않는 개인정보가 AI 학습에 활용되기도 한다. 엔씨는 데이터를 활용하는 과정에서 프라이버시나 개인정보를 보호하기 위해 학습에 필요한 데이터를 남기고 개인정보는 비식별화하는 정책과 처리시스템을 구축하고 있다. 또 편향되지 않은 AI를 개발함으로써 특정인에게 서비스가 불리하게 작용하거나 소외시키지 않도록 하고 있다. ‘비윤리적 표현 데이터사전’을 구축해 필터링하고, 무례한 발화를 제어하는 시스템을 적용 및 테스트하며 검증 과정을 거치고 있다. AI가 ‘이해할 수 없는 불안한 존재’라는 인식을 줄이기 위해 AI기술의 투명성 공개에도 힘쓰고 있다. 이를 위해 엔씨소프트는 지난해 10개 이상의 AI 연구논문과 오픈소스를 공개했다. AI가 학습한 데이터의 출처와 그 데이터를 수집하고 처리한 방식에 대한 정보를 알 수 있는 AI 대화 데이터셋도 공개 중이다. 최근 윤송이 엔씨 최고전략책임자(CSO)는 이화여대 AI융합학부 산학협력 포럼에서 “AI 시대에는 기술을 바라보는 새로운 눈이 필요하다”며 “AI가 우리사회에 미칠 영향을 예측하고 대응하기 위해 기업과 학계의 노력이 필요하다”고 조언했다. 전남혁 기자 forward@donga.com}
카카오브레인은 지난해 연말부터 초거대 인공지능(AI) 모델을 오픈소스로 공개하고 있다고 밝혔다. 카카오브레인은 이달 초 개발자 전용 웹사이트인 ‘카카오디벨로퍼스’에 자체 개발한 한국어 특화 초거대 AI 언어모델 ‘KoGPT’를 오픈 응용프로그램 인터페이스(API)로 공개했다. 지난해 11월에는 최대 오픈소스 커뮤니티 ‘깃허브’에 KoGPT를 공개하기도 했다. 최고 수준의 자연어처리 모델로 꼽히는 ‘GPT-3’의 한국어 특화 AI 언어모델인 KoGPT는 300억 개의 매개변수와 2000개 토큰의 한국어 데이터를 바탕으로 만들어졌다. 특히 올해 8월에는 ‘KoGPT’를 기반으로 시 쓰는 AI 시인 ‘시아’를 선보였다. 시아는 인터넷 백과사전, 뉴스 등을 읽으며 한국어를 공부하고 1만3000여 편의 시를 읽고서 작법을 배워 시를 쓸 수 있다. 8월 첫 번째 시집 ‘시를 쓰는 이유’를 출간했으며 현재 1쇄가 완판됐다. 카카오브레인은 언어뿐 아니라 AI 멀티모달 이미지 생성 모델의 고도화에도 힘쓰고 있다. 지난해 12월에는 이용자가 텍스트로 명령어를 입력하면 실시간으로 원하는 이미지를 만들어주는 이미지 생성 모델 ‘민달리’를 공개했고, 올해에는 업그레이드 버전 ‘RQ-트랜스포머’를 공개했다. 이 두 모델을 발전시켜 하나의 페르소나로 재탄생된 AI 아티스트 ‘칼로’는 1억2000만 장 규모의 텍스트-이미지 데이터셋을 학습해 이해한 문맥을 바탕으로 다양한 화풍과 스타일로 이미지 생성을 할 수 있다. 카카오브레인 관계자는 “지속적으로 차별화된 연구기술을 선도하며 사람 같은 AI를 만들어가는 한편, 기술과 연구결과물을 사회의 다양한 문제해결에 기여하고 다양한 분야에 접목해 나갈 것”이라고 밝혔다. 전남혁 기자 forward@donga.com}
윤석열 대통령은 28일 국책연구기관에 한해 석·박사 학위를 받은 학교 등 이른바 ‘스펙’을 보지 않는 블라인드 채용의 폐지 방침을 밝혔다. 블라인드 채용을 통해 이루려는 공정이라는 가치보다 인재 확보를 통한 과학기술 혁신이 더 중요하다는 취지다. 정부는 이날 대한민국의 새로운 성장엔진이 될 12개 국가전략기술도 발표했다.○ “과학기술 가로막는 어떤 규제도 정당화 안 돼”윤 대통령은 이날 국가과학기술자문회의 제1차 전원회의 모두발언에서 “최근 몇 년 동안 우수 연구자 확보를 가로막았던 공공기관 블라인드 채용은 연구기관에 대해서 우선적으로 전면 폐지하겠다”고 말했다. 국가과학기술자문회의는 대통령을 의장으로 하는 과학기술 정책의 최상위 의사결정 기구다. 블라인드 채용이란 입사 지원자가 입사원서에 사진, 출신 지역, 학력, 가족관계 등을 적지 못하게 한 뒤 채용담당자들이 직무 능력만으로 인재를 뽑는 형태의 채용 방식이다. 2017년 당시 문재인 대통령의 지시에 따라 ‘평등한 기회, 공정한 과정’을 보장한다는 취지로 공공기관의 블라인드 채용이 의무화됐다. 그러나 국책연구기관에서는 출신 학교를 빼놓고 평가하다 보니 전형 단계만 늘고, 인재를 가려내기 더 힘들어졌다는 목소리가 높았다. 2019년 국가보안시설인 한국원자력연구원이 블라인드 채용을 했다가 중국 국적자를 걸러내지 못한 채 최종 선발하는 논란도 있었다. 대통령실 관계자는 “전 세계 연구기관들은 연구원을 채용할 때 연구 분야와 성과 등을 파악하기 위해 석·박사 학위를 받은 학교와 추천서 등을 중시한다”면서 “이 때문에 과학기술 강국을 만들기 위한 국책연구기관의 제1민원이 블라인드 채용 폐지였다”고 말했다. 윤 대통령은 이날 모두발언을 통해 “과학기술은 경제와 산업 성장의 원천이다. 우리가 먹고사는 원천”이라고 강조했다. 회의를 마치면서도 “국부의 원천은 과학기술의 역량”이라면서 “과학기술을 가로막는 어떤 규제도 정치적 이유로 정당화될 수 없다”고 강조했다. 대통령실 관계자는 “국책연구기관의 블라인드 채용 전면 폐지도 이런 맥락에서 취해진 조치”라고 설명했다. ○ 새 성장엔진 ‘12대 국가전략기술’ 발표이날 회의에서는 미래성장과 경제안보에 기여할 12대 국가전략기술 발표와 육성 방안이 보고됐다. △반도체·디스플레이 △이차전지 △첨단 모빌리티 △차세대 원자력 △첨단 바이오 △우주항공·해양 △수소 △사이버 보안 △인공지능 △차세대 통신 △첨단로봇·제조 △양자 등이 포함됐다. 과학기술정보통신부는 “기술패권 경쟁이 본격화되는 글로벌 구도에서 경제를 넘어 외교·안보 측면까지 고려한 전략기술에 선택과 집중을 했다”고 밝혔다. 과기정통부는 국가전략기술을 확보하기 위해 민관이 함께 목표를 설정하고 공동 투자하는 국가전략기술 프로젝트를 추진한다. 프로젝트의 기획·관리·평가 전반에 걸쳐 민간 최고전문가에게 높은 재량권을 부여하되, 성과 점검을 통해 5∼7년 내 가시적 성과를 도출하겠다는 것이다. 아울러 연구개발(R&D) 투자를 2022년 3조7400억 원에서 2023년 4조1200억 원으로 10%가량 늘리기로 했다. 5세대(5G) 오픈랜, 양자컴퓨팅·센서, 혁신형 소형모듈원자로 등 시급성이 높은 기술 개발에는 2651억 원을 신규 투자할 계획이다. 또 ‘국가전략기술특별법’을 제정해 관리체계 구축 및 민관 역량 결집에 필요한 제도 마련도 추진한다. 홍수영 기자 gaea@donga.com전남혁 기자 forward@donga.com}
윤석열 대통령은 28일 국책연구기관에 한해 석·박사 학위를 받은 학교 등 이른바 ‘스펙’을 보지 않는 블라인드 채용의 폐지 방침을 밝혔다. 블라인드 채용을 통해 이루려는 공정이라는 가치보다 인재 확보를 통한 과학기술 혁신이 더 중요하다는 취지다. 정부는 이날 대한민국의 새로운 성장엔진이 될 12개 국가전략기술도 발표했다. ● “과학기술 가로막는 어떤 규제도 정당화 안 돼”윤 대통령은 이날 국가과학기술자문회의 제1차 전원회의 모두발언에서 “최근 몇 년 동안 우수 연구자 확보를 가로막았던 공공기관 블라인드 채용은 연구기관에 대해서 우선적으로 전면 폐지하겠다”라고 말했다. 국가과학기술자문회의는 대통령을 의장으로 하는 과학기술 정책의 최상위 의사결정 기구다. 블라인드 채용이란 입사 지원자가 입사원서에 사진, 출신 지역, 학력, 가족관계 등을 적지 못하게 한 뒤 채용담당자들이 직무능력만으로 인재를 뽑는 형태의 채용 방식이다. 2017년 당시 문재인 대통령의 지시에 따라 ‘평등한 기회, 공정한 과정’을 보장한다는 취지로 공공기관의 블라인드 채용이 의무화됐다. 그러나 국책연구기관에서는 출신 학교를 빼놓고 평가하다보니 전형 단계만 늘고, 인재를 가려내기 더 힘들어졌다는 목소리가 높았다. 2019년 국가보안시설인 한국원자력연구원이 블라인드 채용을 했다가 중국 국적자를 걸러내지 못한 채 최종 선발하는 논란도 있었다. 대통령실 관계자는 “전 세계 연구기관들은 연구원을 채용할 때 연구 분야와 성과 등을 파악하기 위해 석·박사 학위를 받은 학교와 추천서 등을 중시한다”면서 “이 때문에 과학기술 강국을 만들기 위한 국책연구기관의 제1민원이 블라인드 채용 폐지였다”라고 말했다. 윤 대통령은 이날 모두발언을 통해 “과학기술은 경제와 산업 성장의 원천이다. 우리가 먹고사는 원천”이라고 강조했다. 회의를 마치면서도 “국부의 원천은 과학기술의 역량”이라면서 “과학기술을 가로막는 어떤 규제도 정치적 이유로 정당화될 수 없다”라고 강조했다. 대통령실 관계자는 “국책연구기관의 블라인드 채용 전면 폐지도 이런 맥락에서 취해진 조치”라고 설명했다. ● 새 성장엔진 ‘12대 국가전략기술’ 발표이날 회의에서는 미래성장과 경제안보에 기여할 12대 국가전략기술 발표와 육성 방안이 보고됐다. △반도체·디스플레이 △이차전지 △첨단 모빌리티 △차세대 원자력 △첨단 바이오 △우주항공·해양 △수소 △사이버보안 △인공지능 △차세대 통신 △첨단로봇·제조 △양자 등이 포함됐다. 과학기술정보통신부는 “기술패권 경쟁이 본격화되는 글로벌 구도에서 경제를 넘어 외교·안보 측면까지 고려한 전략기술에 선택과 집중했다”고 밝혔다. 과기정통부는 국가전략기술의 기술 확보를 위해 민관이 함께 목표를 설정하고 공동투자하는 국가전략기술 프로젝트를 추진한다. 프로젝트 기획·관리·평가 전반에 걸쳐 민간 최고전문가에게 높은 재량권을 부여하되, 성과 점검을 통해 5~7년 내 가시적 성과를 도출하겠다는 것이다. 아울러 연구개발(R&D) 투자를 2022년 3조7400억 원에서 2023년 4조1200억 원으로 10%가량 늘리기로 했다. 5세대(5G) 오픈랜, 양자컴퓨팅·센서, 혁신형 소형모듈원자로 등 시급성이 높은 기술개발에는 2651억 원을 신규 투자할 계획이다. 또 ‘국가전략기술특별법’을 제정해 관리체계 구축 및 민관역량결집에 필요한 제도 마련도 추진한다. 홍수영 기자 gaea@donga.com전남혁 기자 forward@donga.com}
고금리·고환율·고물가 등으로 인한 경기침체 장기화로 불안해진 개인의 투자심리를 이용한 주식·투자 관련 스팸이 증가하고 있는 것으로 나타났다. 28일 스팸 차단 애플리케이션(앱) ‘후후’를 제공하는 ‘브이피’에 따르면 올 3분기(7~9월) 후후 이용자들이 신고한 스팸 건수 중 주식·투자 관련 스팸이 가장 많은 342만 건을 기록, 약 46%를 차지했다. 이는 지난해 동기 대비 49% 증가한 수치다. 주식·투자관련 스팸은 지난해 3분기 이후 계속해서 건수와 비중이 증가 추세를 보이고 있다. 불법게임·도박, 유흥업소 등 불법 유흥 홍보성 스팸도 가장 눈에 띄게 비중이 증가했다. 전분기 대비 약 15% 증가한 108만 건이 신고됐다. 지난 4월 이후 사회적 거리두기가 점차 완화되는 분위기 속에서 사행성 게임이나 유흥업소 관련 스팸이 늘어난 것으로 분석된다. 반면 대출권유 스팸 신고는 130만여 건을 기록하며 200만여 건이었던 전분기 대비 약 33% 감소했다. 한국은행 기준금리가 5월 1.75%에서 10월기준 3.0%까지 큰 폭으로 오르며 개인 대출수요가 감소한 분위기가 반영된 것으로 풀이된다. 브이피에 따르면 올 3분기 전체 스팸 신고 건수는 744만 건이며, 지난해 3분기와 비슷한 수준을 기록했다. 하지만 역대 최다 스팸 신고 건수를 기록했던 지난 2분기와 대비해서는 약 100만 건 이상 감소한 것으로 나타났다. 전남혁 기자 forward@donga.com}
LG유플러스가 25일 인공지능(AI) 서비스 통합 브랜드 ‘익시(ixi)’를 공개하고 스포츠 결과 예측, 고객센터, 소상공인 서비스, 콘텐츠 추천 등 자체 개발한 AI 서비스 및 기술을 선보였다. ‘익시’는 사람과 사람의 연결을 돕는 AI 서비스라는 뜻으로, 앞으로 출시되는 LG유플러스의 다양한 B2C 및 B2B 분야 서비스에 표기된다. LG유플러스의 스포츠 커뮤니티 플랫폼 ‘스포키’에서 제공되는 AI 승부 예측은 다가올 월드컵의 모든 경기 결과와 스코어를 AI 예측 기술로 분석해 즐거운 관전을 돕는 서비스다. 경기 결과 예측뿐 아니라 가장 확률이 높은 스코어를 1∼3순위로 제공한다. LG유플러스는 자사 고객센터에 11월 도입을 앞둔 콜봇 서비스도 공개했다. 고객센터에 전화를 걸면 AI 엔진이 음성을 텍스트로 변환하고, 이를 통해 고객의 의도를 분석한 뒤 적합한 상담 내용을 음성으로 응답한다. 11월부터 청구 요금 조회, 청구 주소 변경 등 상담 서비스에 콜봇을 우선 적용한다. 소상공인을 위한 콜봇 서비스 ‘우리가게 AI’는 바쁜 사장님 대신 매장 정보, 자동 예약 등 전화 응대 업무를 AI가 돕는 서비스다. 업종별로 특화된 응대 시나리오를 제공하고, 단골 고객의 응대 이력에 기반해 통계 데이터 산출도 가능하다. 인터넷TV(IPTV) 서비스에도 AI가 적용된다. LG유플러스는 고객의 피드백에 맞게 콘텐츠를 추천해 주는 AI 기반 추천 엔진을 유플러스TV에 적용했다. 2억5000만 건의 주문형 비디오(VOD), 실시간 채널 이용 이력 등 고객 이용 로그를 분석해 취향을 파악하고, 추천 서비스를 제공하는 방식이다.전남혁 기자 forward@donga.com}
데이터센터 화재에 따른 초유의 서비스 장애와 관련해 김범수 카카오 창업자와 이해진 네이버 창업자가 24일 국회 국정감사장에 나란히 출석한다. 사고 원인과 수습 과정의 문제점, 향후 대책에 이르기까지 여야 의원들의 매서운 질타가 쏟아질 것으로 예상된다. 23일 국회에 따르면 24일 국회 과학기술정보방송통신위원회의 과학기술정보통신부에 대한 종합감사에서 카카오의 김범수 미래이니셔티브 센터장과 홍은택 대표, 네이버의 이해진 글로벌투자책임자(GIO)와 최수연 대표가 증인석에 오른다. SK C&C에서는 박성하 대표가 출석한다. 특히 ‘국민 메신저’ 카카오톡을 비롯한 대다수의 서비스가 장애를 겪은 카카오의 김 창업자에 대한 집중 질의와 추궁이 예상된다. 카카오는 19일 대규모 장애에 대한 대국민 사과를 밝히고 남궁훈 대표가 사퇴했지만, 사태 이후 침묵을 지켜온 김 창업자가 직접 나서 수습에 앞장서야 한다는 요구가 있어 왔다. 극한 상황을 대비한 모의훈련을 하지 않고 망 이중화를 부실하게 운영하는 등 카카오의 미흡한 대처에 대해 ‘개발자 출신’ 창업자가 어떤 입장을 밝힐지 주목된다. 사고 관련 외에 플랫폼 독과점과 골목상권 침해, 쪼개기 상장 등에 대해서도 의원들이 지적할 것으로 전망된다. 카카오보다 피해는 적었지만 역시 일부 서비스에서 장애를 일으킨 네이버의 이해진 창업자도 서비스 장애 원인과 데이터센터 구축 현황 등에 대한 입장을 밝힐 것으로 전망된다. 화재 인지 시점 등을 놓고 카카오와 SK C&C의 입장이 엇갈리고 있는 가운데, 이에 대한 양 사 수장의 책임 공방이 이뤄질지도 주목된다. SK C&C는 화재 발생 후 4분 만에 카카오를 포함한 고객사 직원들에게 화재를 알렸다고 주장하고 있지만, 카카오 측에서는 화재 발생 후 20여 분이 지나서야 이를 인지했다고 주장하고 있다. 과방위는 SK그룹 수장인 최태원 회장에 대해서도 출석을 요구했지만, 최 회장은 21일 불출석 사유서를 제출했다. 한일 민간 경제협력 재건과 글로벌 공급망 위기 대응을 위해 준비해 온 일본포럼과 국감 일정이 겹쳐 부득이한 사유로 출석이 어렵다고 밝혔다. 국감에 증인으로 출석해 자극적이고 부정적인 기사들이 공개될 경우 2030 부산세계박람회 유치에도 악영향을 미칠 수 있다는 내용을 사유서에 담은 것으로 전해졌다. 카카오 측이 국감에서 이용자에 대한 구체적인 배상 및 보상 계획을 공개할지도 관심거리다. 앞서 19일 홍 대표는 기자회견에서 “유료 서비스 이용자뿐 아니라 피해를 입은 이용자와 파트너, 이해관계자에 대한 보상을 검토하겠다”고 밝혔다. 현재 카카오는 전용 피해 접수창구를 마련해 구체적인 피해 사례를 접수하고 있다. 카카오가 무료 서비스 이용자에 대한 보상 가능성을 밝혔지만 실제 보상까지는 난항이 예상된다. 전기통신사업법상 사업자의 무상 서비스에 대한 배상은 책임이 대폭 감면되거나 면제된다. 결국 민법상 손해배상 청구를 통해 소송을 제기해야 하는데, 무료 서비스 사용 불가로 인한 피해의 경우 예측이 불가능한 간접적 손해에 해당해 배상받지 못할 가능성이 높다. 카카오의 약관에서도 법률상 허용되는 한도 내에서의 간접손해, 특별 손해에 대한 책임을 부담하지 않는다고 명시하고 있다. 결국 법적 책임보다는 대규모 이용자가 피해를 겪은 사안의 중대성을 감안해 도의적 책임에 의한 보상이 될 가능성이 높다. 법무법인 비트의 안일운 변호사는 “무료 서비스는 직접적인 손해를 입증하기 까다롭고, 보상을 한다고 하더라도 일률적인 현금 보상 같은 금전적 보상은 아닐 것”이라고 전망했다. 21일 한상혁 방송통신위원장은 국정감사에서 “(카카오의) 약관 범위를 벗어나더라도 실질적인 피해에 대해서는 사업자와 충분히 협의를 통해 보상이 이뤄지도록 대처하겠다”고 밝혔다.전남혁 기자 forward@donga.com박현익 기자 beepark@donga.com}
‘카카오 먹통’ 사태 6일째인 20일 카카오의 서비스는 정상화됐지만 화재 인지 시점 등을 놓고 책임 공방은 계속되고 있다. 정부는 주요 데이터사업 사업자들을 불러 재해 대응 방침을 논의하는 등 사고 재발을 막기 위한 움직임도 가속화되고 있다. 20일 국민의힘 김영식 의원이 카카오와 SK C&C로부터 각각 제출받은 자료에 따르면 SK C&C가 카카오에 화재를 알렸다는 시간과, 카카오가 화재를 인지했다는 시간에 시차가 발생한다. SK C&C의 주장에 따르면 15일 오후 3시 19분 화재로 인해 화재 경보가 울렸고, SK C&C 방재실에서 화재를 인지했다. SK C&C 측은 오후 3시 33분 화재를 신고한 후 건물 내 인원 대피와 함께 비상연락망을 통해 카카오를 포함한 고객사에 연락해 화재 상황을 공유했다고 주장한다. 카카오 입장은 다르다. 화재 직후 카카오 서버 상당수의 전원이 나갔고, 카카오는 오후 3시 27분경 인프라 장애를 인지했다. 당시 카카오 측은 ‘장애 사실’은 인지했지만 ‘장애 사유’는 인지하지 못했다고 주장하고 있다. SK C&C 측으로부터 들은 것이 아니라 오후 3시 40∼42분경 SK C&C 측에 먼저 연락을 취해 화재 사실을 알게 됐다는 것이다. 향후 사고 책임과 계약 등의 해석을 두고 다툼의 여지가 있는 부분이다. 19일 홍은택 카카오 대표는 “양측이 사고 원인을 두고 공방을 벌인다는 이야기에 특별한 대응은 하지 않고 있다”라면서도 “(데이터센터 계약의) 면책조항 적용 등에 양 사 간 주장이 다를 수 있을 것”이라고 밝힌 바 있다. 20일 오후 8시 기준으로 현재 카카오톡 메시지 수·발신, 카카오 톡서랍의 메모, 미디어파일, 팀채팅 기능, 카카오페이 주요 금융 거래, 카카오·다음 이메일 주요 기능 등 카카오의 주요 서비스는 대부분 정상화된 상황이다. SK C&C 판교데이터센터의 전력 공급도 정상화됐다. 이에 따라 사고 원인 분석과 재발 방지를 위한 정부 및 업계의 움직임도 본격화되고 있다. 20일 과학기술정보통신부는 ‘국내 데이터센터 사업자 긴급 점검회의’를 개최해 데이터센터 비상상황 대비 방안에 대해 논의했다. 회의에선 KT클라우드, LG유플러스, SK브로드밴드, LG CNS, 삼성SDS 등 7개 국내 주요 데이터센터 사업자가 참석해 화재 등 유사시에 대비한 전력, 소방설비, 배터리 이중화 설비의 운영·관리방안을 공유하는 등 주요 데이터센터의 보호 조치와 안정성 확보 방안을 논의했다. 다만 사고가 발생한 SK C&C 측은 참석하지 않았다. 이날 회의에서는 화재 원인으로 지목된 리튬이온배터리의 관리 강화와 신규 건립될 센터의 배터리 선정 방안 등을 논의했다. 개별적으로 재해 대응을 하고 있는 각 사가 이를 공유할 가이드라인이 필요하다는 의견도 공유된 것으로 알려졌다. 박윤규 과기정통부 제2차관은 “재난 상황에서도 데이터센터가 끊김 없이 돌아갈 수 있도록 전력, 소방 등에 대한 보호 조치 기준을 구체화하고, 이에 대한 정기적 점검과 대비가 가능하도록 할 예정”이라고 밝혔다. 전남혁 기자 forward@donga.com}
국민들의 일상을 마비시켰던 ‘카카오 먹통’ 사태의 피해가 커진 것은 카카오의 부실 대비와 SK C&C의 관리 소홀 때문인 것으로 드러났다. 카카오는 극단적 재난 상황을 가정한 훈련을 전혀 하지 않았고, SK C&C도 두 차례나 사전 위험 경고가 있었음에도 화재를 막지 못한 것으로 나타났다. 19일 경기 성남시 카카오 판교캠퍼스에서 열린 기자회견에서 홍은택 카카오 각자대표는 “데이터센터 전체의 셧다운에 대비한 훈련을 한 적은 없다”고 밝혔다. 홍 대표는 “평소 연말 등 트래픽 폭증 상황에만 초점을 맞춰 재난 대비 훈련을 해 왔다. 판단 오류가 있었다”고 시인했다. 이중화 조치가 미흡한 점도 인정했다. 홍 대표는 “서비스 데이터와 운용 프로그램은 이중화돼 있었지만, 이를 다루는 개발자들의 작업 도구를 이중화하지 않았다는 점이 치명적인 실패”라고 밝혔다. SK C&C 판교데이터센터 관리 문제와 구조적 결함 역시 이번 사태의 주요 원인으로 지목되고 있다. 본보 취재 결과 15일 화재 발생 4시간 전과 1시간 전 데이터센터 내 배터리관리시스템(BMS)이 두 번이나 이상 상황을 감지한 것으로 드러났다. 시스템 경고에 담당 직원이 바로 현장을 찾아 조치했지만, 결과적으로 화재를 막지 못했다. 메인 전기실과 무정전전원장치(UPS)실, 배터리실을 한 층에 둬 화를 불렀다는 지적도 나온다. 다른 회사 데이터센터들은 이 시설들을 서로 다른 층에 놓거나 아예 리튬이온배터리를 쓰지 않는 등 안전 확보를 위한 설계를 하고 있다.배터리관리시스템서 이상 감지… 직원, 현장 조치했지만 다시 ‘경고’ 2번째 조치 1시간 뒤 배터리 화재… 배터리실-핵심 전력시설 같은 층불 끄려 중앙전원 차단… 피해 키워, 다른 업체들은 해당 시설 층 분리 초유의 카카오 서비스 중단 사태를 일으킨 SK C&C 데이터센터 화재 사고 당시 배터리에 불이 나기 몇 시간 전 내부 시스템에서 두 차례 위험 경고가 있었던 것으로 확인됐다. 담당 인력이 현장을 점검하고 돌아갔음에도 불구하고 화재를 막지 못했던 것으로 드러나면서 관리 소홀로 인한 사고라는 지적이 나온다.○ 두 차례 위험 경고 떴지만…19일 관련 업계에 따르면 15일 SK C&C 판교데이터센터 화재가 일어나기 4시간 전 정상 작동 중이던 배터리관리시스템(BMS)이 이상 상황을 감지하고 위험 경고를 울렸다. 담당 직원은 바로 현장을 찾아 조치한 것으로 드러났다. 당시의 구체적 조치 내용은 밝혀지지 않았다. 현장 직원의 한 차례 조치에도 불구하고 또다시 경고 메시지가 떴다. 담당 직원은 배터리실로 다시 내려가 2번째 조치를 취한 뒤 돌아갔다. 하지만 이로부터 1시간 뒤 결국 배터리에서 화재가 발생했다. 카카오 등 고객사들은 화재 이전 SK C&C 측으로부터 BMS 경고 상황에 대해 사전 고지를 받지 못했던 것으로 알려졌다. BMS는 리튬이온 배터리의 전류, 전압, 온도 등을 측정해 화재 가능성을 사전에 차단하기 위한 시스템이다. 전기자동차와 에너지저장장치(ESS) 등 리튬이온 배터리가 탑재되는 모든 설비에 함께 들어가는 장치다. 사실상 배터리로 인한 화재 사고 예방의 마지노선인 셈이다. 이번에 폭발을 일으킨 배터리가 데이터센터의 무정전전원장치(UPS)용이었다는 점에서 BMS 관리 책임은 더욱 크다고 전문가들은 지적했다. UPS는 중앙 전원이 사고로 끊길 경우 전력을 일정 시간 대체 공급해주는 유사시 장비다. UPS용으로 배치된 배터리들은 유사시 전력 공급을 위해 충전 상태로 장기간 보관된다. 상시 사용되는 배터리와 비교할 때 불안정성이 커질 수밖에 없다. 그만큼 BMS의 역할과 관리 책임이 크다는 얘기다. 조재필 울산과학기술원(UNIST) 교수는 “배터리는 충전된 상태로 계속 유지하면 불안정해진다. UPS의 경우 BMS가 사전에 이상 신호를 보낼 경우 전문 인력이 즉시 셧다운 등 조치를 하는 게 중요하다”고 말했다.○ 전기실-UPS실-배터리실 한 층에 몰아둬 논란관련 업계에서는 사고가 난 데이터센터의 구조에도 주목하고 있다. 리튬이온 배터리를 사용함에도 불구하고 배터리실과 핵심 전력시설들을 하나의 층에 몰아둔 점 등이 지적된다. SK C&C 데이터센터는 지하 3층에 메인 전기실과 UPS실, 배터리실이 함께 있다. UPS실과 배터리실은 별도 공간이긴 하지만 네 개의 출입문으로 연결돼 있다. 배터리에서 화재가 발생했을 때 소방수를 살포하기 위해선 중앙 전원까지 차단해야 하는 구조였던 것이다. SK C&C 관계자는 “소화 약제로 1차 진화를 했으나 소방수를 살포해야 하는 상황이 되자 안전을 위해 전체 전력을 차단할 수밖에 없었다”고 말했다. 반면 데이터센터를 운영 중인 다른 업체들의 경우 해당 시설들을 별도 층에 분리해 안전을 확보하거나 화재 위험을 고려해 리튬이온 배터리를 아예 사용하지 않는 것으로 나타났다. LG유플러스는 메인 전기실과 배터리실·UPS실을 각각 다른 층에 배치해 중앙 전원과 유사시 전원을 물리적으로 분리하고 있다. KT의 경우 2020년 화재 위험 등을 고려해 리튬이온 배터리를 리튬인산철 배터리, 납축전지로 교체했다. 네이버는 회전형 다이내믹 UPS를 사용하고 있어 배터리가 필요 없는 구조라고 밝혔다. 이번 사고 후 삼성SDI와 LG에너지솔루션 등 다른 데이터센터에 리튬이온 배터리를 납품한 업체들도 운영사인 삼성SDS, LG CNS 등을 통해 추가적인 사전 점검 작업을 진행하고 있는 것으로 전해졌다.성남=전남혁 기자 forward@donga.com 곽도영 기자 now@donga.com}
대규모 서비스 장애를 일으킨 카카오의 경영진이 비상 상황에 대비한 망 이원화와 재난 대응 훈련에 소홀했던 점을 인정하며 고개를 숙였다. 남궁훈 각자대표는 사태의 책임을 지고 19일 사퇴했다. 19일 남궁훈·홍은택 카카오 각자대표는 19일 경기 성남시 카카오 판교캠퍼스에서 열린 기자회견에서 “불편을 겪으신 모든 분들께 진심으로 사과드린다”고 밝혔다. 홍 대표는 “국민 대다수가 쓰는 카카오톡은 공공성을 띠는 서비스지만 저희는 그에 부합하는 책무를 다하지 못했다”고 했다. 신속하게 데이터 복구가 이뤄지지 못한 원인에 대해 홍 대표는 “이런 일이 발생하면 20분 안에 복구하는 것을 목표로 한다”며 “하지만 데이터센터가 완전히 셧다운되는 경우를 상정하고 대응을 하지 않고, 개발자들의 주요 작업 및 운영 도구가 이중화되지 못해 시간이 오래 걸렸다”고 해명했다. ‘서버 편중’ 실태도 구체적으로 드러났다. 홍 대표는 “9만 대의 (전체) 서버가 전국 데이터센터 4곳에 분포돼 있다”고 밝혔다. 전체 카카오 서버의 30%가량인 3만2000대가 판교 데이터센터 한 곳에 몰려 있었던 것이다. 그는 “연내로 4개 데이터센터 모두 개발자 도구 이중화를 완료할 계획”이라며 “추가로 2024년 1월 경기 안산에 12만 대 규모의 데이터센터를 개통할 예정”이라고 했다. 무료 서비스 이용자에 대한 보상 대책도 마련하겠다고 밝혔다. 홍 대표는 “유료 서비스 이용자뿐 아니라 피해를 입은 이용자와 파트너, 다양한 이해관계자에 대한 보상을 검토할 것”이라고 말했다. 카카오는 19일부터 약 2주간 별도의 신고 채널을 열고, 신고 내용을 기반으로 보상 대상 및 범위 등에 대한 논의를 진행할 예정이다. 남궁 대표는 3월 대표에 취임한 지 7개월 만에 사의를 표명했다. 남궁 대표는 “어느 때보다 참담한 심정과 막중한 심정을 통감한다”며 “카카오의 쇄신과 변화에 대한 의지를 다지고자 대표이사직을 내려놓는다”고 말했다. 카카오는 당분간 홍 대표 단독 체제로 운영된다. 남궁 대표는 이번 사태의 대응 컨트롤타워인 비상대책위원회의 재난대책소위를 맡아 사태 수습 등을 맡는다.성남=전남혁 기자 forward@donga.com}
대규모 서비스 장애를 일으킨 카카오의 경영진이 비상 상황에 대비한 망 이원화와 재난 대응 훈련에 소홀했던 점을 인정하며 고개를 숙였다. 남궁훈 각자대표는 사태의 책임을 지고 19일 사퇴했다. 19일 남궁훈·홍은택 카카오 각자 대표는 19일 경기 성남시 카카오 판교캠퍼스에서 열린 기자회견에서 “불편을 겪으신 모든 분들께 진심으로 사과드린다”고 밝혔다. 홍 대표는 “국민 대다수가 쓰는 카카오톡은 공공성을 띠는 서비스지만 저희는 그에 부합하는 책무를 다하지 못했다”고 했다. 신속하게 데이터 복구가 이뤄지지 못한 원인에 대해 홍 대표는 “이런 일이 발생하면 20분 안에 복구하는 것을 목표로 한다”며 “하지만 데이터센터가 완전히 셧다운되는 경우를 상정하고 대응을 하지 않고, 개발자들의 주요 작업 및 운영 도구가 이중화되지 못해 시간이 오래 걸렸다”고 해명했다. ‘서버 편중’ 실태도 구체적으로 드러났다. 홍 대표는 “9만 대의 (전체) 서버가 전국 데이터센터 4곳에 분포돼있다”고 밝혔다. 전체 카카오 서버의 30%가량인 3만2000대가 판교 데이터센터 한 곳에 몰려 있었던 것이다. 그는 “연내로 4개 데이터센터 모두 개발자 도구 이중화를 완료할 계획”이라며 “추가로 2024년 1월 경기 안산에 11만 대 규모의 데이터센터를 개통할 예정”이라고 했다. 무료서비스 이용자에 대한 보상 대책도 마련하겠다고 밝혔다. 홍 대표는 “유료서비스 이용자뿐 아니라 피해를 입은 이용자와 파트너, 다양한 이해관계자에 대한 보상을 검토할 것”이라고 말했다. 카카오는 19일부터 약 2주간 별도의 신고채널을 열고, 신고 내용을 기반으로 보상대상 및 범위 등에 대한 논의를 진행할 예정이다. 남궁 대표는 3월 대표에 취임한 지 7개월 만에 사의를 표명했다. 남궁 대표는 “어느 때보다 참담한 심정과 막중한 심정을 통감한다”며 “카카오의 쇄신과 변화에 대한 의지를 다지고자 대표이사직을 내려놓는다”고 말했다. 카카오는 당분간 홍 대표 단독 체제로 운영된다. 남궁 대표는 이번 사태의 대응 컨트롤타워인 비상대책위원회의 재난대책소위를 맡아 사태 수습 등을 맡는다. 전남혁 기자 forward@donga.com}
“카카오 서비스를 책임지는 대표로서 어느때보다 참담한 심정과 막중한 책임을 통감하며, 카카오의 쇄신과 변화에 대한 의지를 다지고자 대표이사직을 내려놓습니다” 남궁훈 카카오 대표이사가 SK C&C 데이터센터 화재로 발생한 카카오 서비스 장애 사태에 책임을 지고 사의를 표명했다. 경영진의 ‘주식 먹튀’ 상황에서 신뢰를 확보하기 위해 올 3월 취임한 뒤 약 7개월 만이다. 카카오는 이날 사고 조사 및 이용자 보상 계획, 재발방지책도 함께 내놓았다.●취임 7개월만 사퇴 남궁 대표 “카카오 치부 드러내야할수도” 19일 경기도 성남 카카오 판교캠퍼스에서 열린 기자회견에서 남궁 대표는 “카카오뿐만 아니라 업계의의 재발을 방지하려면 카카오의 치부를 드러내야 할 수 도 있지만, 이것 또한 카카오의 의무라고 생각한다”며 “처절한 반성과 함께 사회에 마지막 소임을 다하겠다”고 말했다. 남궁 대표는 이번 사태의 대응 컨트롤타워인 비상대책위원회의 재난대책소위를 맡아 사태 수습 등을 맡을 계획이다. 남궁 대표가 취임 7개월여만에 사퇴하면서 카카오는 당분간 홍은택 대표 단독 체제로 운영된다. 메타버스 서비스 등 남궁 대표가 앞장서 추진하던 카카오의 신사업은 권미진 수석부사장이 이끌어갈 전망이다. 카카오는 이날 기자회견에서 사고에 대한 철저한 조사와 보상안을 마련하겠다고 밝혔다. 홍은택 대표는 “카카오톡은 국민 대다수가 쓰기에 공공성을 띠는 서비스지만, 저희는 그에 부합하는 책무를 다하지 못했다”며 “직접적인 원인과 그 배경이 되는 간접적 원인까지 방대하게 조사할 예정”이라고 말했다. 피해에 대한 보상 정책에 대해서는 “유료서비스 이용자뿐 아니라 장애로 피해를 입은 이용자와 파트너, 다양한 이해관계자에 대한 보상을 검토할 것”이라고 설명했다. 카카오는 고객센터 등을 통해 이뤄지던 기존 채널과 별개로 19일부터 약 2주간 별도의 신고채널을 열고 신고받은 내용을 기반으로 보상대상 및 범위등에 대한 논의를 진행할 예정이다.●‘데이터센터 셧다운’ 가정한 훈련 없었다 이날 기자간담회에서는 카카오가 대규모 장애를 겪은 이유에 대한 추가적인 배경이 공개됐다. 카카오에 따르면 카카오의 전체 서버는 전국 데이터센터 4곳에 약 9만 대가 분포돼있다. 30%에 달하는 3만 2000대의 메인서버가 판교 데이터센터에 편중돼 큰 규모의 피해가 발생한 셈이다. 카카오는 서버의 데이터 자체는 모두 이중화가 되어있었지만 이를 운영하는 작업도구가 이중화되지 않았다는 설명을 내놓았다. 홍 대표는 “고객의 데이터, 주요 서비스 응용프로그램은 이중화가 되어있었지만 그것을 다루는 개발자의 작업도구가 이중화되지 않은게 대처의 실패”라고 밝혔다. 극단적인 재난 상황과 셧다운을 대비한 재해 대응 및 복구 시스템을 구축하지 못했다는 비난을 면하긴 어렵다. 카카오는 이번 사례처럼 재난 재해로 인해 데이터센터가 셧다운되는 상황은 제대로 대비하지 못했다고 인정했다. 홍 대표는 “카카오톡직원들은 일종의 ‘민방위훈련’을 한다. 주 훈련 내용은 재야의 종소리가 울리는 연말 등 트래픽이 몰리는 시기를 가정한다”며 “이번처럼 데이터센터 셧다운을 대비하는 훈련은 없었다”고 말했다.●자체 데이터센터 구축, 다른 센터 임차 계획도 사건 재발 방지를 위해 안정적인 이중화와 재해대응에 대한 계획도 내놓았다. 홍 대표는 “판교 센터에는 스토리지 장비 등 무거운 장비가 많아 이동 시 오히려 위험성이 있기 때문에 이를 옮기는 계획은 없다”면서도 “현재 운영되는 데이터센터 4곳 외에도 다른 센터의 상면공간을 확보하고, 화재의 근본 원인이었던 리튬이온배터리 대신 납축전지를 사용하는 대안도 검토 중”이라고 설명했다. 카카오는 이날 건축 예정인 자사 데이터센터의 구체적인 규모와 현황, 방재 계획 등을 내놓았다. 2023년 9월 준공 예정으로 2024년 1월 본격 가동이 예정된 경기도 안산 제1데이터센터는 12만 대의 서버를 수용할 수 있다. 2024년 1월에는 서울대 시흥캠퍼스에도 제2데이터센터 건설이 예정돼있다. 전남혁 기자 forward@donga.com}
데이터센터 화재에 따른 ‘카카오 먹통 사태’의 원인과 대처를 놓고 데이터센터 운용사인 SK C&C와 서비스 제공사인 카카오가 다툼을 벌이고 있다. 서비스 이용자들의 대규모 피해를 초래한 책임을 서로 양측에 미루는 모양새다. 피해 고객들에게 카카오가 먼저 보상한 뒤 SK C&C에 구상권을 청구할 것으로 예상되는 가운데 향후 법정 다툼까지 불가피할 것으로 보인다. 우선 화재 발생 후 전원이 완전히 차단되기까지 2시간 정도 시간이 있었는데 왜 제대로 된 대응이 이뤄지지 못했는지에 대해 입장이 엇갈리고 있다. 경기 성남시 SK C&C 판교데이터센터의 전기실에서 화재가 발생한 것은 15일 오후 3시 19분경, 센터 전체의 전원 공급이 중단된 것은 오후 4시 52분이다. 이후 30분간 무정전전원장치(UPS)가 가동됐다. 이에 대해 카카오 측은 화재 직후인 오후 3시 33분경 카카오 서버의 전원이 다른 입주 기업 서버보다 먼저 차단됐고, 이 때문에 다른 기업들보다 피해가 훨씬 컸다고 주장한다. 전기실 내부의 배터리에서 발생한 화재가 카카오 서버로 통하는 전력 공급 라인 일부에 영향을 미친 것으로 추정된다. 카카오 측은 “화재 발생 직후 전원이 차단되면서 (초반) 복구 작업에 어려움이 있었다”고 밝혔다. 대부분 복구를 완료한 다른 입주 기업과 달리 카카오는 18일 밤까지도 판교센터에 있는 서버 3만2000대 중 9000여 대를 복구하지 못한 상태다. 다만 카카오가 ‘재해 복구(DR)’ 체계를 사전에 제대로 구축했었다면 대형 피해를 막을 수 있었다는 비판에서 자유로울 수 없다. SK C&C 측은 “전력 공급 장치 문제로 화재 초기에 카카오 일부 서버에 전력 공급이 안 됐던 건 사실”이라고 인정했다. 다만 “카카오 전체 서버가 영향을 받은 것은 아니었고, 다른 입주사의 서버 일부도 전원이 차단된 것으로 안다”고 했다. 다른 기업들도 초기 피해를 입었지만 서비스 장애 정도가 크지 않았던 점을 강조해 카카오에 책임을 돌리려는 것으로 해석된다. 하지만 화재 초기 전력 공급이 차단되면서 데이터센터의 설계 구조에 미흡한 점이 있었다는 비판은 피할 수 없다. 홍석주 협성대 컴퓨터공학과 교수는 “서버 이중화뿐만 아니라 인터넷데이터센터(IDC) 전력의 이중화, 삼중화도 중요한 부분”이라며 “시설 운영상 예상할 수 있는 화재로 전원이 셧다운 됐다면 구조적인 문제를 되짚어볼 필요가 있다”고 설명했다. 화재 확산 방지를 위한 전력 차단 절차가 적절했는지도 쟁점이다. 오후 4시 52분경 소방당국이 “화재 진압에 물을 사용해야 한다. 누전 위험이 있으니 전력을 차단해 달라”고 요청하자 SK C&C 측은 센터의 전체 전력 공급을 중단했다. 이 과정에서 카카오 서버를 비롯한 모든 입주 기업 서버의 전원 공급이 끊겼다. SK C&C 측은 “전력 차단 10여 분 전 카카오 측에 이를 알리고 양해를 구했다”는 입장이다. 반면 카카오는 “일방적으로 통보를 받았을 뿐”이라고 주장하고 있다. 아직 피해 복구가 끝나지 않은 상황에서 책임 공방이 벌어지는 것은 본격적인 배상이나 구상권 청구 등을 앞두고 벌어지는 힘겨루기의 전초전이라는 관측이 나온다. 보험업계 및 금융투자업계에 따르면 이번 화재로 인해 카카오가 입은 하루 피해액만 약 200억 원으로 추정되지만 SK C&C의 배상책임 보험 한도는 70억 원가량인 것으로 알려졌다.전남혁 기자 forward@donga.com}
데이터센터 화재에 따른 ‘카카오 먹통 사태’의 원인과 대처를 놓고 데이터센터 운용사인 SK C&C와 카카오가 다툼을 벌이고 있다. 특히 화재 발생 직후 카카오 서버 상당수의 전원 공급이 중단됐는데 이에 대한 책임을 놓고 입장 차를 드러내고 있다. 화재 확산을 막기 위해 전력을 모두 차단하는 과정에서도 충분한 소통이 이뤄지지 않았다는 주장이 나와 향후 구상권 청구 등 손해배상과 관련해 책임 공방이 예상된다. 향후 책임소재를 놓고 주목되는 점 중 하나는 카카오 서버 대부분을 마비시킨 초기 화재에 SK C&C가 적절히 대응했는지의 여부다. 카카오와 SK C&C에 따르면 15일 오후 3시 19분경 경기 성남시 SK C&C 판교데이터센터의 전기실에서 화재가 발생한 직후인 오후 3시 33분경 카카오 서버 상당수의 전원이 다른 입주 기업 서버보다 먼저 차단됐다. 전기실 내부의 배터리에서 발생한 화재가 카카오 서버로 통하는 전력 공급 라인 일부에 영향을 미친 것으로 추정된다. 카카오는 “화재 발생 직후 전원이 차단되면서 (초반) 복구 작업에 어려움이 있었다”고 밝혔다. 대부분 복구를 완료한 다른 입주 기업과 달리 카카오는 18일 오후 2시 기준으로도 판교 센터에 있는 서버 3만 2000대중 9000여대를 복구하지 못한 상태다. 이에 대해 SK C&C도 “전력 공급 장치 문제로 화재 초기부터 카카오 서버에 일부 전력 공급이 안됐던 건 사실”이라고 수긍했다. 앞으로 논의과정에서 ‘초반 화재를 막기 위해 적절히 대응했는지’, ‘이중 전력 공급망이 없었는지’ 등의 여부가 쟁점화될 가능성이 있다. 화재 직후 카카오 서버의 전원공급이 끊어졌을 때 보조 전력 장치인 무정전전원장치(UPS) 등이 곧바로 가동되지 않은 이유도 논란거리다. UPS는 주 전력이 끊겨도 일정 시간 전력을 공급하는 장치다. 이에 SK C&C 관계자는 “화재 발생 초기에는 외부에서 전력이 공급되고 있었기 때문에 UPS를 돌리지 않았다”며 “카카오 서버가 있는 (내부) 전력 공급 장치 자체에 문제가 있었기 때문에 UPS를 돌려도 전력이 공급되지 않았을 것”이라고 설명했다. 화재 확산 방지를 위한 전력차단 절차가 적절했는지에 대해서도 카카오와 SK C&C의 입장이 엇갈린다. 오후 4시 52분경 소방당국이 “화재 진압에 물을 사용해야 한다. 누전 위험이 있으니 전력을 차단해 달라”고 요청하자 SK C&C 측은 센터의 전체 전력 공급을 중단했다. 이 과정에서 카카오 서버 전체에 전원 공급이 끊겼다. SK C&C에서는 전력 차단 약 10여분 전 카카오에 이를 알리고 양해를 구했다는 입장이다. 반면 카카오는 “일방적으로 통보를 받았을 뿐”이라고 주장하고 있다. 본격적인 배상이나 구상권 청구 등을 앞두고 벌어지는 힘겨루기의 ‘전초전’이 시작된 게 아니냐는 관측이 나온다. 보험업계 및 금융투자업계에 따르면 이번 화재로 인해 카카오가 입은 하루 피해액만 약 200억원으로 추정되지만, SK C&C의 배상책임 보험 한도가 70억원 가량인 것으로 나타났다. 한편 IT업계에 따르면 UPS 운용에 대한 공통된 가이드라인이 없는 것으로 나타났다. IT업계 관계자는 “제조사, 건설사별로 가이드라인이나 전기 기술 규정은 있지만 설치 위치나 배치, 가동 기준 등에 대한 (공통된) 가이드는 없는 상황”이라고 설명했다. 전남혁 기자 forward@donga.com}
“7월 19일, 저희 데이터센터 중 하나의 냉각 시스템에 장애가 발생해 여러 서비스에 영향을 미쳤습니다. 높은 온도와 중복 냉각 시스템의 고장이 원인이었습니다. 다음과 같은 조치를 취했고, 향후 재발 방지를 위해 최선을 다하고 있습니다.” 구글이 누구나 볼 수 있도록 공개하는 자체 사고 보고서의 일부다. 사고 원인, 경과, 영향 및 재발방지책을 ‘분 단위’로 기록해 공개한다. 회사의 재해 대비 관련 매뉴얼이나 정책을 철저히 대외비로 부치는 카카오 등 국내 기업과 달리 글로벌 빅테크들은 ‘투명성’에 기반해 사고에 대비하고 있다.○ ‘분 단위’로 조치 공개하는 빅테크구글이 2020년 4월 공개한 ‘인프라 복원력 백서’에 따르면 구글 전사 직원들은 재해 시 자사 서비스의 안정적인 운영을 위해 매년 수일간 ‘재해 복구 테스트(DiRT)’를 진행한다. 의도적으로 장애를 유발해 중요한 시스템의 취약점을 찾아내고, 이를 수정하는 훈련이다. 구글은 올해 재난 복구 시스템을 포함한 데이터센터 확충에만 약 95억 달러(약 13조7000억 원)를 투자한 것으로 알려졌다. 마이크로소프트(MS)는 자사 홈페이지에 애저, 마이크로소프트365 등 자사 서비스의 재해 대응 시스템을 공개한다. 재해 시 전원 공급 계획, 물리적인 데이터센터 구분을 통한 재해 시 서비스 제공 등의 내용이 담겼다. 대다수의 글로벌 빅테크는 재해에 대비하고자 데이터를 물리적으로 떨어트려 보관한다. MS는 같은 데이터를 3곳에 복제해 보관한다. 한 곳이 지진, 홍수, 화재 등 재해의 피해를 받을 경우 다른 두 곳에서 실시간으로 그 역할을 대신하는 것이다. MS는 국내에서도 서울과 부산에 ‘쌍둥이’ 데이터센터를 지으며 똑같은 데이터가 두 곳에 자동 복제되도록 설계했다. 구글도 각 사용자의 데이터를 서로 다른 위치에 있는 많은 컴퓨터에 보관한다고 홈페이지에 명시하고 있다. 아마존웹서비스(AWS)도 물리적으로 독립적인 전원, 냉각시설 등을 갖춘 각 영역에 데이터를 분산해 보관한다.○ ‘재해 복구’ 시스템 구축 못 한 카카오글로벌 빅테크와 달리 카카오의 경우 재난 대비의 기본도 갖추지 못하고 있다는 평가를 받고 있다. ‘백업’과 ‘이중화’는 했을지 몰라도 제대로 된 ‘재해 복구(DR)’ 구축에는 실패했다는 것이다. 백업의 경우 데이터를 복제해 여러 서버에 두는 것을 뜻한다. 이중화는 하나의 통신망이 끊어지더라도 다른 통신망을 쓰는 것을 의미한다. 이에 비해 DR는 좀 더 높은 수준까지 요구한다. 서버가 정상화되는 시간 등 운영 방침에 따라 4개의 수준으로 구분되는데, 가장 높은 수준인 ‘미러사이트’의 경우 한 데이터센터의 서비스가 중단돼도 ‘중단 없이’ 물리적으로 다른 데이터센터를 통해 동시에 서비스 재개가 가능하다. 일종의 ‘쌍둥이’ 센터를 구축하는 것이다. 카카오는 “이중화 조치가 되어 있었지만 서버를 증설해 트래픽을 전환하는 데 시간이 걸리고 있다”고 해명했다. DR로 따지면 3등급 수준에 머무는 것이다. 재난 관리 투자에는 허점을 드러냈다는 비판이 나오는 이유다. 카카오는 지난해 정보 유출 방지나 재난 대응을 위한 ‘정보보호부문 투자’에 약 140억 원을 투자한 것으로 나타났다. 약 350억 원을 투자한 네이버의 40%가량에 불과하다.전남혁 기자 forward@donga.com홍석호 기자 will@donga.com}
‘국민 메신저’로 불리는 카카오톡 등 카카오의 주요 서비스가 데이터센터 화재로 주말 내내 먹통이 되면서 금융, 교통, 쇼핑 등 한국의 일상이 차질을 빚는 초유의 사태가 발생했다. 시작은 화재였지만 재난에 대비해 주요 시설을 이원화하지 않았고 장애 대응 체계도 작동하지 않아 피해를 키운 ‘인재(人災)’임이 드러나고 있다. 16일 과학기술정보통신부와 소방당국 등에 따르면 15일 오후 3시 19분 경기 성남시 SK㈜ C&C 판교데이터센터 A동 지하 3층 전기실에서 화재가 났다. SK C&C 측이 안전상의 이유로 전원을 차단하면서 이곳에 컴퓨터 서버를 둔 카카오와 네이버 등의 서비스가 오후 3시 30분경부터 차질을 빚었다. 특히 카카오 서버 3만2000대가 멈추면서 카카오톡 등 주요 서비스가 중단됐다. 이후 10시간이 지나서야 일부 서비스가 복구됐고, 16일 밤까지도 서비스 완전 복구 시점을 예상하기 어려운 상황이다. 네이버의 뉴스, 검색 서비스는 일시적 장애가 발생했다가 15일 오후 4시경 대부분 복구됐다. 이번 사태로 정보기술(IT) 강국이라는 한국의 후진적 재난 대응이 민낯을 드러냈다는 지적이 나온다. 서비스 중단을 막기 위해 데이터센터 전원을 차단하지 않고 화재를 진압하는 방안 등의 대비책이 마련돼 있지 않았다. 특히 실사용자가 4750만 명인 카카오톡을 서비스하는 카카오의 미흡한 대비가 도마에 올랐다. 4군데로 분산했다고는 하지만 사실상 판교 한 곳에 대다수 서버를 집중했고, 문제 발생 시 즉각 예비 서버로 돌리는 작업도 신속하게 처리하지 못했다는 것이다. 카카오는 남궁훈 홍은택 각자대표이사의 사과문을 통해 “데이터센터 한 곳 전체가 영향을 받은 것은 이례적인 상황이어서 이원화 조치를 적용하는 데 예상보다 오랜 시간이 걸렸다”고 설명했다. 제대로 준비가 되지 않았다는 점을 자인한 셈이다. 윤석열 대통령은 16일 오전 “카카오, 네이버 등 서비스 중단으로 우리 국민께서 겪고 계신 불편과 피해에 대해 매우 무겁게 느끼고 있다”고 밝혔다. 대통령실은 “네트워크망 교란은 민생에 상당한 피해를 줄 뿐만 아니라 유사시 국가 안보에도 치명적 문제를 야기한다”며 철저한 재발 방지책을 주문했다. 윤 대통령 지시로 과기정통부는 기존 방송통신재난대응상황실을 이종호 장관이 주재하는 방송통신재난대책본부로 격상해 대응에 나섰다. 지민구 기자 warum@donga.com홍수영 기자 gaea@donga.com성남=전남혁 기자 forward@donga.com}
“서비스 장애 관련 문의는 1577-3357로 부탁드립니다. 많은 문의로 연결이 지체될 수 있습니다.” 카카오는 15일 오후 8시 55분 트위터에 처음으로 불편 사항을 문의할 수 있는 전화번호를 공지했다. 카카오톡 등 주요 서비스는 물론이고 포털 다음, 카카오 웹사이트까지 마비된 지 5시간 20분이 지난 뒤에야 상담 창구를 안내한 것이다. 이용자들이 트위터와 페이스북 등을 통해 전화 연결이 어렵다는 점을 항의하자 카카오는 한발 늦게 공식 이메일 주소도 올렸다. 대다수 일반 이용자는 카카오가 연락 창구를 안내하기 전까지 다른 소셜네트워크서비스를 통해 자체적으로 피해 현황을 파악했다. 일부 인터넷 커뮤니티 게시판에선 서비스 장애가 발생한 카카오의 디지털 서비스 목록을 집단지성 형태로 취합하기도 했다. 한 이용자는 “카카오가 긴급 상황 때 어떠한 방식으로 공지하는지 전혀 알 수가 없었다”고 꼬집었다. 관계 당국에 따르면 카카오, 네이버 등 주요 정보기술(IT) 기업은 디지털 서비스 장애 발생 시 내용, 원인, 조치 내용, 상담 연락처 등을 구체적으로 공개해야 한다. 과학기술정보통신부는 지난해 12월 공개한 ‘부가통신사업자의 서비스 안정성 확보 등을 위한 지침’을 통해 이러한 조치를 하도록 했다. 이 지침은 지난해 카카오톡에서 2시간 동안 발생한 메시지 전송·수신 오류와 네이버 블로그에서 70분간 나타난 접속 장애 현상의 대책으로 마련된 것이다. 카카오가 서비스 장애 원인을 트위터로 공지한 시점도 오후 4시 12분으로 화재 발생 후 50여 분이 흐른 뒤였다. 이후 4시간 넘게 일반 이용자를 대상으로 추가적인 공식 복구 진행 상황 등을 공지하지 않았다. 카카오가 트위터에 더해 페이스북으로 장애 현황을 안내하기 시작한 것은 오후 5시 51분이다. 포털 사이트 다음에 카카오 남궁훈 홍은택 각자대표 명의로 사과문을 게재한 뒤 트위터, 페이스북 등을 통해 공개한 것은 오후 9시 25분경이다. 카카오는 사과문에서도 “복구 조치에 예상보다 오랜 시간이 걸리고 있다”며 정확한 장애 현황과 정상화 시점 등을 밝히지 못했다. 과기정통부는 이번 화재로 서비스 장애가 발생한 IT 기업이 이용자들에게 장애 상황 등을 제대로 알렸는지 점검할 예정이다. 홍진배 과기정통부 네트워크정책실장은 “카카오, 네이버 등에 서비스 장애 현상과 관련된 자료 제출을 요구한 상태”라며 “앞으로 조사를 통해 법령 위반 여부를 판단하겠다”고 말했다.성남=전남혁 기자 forward@donga.com지민구 기자 warum@donga.com}
“재난 대비를 한다면서 화재 위험을 고려하지 않았다는 게 이해가 되지 않는다.” 네트워크 설비와 체계에 밝은 정보기술(IT) 업계 관계자는 카카오 측이 데이터센터 화재에 대해 ‘이례적 상황’이라고 설명한 데 대해 이렇게 반문했다. 카카오의 재난복구(DR·Disaster Recovery) 준비가 기본도 되지 않았다는 비판이 나오는 이유다.○ “화재 시나리오 예상 못 해” 일반적으로 IT 기업은 디지털 서비스가 재난재해 상황에서도 큰 문제 없이 이어질 수 있도록 국내외 여러 지역 데이터센터에 서버를 둔다. 카카오도 15일 오후 화재가 발생한 SK C&C 판교데이터센터와 경기 안양시 등 국내 4개 지역에 위치한 데이터센터 서버 시설을 임차해 사용하고 있다. 문제는 카카오가 SK C&C 데이터센터에서만 3만2000대의 서버를 운용했다는 것이다. 판교 한 곳에 지나치게 많은 서버 시설을 배치하고 카카오톡, 카카오T 등 중요 서비스를 집중하다 보니 서버 이중화 조치의 실효성을 떨어뜨렸다는 지적이 나온다. 예비 서버로 연결하는 작업도 제대로 이뤄지지 않았다. 이러다 보니 20분 안에 복구한다는 내부 원칙과는 달리 임시 복구까지 10시간 넘게 걸렸다. 재난 대응이 미흡했던 이유에 대한 카카오의 설명도 이해가 가지 않는다는 지적이 나온다. 양현서 카카오 대외협력 부사장은 “이렇게 대규모로 서버가 전부 멈추는 것은 IT 업계에서 유례를 찾기 어려운 상황”이라며 “저희가 예상한 위험 대응 시나리오가 있었지만 화재는 워낙 예상을 못 해서 대비책이 부족했다”고 말했다. 불과 4년 전 서울과 경기 지역에서 대규모 통신 장애를 일으킨 KT의 서울 아현지사 화재 사고가 발생한 것을 생각하면 납득하기 힘든 설명이다. 문제가 반복적으로 발생하는데도 근본적 대책 마련이 미흡했다는 비판도 있다. 이달 4일 카카오톡 PC 버전이 18분간 장애를 일으키는 등 이번 화재 전에도 올해만 5차례 카카오 서비스에서 장애가 발생했다. ○ 한발 늦은 인프라 투자 네이버 역시 이번 화재가 발생한 같은 데이터센터를 이용했지만 상대적으로 피해가 크지 않았다는 점도 카카오로서는 뼈아픈 부분이다. 업계에서는 자체 데이터센터 건립 등의 투자에서 카카오가 네이버에 비해 한발 늦었다고 지적한다.네이버는 강원 춘천시에 대규모 서버 시설을 갖춘 데이터센터 ‘각’을 지어 2013년부터 운영했다. 또 여러 지역의 서버 시설을 임차해 예비용으로 활용하면서 세종시에 2번째 데이터센터 ‘각 세종’을 짓고 있다. 홍진배 과학기술정보통신부 네트워크실장은 “네이버는 (예비 서버로 연결하는) 이중화 조치를 완료해 모든 서비스가 정상적으로 작동하는 것으로 파악하고 있다”고 말했다. 반면 카카오는 직접 보유한 데이터센터가 없다. 4000억 원을 투자한 경기 안산시 데이터센터는 내년 준공이 목표다. 대형 시스템통합(SI) 업체 관계자는 “카카오가 우리 사회에 미치는 영향력을 고려하면 뒤늦게 투자 결정이 이뤄진 것”이라며 “카카오 ‘문어발’이라는 말이 나올 정도로 사업 확장과 기업 가치 확대에만 신경을 쓰고 기본은 소홀히 한 결과”라고 지적했다. 한편 카카오는 홍은택 각자대표가 총괄하는 비상대책위원회를 출범시켜 조사, 재난 대응, 보상 대책 등을 추진하기로 했다. 다음 주에 피해를 신고할 수 있는 채널을 마련해 신고 접수를 시작할 예정이다.지민구 기자 warum@donga.com성남=전남혁 기자 forward@donga.com}
넷플릭스 등 글로벌 빅테크는 수년 전부터 대규모 정전 등으로 서버 전체가 마비되는 극단적인 상황을 가정해 훈련하고 있다. 데이터센터 화재에 대해 ‘불이 나는 상황을 예상하지 못했다’는 국내 기업들의 해명과는 대조적이다. 의도적으로 통신 장애를 가정해 대응 상황을 훈련토록 한 ‘카오스 엔지니어링’이 대표적인 사례다. 모든 정보기술(IT) 서비스를 아마존 웹서비스(AWS)로 이관해 사용 중인 넷플릭스는 의도적으로 AWS의 인프라를 무작위로 마비시키는 ‘카오스 몽키’를 고안했다. 특정 시점에 경고 없이 인프라를 마비시켜 약점을 노출시키고, 엔지니어가 더 나은 복구 메커니즘을 구축하는 것이 목표다. 이에 더 나아가 전체 클라우드 서버를 종료하는 ‘카오스 콩’을 통해 인프라 장애의 극단적 사례에 대응하기도 했다. 넷플릭스는 2015년 9월 아마존의 서버 문제로 짧은 장애를 경험했지만 카오스 콩 등 지역의 정전을 시뮬레이션하는 정기적 실험을 통해 시스템의 약점을 조기에 식별하고 수정할 수 있었다고 밝혔다.전남혁 기자 forward@donga.com}
윤석열 대통령은 16일 카카오톡 ‘먹통’ 사태에 대해 과학기술정보통신부 장관 주재의 방송통신재난대책본부로 격상해 대응하고, 민관에 철저한 재발 방지책 마련을 주문했다. 대통령실에 따르면 윤 대통령은 15일 이종호 과기부 장관에게 신속한 대응을 지시한 이후 이날 추가로 장관 주재 현장회의를 주문했다. 윤 대통령은 이어 “정확한 원인 파악은 물론이고 트윈 데이터센터 설치 등을 포함한 사고 예방 방안과 사고 발생 시 보고, 조치 제도 마련도 철저히 이뤄져야 한다”고 강조했다. 김은혜 대통령홍보수석비서관은 별도 브리핑에서 “네트워크망 교란은 민생에 상당한 피해를 줄 뿐 아니라 유사시 국가 안보에도 치명적 문제를 야기한다”고 말했다. 카카오와 네이버가 제공하는 서비스가 국민 생활뿐만 아니라 안보와도 직결돼 있는 현실에서 정부 차원의 관리·감독이 필요하다는 뜻을 강조하려는 취지로 풀이된다. 이와 관련해 데이터센터를 사회기반시설로 보는 국가재난관리기본계획 개정이 추진될 것으로 전망된다. 이 장관은 이날 경기 성남시 SK C&C 판교데이터센터 화재 현장을 점검한 뒤 “중요한 부가통신 서비스와 관련 시설에 대한 점검·관리 체계를 보완하는 등 필요한 제도적·기술적 방안들을 적극 검토하겠다”고 말했다. 실제 네이버, 카카오 등 부가통신사업자는 SK텔레콤, KT, LG유플러스 등 기간통신사업자에 비해 긴급 상황에 대한 예방 및 조치에서 비교적 자유롭다. 2020년 방송발전기본법 개정 논의 과정에서 데이터센터를 사회기반시설로 봐야 한다는 주장이 제기됐지만 재산권 침해 논란을 불러올 수 있다는 기업들의 반발로 무산된 바 있다. 한편 국회 과학기술정보방송통신위원회는 24일 종합감사에서 카카오와 네이버, SK C&C 경영진을 증인으로 채택하는 안건을 17일 의결하기로 했다. 다만 국민의힘은 카카오 남궁훈 홍은택 각자대표, 네이버 최수연 대표, SK C&C 박성하 대표 등 각사 실무책임자를 증인으로 부르자는 입장이다. 반면 더불어민주당은 카카오 김범수 의장과 SK 최태원 회장 등 총수 출석을 고수하고 있다.홍수영 기자 gaea@donga.com전남혁 기자 forward@donga.com조동주 기자 djc@donga.com}