○빅데이터와 피자
스플렁크 본사는 샌프란시스코 동쪽 해안(피어 30)에서 약 500m 떨어진 곳에 자리 잡고 있었다. 통유리로 된 깔끔한 7층 건물은 겉보기에는 다른 건물과 별반 다르지 않았다. 그러나 문을 열자 완전히 새로운 세상이 펼쳐졌다. 사람들이 스탠딩 파티에서처럼 접시를 들고 아침 식사를 하고 있었다. 한쪽에는 커다란 블록과 포켓볼대가 구비된 놀이 공간이 보였다.
한국계인 조용현 스플렁크 기술마케팅 이사(43)가 기자를 놀이 공간 바로 옆쪽에 마련된 회의실로 안내했다. 회의실 스크린에는 색깔과 비율이 실시간으로 변하는 원그래프가 띄워져 있었다. 조 이사가 프로그램에 특정 IP주소를 입력하자 이번에는 그래프가 꺾은선 그래프로 드라마틱하게 변했다.
조용현 스플렁크 이사
현재 미국 경제전문지 포춘이 매년 발표하는 매출액 순위 세계 최대기업 100개 중 85개가 스플렁크를 통해 머신 데이터를 분석하고 있다. 전 세계적으로 1만3000개 기업, 국내에서도 350개 기업이 머신 데이터를 분석한다. 2003년 설립된 스플렁크는 2012년 나스닥 시장에 상장돼 작년 한해에만 949억 9500만 달러(한화 약 1조 564억 원)의 매출을 올렸다.
최근 영국 공영방송 ‘BBC’, 미국의 ‘디스커버리’ 등 미디어 회사에서도 머신 데이터에 관심을 보이고 있다. 그동안 미디어 업계에서의 빅데이터 분석은 주로 언어 데이터를 구조화 해 숨은 의미를 찾아내는 작업이었다. 구글이 발표한 ‘인공신경망 기계 번역(NMT·neural machine translation) 기술이 대표적이다. 입력한 단어를 소재로 콘텐츠를 인식하고, 키워드를 추출하고, 관련 연구 동향, 웹정보, 단어에 실린 감정을 분석하는 기술이 주목을 받았다.
최근에는 여기서 한 발 더 나아가 미디어를 소비하는 행태까지도 분석 대상이 된다. 예를 들어 자체 쇼핑몰을 운영하는 BBC는 독자들이 어떤 기사를 읽고 난 뒤 물건을 구매하는지, 장바구니에 담아 놓고 사지 않는 확률이 얼마인지, 구매 절차가 10초 이상 소요되는 경우는 몇 퍼센트인지를 분석한다.
○미래 예측과 보안
기자도 들어가 ’비지니스 분석(business analytics)‘ 범주의 어플리케이션을 다운로드해봤다. 하루에 500메가바이트(MB)까지 데이터를 무료로 분석할 수 있다는 설명이 나왔다. 그 이상은 1기가바이트(GB) 당 1800달러(한화 약 206만 원)를 지불한다.
머신 데이터를 분석하면 최근의 랜섬웨어 감염 같은 중대한 보안 위협으로부터도 데이터를 지킬 수 있다. 해당 사이트의 평소 머신 데이터 흐름을 파악하고 있으면 비정상적인 머신 데이터가 나올 시 곧바로 알아차릴 수 있기 때문이다.
스플렁크의 보안을 책임지는 제이드 카탈라노(Jade Catalano·33) 씨는 “해커들이 언론사의 웹페이지에 악성코드를 감염시키면 불특정 다수의 개인에게 급속도로 퍼질 수 있다”며 “꾸준한 관리가 가장 중요하다”고 강조했다.
샌프란시스코=이영혜 동아사이언스기자yhlee@donga.com