오피니언 마이닝 사회관계망 분석이란 말은 여전히 일반인들에게 낯설다. 하지만 온라인과 소셜네트워크서비스(SNS)에서 데이터가 폭발적으로 급증하는 이른바 빅 데이터의 시대에 이런 낯선 단어는 우리에게 새로운 기회를 준다. 해당 분야의 전문가가 아니더라도 데이터의 의미를 읽어내면 사안의 흐름을 파악하고 예측도 할 수 있기 때문이다.
SAS코리아가 동아일보와 함께 서울시장 보궐선거와 관련된 트위터의 여론을 분석하면서도 이런 사실은 입증됐다. 여론조사 기관은 이번 선거에서 두 후보가 박빙의 대결을 펼치면서 오차범위에 있다고 내다봤다. 하지만 트위터상의 데이터를 분석해보면 여론은 초반부터 선거 전날까지 박원순 후보에게 유리했다.
이번 작업은 기존의 SNS 분석과는 질적인 면에서 차이가 컸다. 기존 분석은 대부분 단순히 트위터에서 언급되는 후보 이름의 총량을 합하는 수준이었다. 한 걸음 더 나아간 분석 도 단순히 글의 긍정과 부정을 파악했을 뿐이다. 하지만 이번 분석은 총량은 물론이고 신뢰도와 청렴도, 이미지 등 5가지 측면을 기준으로 사용자들이 각 후보에 대해 느끼는 감정까지 파악했다.
선거운동 기간에 형성된 각 후보의 커뮤니티 규모와 성향은 트위터 사용자 간의 관계를 밝혀내는 사회관계망 분석에서 드러났다. 나경원 후보가 트위터상에서 양적인 홍보에만 집중했다는 정치 전문가의 추론이 데이터로 입증된 것이다.
일부 선진국에서는 이미 이런 기법이 비즈니스 분야는 물론이고 여론분석 및 트렌드를 파악하는 데 응용되고 있다. 한국의 전문가 집단도 자신들의 오랜 경험에 데이터를 읽어내는 새로운 능력까지 갖춘다면 한 차원 높은 통찰력을 얻게 될 것이다.