뉴스 트렌드 생활정보 International edition 매체

“비정형데이터 품질 관리는 선택 아닌 필수”

입력 | 2022-02-25 03:00:00

㈜에이씨엔에스



양진서 대표


“데이터 중심의 AI 시대가 도래했다. 세계 각 기업들은 데이터 산업 전략과 플랫폼 구축을 위해 많은 노력을 기울이고 있다. 하지만 지금까지 데이터는 수치만으로 의미 파악이 쉬운 정형데이터를 중심으로 이루어져 왔다. 그러나 같은 종류의 정형데이터 일지라도 데이터의 가치는 각기 다르다. 개인정보에 해당하는 정형데이터가 누출될 경우 사회적으로 심각한 문제가 될 수 있다.”

비정형 데이터 솔루션 전문기업인 ㈜에이씨엔에스의 양진서 대표는 “비정형데이터의 품질에 대한 기준은 사실상 무방비 상태에 가깝기 때문에 정책 개선이 필요한 시점”이라고 제언했다.

비정형 데이터 중 전자문서는 보존연한에 따라 중요도를 구분하고 있지만 현재 NIA(한국지능정보사회진흥원)에서 제공 중인 데이터품질관리 매뉴얼(62p)에 따르면 이미지, 동영상 등 비정형화된 정보의 오류진단 여부를 육안으로 확인하도록 의무화하고 있다. 양 대표는 “지자체 연간 생산, 관리 전자문서는 최소 10만 건 이상이다. 비정형데이터 품질검사를 사람의 육안에 의존한다는 것은 불가능하다”고 지적했다.

한편, 국가가 생산한 보존연한 30년 이상의 중요 전자문서들이 2015년부터 소프트웨어 버그 및 호환성 문제 등으로 데이터 손상이 눈에 띄게 발생하였고 하드디스크의 발열, 진동, 먼지 등에 의한 장애 원인도 꾸준히 문제가 되고 있다.

이런 문제로 행정안전부 등 일부 기관은 지난해부터 문서 기안 시 주요 전자문서들의 오류 및 손상 여부를 자동으로 검사하는 기능을 ‘온-나라 문서 2.0 시스템’에 적용해 운영하고 있으나 다른 기관들의 관심과 참여도 절실한 상황이다.

양 대표는 “데이터 기반의 인공지능 기술이 정형데이터에만 의존하게 되면 더 이상 경쟁력을 찾기 어려울 것”이라고 전했다. 비정형데이터의 품질 관리는 더 이상 선택이 아닌 필수로 자리매김해야한다는 설명이다.

조선희 기자 hee3110@donga.com