2022년 11월 챗GPT의 등장으로 많은 사람이 충격에 빠졌다. 챗GPT를 통해 작성되는 답변이 사람이 작성하는 것과 유사할 뿐 아니라 방대한 지식을 기반으로 작성된 답변이 흡사 전문가의 언어처럼 느꼈기 때문이다. 또한 인공지능(AI)이 인간의 영역만이 할 수 있는 영역이라 여겨졌던 바둑, 그림, 소설 등에서 괄목할 만한 성과를 내고 있음을 많은 사람이 눈으로 직접 확인하게 되는 새로운 경험이었기 때문이다.
챗GPT의 등장으로 AI는 더 이상 막연한 미래의 기술이 아닌 우리 일상에 밀접한 가장 중요한 기술 중에 하나가 됐다. AI는 실제로 지금까지 불가능하다고 여겨지던 분야에서 괄목할 만한 성과를 내고 있으며 미래 국가 경쟁력에 가장 중요한 것은 AI를 국가의 주요 사업에 어떻게, 얼마나 잘 적용하느냐가 됐다.
이러한 AI의 보편적 확산으로 우리 사회는 ‘데이터 기반 사회’로 발전할 것으로 예상됨에 따라 데이터의 중요성이 다시 한번 대두되고 있다. 데이터에 대한 중요성은 이미 대한민국을 포함한 해외 주요 국가에서도 많은 정책과 제도를 통해 보여주고 있다. 그중에서도 대한민국은 세계에서도 가장 빠르게 데이터의 개방 및 활용에 초점을 두고 정책을 추진 중이다. OECD에서 공공데이터 평가를 시작한 이래로 3회 연속 1위(2015년, 2017년, 2019년)를 달성하는 등 대한민국의 데이터는 글로벌 베스트 레퍼런스가 되고 있다.
2013년 공공데이터법 제정 이후 공공데이터는 10년 동안 총 7만7000여 개 개방돼 버스 시간 예측 시스템, 공적마스크앱, 부동산앱, 비대면 진료 서비스, 요소수 데이터 등에 활용되면서 국민 삶에 꼭 필요한 존재가 됐다. 또한 기계가 학습할 수 있는 AI 학습용 데이터 총 691종을 구축했으며 AI 허브를 통해 이 중 391종을 개방해 대학 및 중소기업 등에서 AI 모델 서비스 개발을 위한 초기 연구·훈련용으로 활발하게 사용되고 있다.
이러한 실적에도 불구하고 AI·데이터 분야의 1등 국가로 나아가기 위해서는 여전히 해야 할 일이 많다. 아직도 AI 개발 및 빅데이터 분석을 위해서는 데이터 준비에 80%의 시간과 노력이 소요되며, 데이터 분석에는 정작 20%의 시간과 노력만이 소요되고 있다. 또한 대한민국에는 공공과 민간에 총 140여 개의 데이터 플랫폼이 존재하고 있어 일반 국민들이 자신에게 필요한 데이터의 소재 파악이 어렵고 민간 데이터를 사용하고자 한다면 제공 동의까지 얻어야 하는 등 많은 어려움이 존재하고 있다.
이를 해결하기 위해 한국지능정보사회진흥원(이하 NIA)은 올해 대구에 ‘데이터통합혁신센터’의 개소를 통해 공공데이터와 민간 데이터 등 국가의 모든 데이터 정책을 지원하고, 데이터 정책 개발부터 가치 창출까지 전 주기를 지원해 나갈 예정이다.
데이터통합혁신센터를 통해 가장 먼저 ‘데이터 인프라’를 구축할 예정이다. 데이터 인프라는 데이터의 소유자와 수요자의 효율적 연결, 데이터 품질·상호운영성 보장, 데이터 활용에 따른 이익·책임 보장 등을 지원할 것이며, 140여 개로 분산·운영 중인 데이터 플랫폼을 연계해 모든 데이터를 개방적이고 상호 연계된 생태계를 구축할 것이다. 이를 통해 데이터의 속도, 즉 데이터를 준비하는 데 소요되는 시간을 획기적으로 줄일 것이다.
또한 데이터통합혁신센터를 통해 2025년까지 공공데이터 5만7000개 이상을 추가로 개방할 것이며 데이터의 품질 및 상호운영성 보장을 위해 데이터 표준을 1만3000개(현재 1686개)로, 데이터 제공 표준을 300종(현재 169종)로 지속적으로 확대해 나갈 것이다. 그리고 AI 학습용 데이터 1300종을 확대 구축해 AI 학습용 데이터의 활용 촉진을 위한 AI 허브 활용성 강화, 대학 협력 등을 추진할 것이다.
황종성 NIA 원장은 “데이터통합혁신센터 개소는 대한민국 데이터 서비스 경쟁력을 강화하는 동시에 전 세계로 데이터 수출 전진기지로의 역할을 담당할 것이며 이는 대한민국 데이터의 위상을 글로벌 선두 주자로 발돋움시키는 데 밑거름이 될 것”이라고 말했다.
댓글 0