‘AI 허브’에 축적된 데이터 추가 개방
2022 한국어 AI 경진대회 입상자들이 10월 7일 서울 서초구 엘타워에서 열린 시상식에 참석했다. AI 허브에 추가 개방된 학습용 데이터를 바탕으로 세대별 발화 및 방언 등 다양한 우리말을 더 잘 다루도록 하기 위한 음성 인식 성능평가, 차량 안 또는 회의 도중 음성을 더 잘 인식하기 위한 기업 현안 해결 등의 분야로 진행됐다. NIA 제공
전 산업 분야에서 인공지능(AI) 활용이 급증하고 시장도 빠르게 성장하면서 AI용 데이터의 중요성은 갈수록 커지고 있다. 이에 맞춰 AI용 데이터의 품질 향상, 관련 기술의 고도화 및 인재 양성에 초점이 맞춰진 지원 사업도 다양해지고 있다.
과학기술정보통신부(장관 이종호)와 한국지능정보사회진흥원(NIA·원장 황종성)은 AI 연구와 새로운 서비스 개발에 필요한 대규모 학습용 데이터를 AI 허브에 축적해 각 분야에 지원하고 있다. 이와 함께 올해 ‘2022 한국어 AI 경진대회’ 및 ‘2022 AI 데이터 품질개선 오픈 랩’ 등을 추진하며 다양한 혜택을 제공하는 등 인재 발굴 및 기술 제고를 위한 노력을 기울이고 있다.
7월부터 10월까지 진행된 ‘2022 한국어 AI 경진대회’는 AI의 한국어 음성인식 성능 제고를 위해 마련됐다. AI 허브에 추가로 개방된 한국어 AI 학습용 데이터가 활용된 이 대회에는 전국에서 대학생, 기업 등 총 226개 팀이 참가했다. 현대자동차와 네이버클로바는 대회 기획부터 함께 참여했다. 대회 입상자들에게는 이들 기업 입사 서류전형 때 가산점이 주어진다. NIA는 앞으로도 이 대회를 이어가 관련 기술의 고도화, 인재 발굴 및 양성을 계속할 방침이다.
AI 데이터 산업계 내에 필요한 크라우드워커(데이터 라벨러 등)를 육성하기 위한 전문 교육도 확산하고 있다. AI의 필요에 맞게 데이터를 가공하는 데이터 라벨링은 나이 성별에 관계없이 누구나 할 수 있지만 이 데이터의 품질은 AI의 성능에 큰 영향을 끼친다. 정부와 NIA는 5대 권역별 현장 및 온라인 강의를 통해 AI 학습용 데이터 라벨링 전문교육을 실시했다. AI 윤리 및 관련법부터 이미지 영상 텍스트 등 데이터 유형별 라벨링 및 전문가 과정 등이 운영되고 있다. 현재까지 1만여 명이 교육과정을 수료했다.
또 올해 AI 학습데이터 직무를 국가직무능력표준(NCS)에 등록함에 따라 데이터 라벨링 등의 직무를 교육하거나 관련 인원을 채용할 때 표준화된 내용을 적용할 수 있도록 했다. 데이터 라벨러가 하나의 정식적인 직업으로 공인됐음을 의미한다.
아울러 고려대 연세대 성균관대 등 대학 내 AI 데이터 관련 수업에 참여한 학생들에게 AI 허브 데이터를 제공해 AI 모델을 손쉽게 실습할 수 있도록 했다. 올해에는 1학기 3개 대학, 2학기 8개 대학의 총 18개 강의에 600여 명의 학생이 참여했다. 대학들과의 협업은 내년에도 지속될 예정이다.
NIA 관계자는 “AI 데이터 생태계의 활성화 및 선순환 기반 구조를 구축하고 혁신적 가치를 창출하기 위해 인재 양성 및 관련 지원을 계속할 방침”이라고 했다.
이원홍 기자 bluesky@donga.com