특허청은 22일부터 특허정보 개방 플랫폼인 키프리스플러스(KIPRISPlus)를 통해 유럽특허공보의 한글번역문 데이터를 무료 개방한다고 밝혔다.
데이터 개방범위는 2000년부터 2022년 4월까지 유럽특허청에서 영문으로 발간된 공개공보와 등록공보의 한글번역문으로 약 500만건에 이른다.
공개되는 데이터는 특허청이 개발한 인공신경망(NMT) 기계번역시스템을 활용한 것으로, 특허청은 2018년부터 세계지식재산기구(WIPO), 국내 IT전문기업 등과 업무협약을 통해 기술을 이전받아 인공지능 번역엔진의 자체개발을 추진해왔다.
그동안 특허청은 최적화된 번역기술 개발을 위해 특허공보, 심사 및 심판문서에서 약 1033만건의 학습데이터를 구축, 학습을 통해 기계번역 성능을 지속 개선했고 번역서비스의 품질을 측정할 수 있는 체계를 마련해 품질 고도화를 꾀했다.
올해 자체개발한 인공지능 영한번역기를 활용해 유럽특허공보의 한글번역문을 우선 개방하고 내년에는 약 1700만건에 달하는 미국특허공보의 한글번역문으로 개방 범위를 확대해 나갈 예정이다.
또 영미권 언어 이외에 중한 인공지능 번역엔진도 개발해 중국 특허문헌에 대한 번역문도 중장기적으로 개방해 나갈 계획이다.
개방된 데이터를 활용하면 해외 특허문헌에 대한 한글 검색과 분석 등이 가능해 관련 민간업체의 다양한 지식재산 서비스 개발 및 시장 활성화에 도움이 될 것으로 기대된다.
특허청 김기범 정보고객지원국장은 “데이터 장벽이 사라진 상황에서 언어 장벽으로 해외 기술정보가 제대로 활용되지 못한다면 글로벌 기술패권 시대에 한국의 기술경쟁력이 뒤처지는 원인이 될 수 있다”며 “누구나 쉽고 빠르게 국내외 특허데이터에 접근, 필요한 정보를 활용할 수 있도록 AI번역시스템을 포함한 특허데이터 개방서비스를 지속 확대해 나갈 것”이라고 말했다.
댓글 0