人能夠直觀地判斷事物的形態和特性,但人工智能需要經過復雜的學習過程才能發揮其應有的功能。人工智能要想從影像信息中尋找特征,提取核心信息,分析這些信息並得出正確答案,就要反復學習很多數據。這種人工智能技術適用於需要迅速追蹤和判斷靜止物體或移動物體的無人駕駛汽車等,但大部分都依賴於外國技術。
韓國電子通信研究院12日表示,人工智能研究所視覺智能研究室研究團隊開發出了視覺人工智能技術的核心算法。該研究院同時公開了學習視覺人工智能所需的以560種城市環境事物為對象的20萬張事物認識學習數據。充分利用該研究院公開的算法和學習數據,就能實現自己想要的服務和新的革新功能,這將成為國內人工智能產業堅實的基礎設施。
此次開發的視覺人工智能算法是找出照片中物體的特征,提取信息並進行分析的人工智能技術,通過“VoV網”公開。在容易與開發者共享人工智能算法的網站“Github”上上傳代碼和使用說明書,通過這種方式實現共享。研究團隊還公開了學習視覺人工智能所需的高品質照片數據。數據包括市中心的監控錄像所拍攝到的電線桿、信號燈、汽車等。
該研究院視覺智能研究室長樸鐘烈(音譯)表示:“如果充分利用VOV網,可以實現檢測事物、客體各部分分割認識、面部識別等多種功能”,“公開的學習數據也比用單純的隨機事物構成的數據更能有效地實現視覺人工智能的體現和學習。”
研究團隊還公開了即使不使用Photoshop等形象編輯專門程序,也能輕松自然地編輯人臉照片的人工智能技術。根據這種人工智能自動編輯技術,只需簡單操作,就可以給照片中人物添加本來沒有的飾品、發型、表情等。這是壹種可以進行多種編輯給臉部照片進行特殊加工的算法。
在該技術中,運用了壹種屬於深度學習的“GAN”技術。該技術能有效制造逼真的假數據,但缺點是不能完全反映使用者的意圖和條件。研究人員完善了這壹技術,使用戶能夠得出自己想要的最佳結果。
如果想使用該技術,只需將人物照片和使用者想要的輸入值放入算法中即可。它既適合用戶需要的條件,又能自然地塑造出與該照片中周邊環境相匹配的形象。樸鐘烈表示:“雖然韓國國內的視覺人工智能技術正在快速發展,但現實是國外依賴度很高”,“此次公開相關技術,是想積極支持韓國國內產學研以人工智能為基礎構建多種產業生態。”
金敏秀 東亞科學記者 reborn@donga.com