‘행동인식 인공지능’ 상용화 성큼
이제 이런 풍경을 보기 힘들게 됐다. CCTV를 이용해 정말로 쓰레기를 버리는 사람만 골라 단속할 수 있는 기술이 나왔다. 쓰레기를 무단 투기하는 순간 촬영 소리가 나며 “쓰레기를 가져가지 않으면 처벌받을 수 있다”는 경고가 방송된다.
비밀은 행동 인식 인공지능(AI)이다. 동작을 취하는 사람의 행동을 관절 움직임까지 세밀하게 관찰해 세밀한 투기 움직임을 인식한 후 경고한다. 지난해 말 개발된 뒤 서울 은평구와 세종시에서 실증 검증을 마치고 최근 기술 이전을 위한 모든 준비를 완료했다. 지방자치단체 등에 확대 적용되면 도심에서 발생하는 범죄를 실시간 감지하고 나아가 예방하는 데 도움이 될 것으로 기대된다.
페이스북과 구글 등 글로벌 정보기술(IT) 기업은 사람의 얼굴을 정교하게 인식하고 분별하는 AI 인식 서비스를 이미 앞다퉈 내놓고 있다. 얼핏 쓰레기 투기 행위 정도를 인식하는 AI 개발은 쉬워 보인다. 하지만 결코 그렇지 않다는 게 박 실장의 설명이다. 박 실장은 “세계적으로 시각 AI 분야가 크게 발전한 것은 사실이지만 아직 생각보다 잘 안 되는 게 많다”고 말했다. 예를 들어 쓰레기를 담은 비닐봉투를 AI가 알아보는 인식률은 10% 정도에 불과했다. 10개 가운데 9개는 알아보지도 못한다는 말이다.
한국전자통신연구원(ETRI) 시각지능연구실에서 개발한 행동 인식 인공지능이 쓰레기를 무단 투기하는 사람을 포착했다. 물건을 든 사람의 팔 동작과 쓰레기봉투를 인식해 투기 순간을 정확히 감지했다. ETRI 제공
이런 어려움은 시각 AI가 실은 아직 연구할 내용이 무궁무진하게 남아있다는 의미이기도 하다. 박 실장은 “사람은 2만2000개의 사물을 구분하는 것으로 알려져 있다”며 “항간에는 시각 AI가 2015, 2016년 사람과 비슷한 95%의 사물 분별 능력을 기록하면서 ‘AI가 사람의 인식 능력을 넘었다’는 말이 떠돌았지만 실은 1000여 개의 사물만 골라 집중 학습한 결과였다”고 말했다. 전체 사물을 대상으로 한 인식은 여전히 갈 길이 멀다는 뜻이다.
하지만 국내 연구자들은 시각 AI의 발전이 시간 문제에 불과하다고 자신한다. 시각 AI에서 학습과 인식 등 데이터 처리의 중추가 되는 기반 네트워크(백본망)를 이미 갖췄기 때문이다. AI에서 백본망은 주로 다양한 신경망이 담당한다. 박 실장은 “ETRI도 자체적인 백본망을 구축해 분별력이 뛰어난 시각 AI 기반을 확보했다”고 말했다. 박 실장팀이 개발한 시각 AI용 백본망은 일명 ‘이미지넷’이라고 불리는 국제영상인식대회(ILSVRC)에 2017년 참여해 사물을 종류별로 검출하는 성능 부문에서 세계 2위를 치지했다. 시각 AI 원천기술을 확보해 강력한 국제 경쟁력을 갖췄다. 박 실장은 “연구자만 1000명 단위인 글로벌 IT 기업과 비교해도 시각 AI 기술이 결코 뒤떨어지지 않는 것은 이런 탄탄한 백본망이 있기 때문”이라고 말했다.
윤신영 동아사이언스 기자 ashilla@donga.com