[위클리 리포트] 사회적 약자 돕는 AI 시청각 정보 동시 처리 ‘멀티모달’ 기술이 눈-귀 역할 MS는 미술 작품 해설 서비스, 오픈AI는 음성비서 개발 삼성에선 케어기능 가전 내놔… 노인 돌봄 로봇도 진화
오픈AI는 시각장애인이 \'GPT-4o\'를 통해 각종 정보를 제공받는 동영상을 13일(현지 시간) 공개했다. 오픈AI 유튜브 화면 캡처
인공지능(AI) 기술 악용에 대한 우려가 커지며 AI 윤리와 안전을 두고 세계 각국이 규제를 도입하고 있다. 하지만 한편에서는 노인과 장애인 등 사회적 약자를 돕는 서비스가 출시되고 있다. AI가 시각장애인에게 작품을 그리듯 설명하고, 홀로 사는 노인들의 안부를 체크한다. 장애인의 눈과 귀, 어르신의 말벗으로 거듭나는 ‘선한 AI’의 세계를 들여다본다.》
“‘자화상’은 1887년 빈센트 반 고흐가 판지(板紙)와 유성 페인트를 사용해 그린 그림입니다. 갈색과 흰색이 살짝 섞인 붉은 콧수염과 턱수염을 가진 남자가 그림의 주인공입니다. 그의 녹색 눈은 관람자를 직접 응시하고 있으며, 피부는 창백하고 뺨은 분홍빛입니다.”
큐레이터가 작품 앞에서 설명하는 듯한 이 내용은 마이크로소프트(MS)의 인공지능(AI) 서비스 ‘코파일럿’이 작성한 것이다. MS는 최근 네덜란드 암스테르담 국립미술관과 협력해 AI로 약 100만 건의 미술 작품에 대한 상세한 해설을 만들어내는 작업에 착수했다. 예술 작품을 온전히 향유할 수 없는 시각장애인들에게 작품 설명을 제공하기 위해서다.
암스테르담 박물관 관계자는 “코파일럿이 아니었다면 몇 년은 걸렸을 일을 단 몇 시간 만에 끝낼 수 있게 됐다”고 했다. 청력 손실과 실명을 유발하는 어셔 증후군을 앓고 있는 카린 더 브라윈 씨는 “AI가 생성한 자세한 설명을 통해 머릿속으로 작품을 그릴 수 있게 됐다”고 평가했다.
● 장애인 눈, 귀 돼 주는 빅테크 ‘멀티모달’ 기술
오픈AI가 13일(현지 시간) 공개한 새로운 음성비서 서비스 ‘GPT-4o’의 시각 및 음성 처리 능력도 시각장애인 등에게 도움이 될 수 있을 것으로 전망된다. GPT-4o는 전작 대비 10배 이상 개선된 0.32초가량의 빠른 응답 속도가 특징이다. 장애인에게 사람 수준으로 즉각적인 도움을 줄 수 있다는 얘기다.
오픈AI는 같은 날 시각장애인으로 보이는 사용자가 GPT-4o를 사용하는 동영상을 공개했다. 버킹엄궁 앞에서 사용자가 “지금 왕이 궁 안에 머물고 있니”라고 묻자 GPT-4o는 “왕이 머물고 있다는 것을 의미하는 왕실 깃발이 꽂혀 있는 걸 보아 그런 것 같다”고 답했다. 또 택시를 타야겠다고 하자 즉시 “길 왼편에서 당신을 향해 한 대가 오고 있다. 택시를 잡을 준비를 하라”고 도움을 주기도 했다.
시각장애인 등을 위해 개발된 토크백은 화면에 있는 문자를 음성으로 읽어주는 기능이다. 여기에 이미지와 음성을 고도로 처리할 수 있는 멀티모달 기술이 결합될 경우 더욱 명확하고 풍부한 정보를 시각장애인에게 전달할 수 있을 것으로 전망된다.
예를 들면 드레스를 온라인으로 구매할 때 제미나이가 화면에서 옷의 형태 등을 인지하고 사용자에게 “이 드레스는 짧은 드레스이며, 칼라와 긴 소매가 있고 큰 리본이 허리에 달려 있습니다”라는 식으로 음성 안내를 전달해 사용자의 구매를 돕게 된다. 이 외에도 구글은 휴대전화 카메라를 이용해 주변의 자세한 정보를 설명하는 ‘룩아웃’ 기능도 지원하고 있다.
● 국내 대기업, 노약자 특화 서비스 선보여
게티이미지코리아
삼성전자는 10월경에는 로봇청소기가 내부에 탑재된 카메라를 활용해 집 안에 쓰러진 사람을 감지하고 알림 서비스를 제공하는 기능도 도입할 예정이다.
초대규모 AI ‘하이퍼클로바’를 보유한 네이버는 하이퍼클로바를 활용해 돌봄이 필요한 홀몸노인에게 ‘클로바 케어콜’을 제공하고 있다. 노인에게 자동으로 전화를 걸어 식사, 수면, 건강 등의 주제로 안부를 묻는 서비스다. 네이버는 클로바 케어콜이 단순히 “예, 아니요”의 대답만 제공하는 것이 아니라 자연스러운 대화가 가능해 노인들의 외로움과 고립감을 완화하는 효과도 기대할 수 있다고 밝혔다.
클로바 케어콜은 2021년 부산 해운대구에서 시범 서비스를 시작해 2022년 5월 정식 출시됐다. 현재 110여 개 시군구에 도입돼 2만4000여 명을 대상으로 서비스를 진행하고 있다.
● 장애인 위한 서비스 개발한 스타트업
엄종환 SK텔레콤 ESG혁신 담당(오른쪽)과 조수원 투아트 대표(왼쪽)가 MWC 2024 글로모 어워드에서 '설리번 파인더'로 수상하는 모습. SK텔레콤 제공
이 앱을 실행해 봤더니 “책상 위에 노트북이 놓여 있고 책꽂이에 책들이 꽂혀 있다. 방문이 닫혀 있고 방문에는 명찰이 달려 있다”는 식으로 눈앞의 장면을 상세히 묘사했다. 문자 인식 기능을 이용하자 조그마한 책의 제목까지도 인식해 음성으로 제공하기도 했다. 해당 서비스는 현재 200개 이상의 국가에서 36만5000여 명의 시각장애인이 이용 중이다. 회사는 올해 1월에는 검색 등의 기능을 추가해 고도화한 ‘설리번 파인더’라는 새로운 앱을 내놓기도 했다.
2021년부터 SK텔레콤과 협업하고 있는 투아트는 최근 설리번 플러스와 설리번 파인더에 SK텔레콤의 멀티모달 AI ‘에이닷 엑스’를 탑재했다. 해당 AI는 10억 장 이상의 이미지를 학습해 더욱 정교하게 이미지 묘사를 할 수 있다. 조수원 투아트 대표는 “새로운 멀티모달 AI가 적용되고 난 뒤로 기술의 수준이 높아졌고, 사용자도 증가했다”고 말했다.
반려로봇 '효돌'은 어르신에게 투약 정보 등을 알리고, 실시간 대화를 통해 정서적 지지를 제공한다. 효돌 제공
회사는 효돌의 ‘정서 교감 기능’을 강조했다. 효돌이 2021년부터 2023년까지 전남 지역 홀몸노인 186명을 대상으로 로봇을 보급한 결과 노인우울척도가 10.29에서 9.05로, 자살생각척도는 15.52에서 9.25로 낮아지는 등 정신건강 상태가 호전된 결과를 보였다고 밝혔다. 이러한 성과를 바탕으로 전남도는 2023년부터 2025년까지 총 30억 원의 예산을 투입해 22개 전체 시군에 효돌 1100대를 도입 중이다.
회사는 지난해에는 기존보다 업그레이드된 ‘효돌 2.0’을 출시했다. 효돌 2.0에는 챗GPT가 도입돼 노인과의 소통 기능이 강화됐다. 효돌 관계자는 “보다 자연스러운 ‘양방향 대화’가 가능하다는 것이 효돌 2.0의 특징”이라고 설명했다.
또 다른 국내 기업 소리를 보는 통로는 청각장애인을 위한 실시간 자막 서비스를 제공하고 있다. AI가 실시간으로 현장의 소리를 인식해 텍스트로 자막을 띄우는 형태다. 회사에 따르면 실시간 자막은 96∼97% 수준으로 높은 정확도를 보였다. 이 회사는 2017년부터 최근까지 학교, 은행 등 800여 개 기관을 대상으로 서비스를 제공하고 있으며, 올해부터는 일반 소비자를 대상으로도 서비스를 확장했다.
● 국제사회도 인정한 포용 서비스… 정부도 팔 걷어붙여
투아트와 효돌은 삼성전자, SK텔레콤 등 대기업과 함께 2월 스페인 바르셀로나에서 열린 ‘모바일월드콩그레스(MWC) 2024’의 ‘글로벌 모바일 어워드(글로모 어워드)’에서 수상하기도 했다. 세계이동통신사업자연합회(GSMA)가 선정하는 글로모 어워드는 ‘모바일 업계의 오스카상’으로 불릴 만큼 ICT 업계에서 권위를 인정받는 상이다. 투아트의 설리번 파인더가 ‘접근성·포용성을 위한 최고의 모바일 사용 사례’ 부문에서, 효돌의 효돌 로봇이 ‘건강과 웰빙을 위한 최우수 혁신 분야’에서 각각 수상의 영예를 얻었다.
정부와 지자체도 IT를 통한 사회적 포용 서비스에 팔을 걷어붙였다. 과학기술정보통신부와 지자체는 2019년부터 현재까지 인구 감소, 고령화, 주민 복지 등을 개선하기 위해 ‘스마트 빌리지’ 사업을 진행하고 있다. 2019년 40억 원으로 시작한 사업은 올해 1039억 원의 예산을 배정받았다.
경기 부천시의 노인들이 '스마트 경로당'에서 비대면 화상기기를 통해 운동 프로그램을 진행하고 있다. 부천시 제공
전남혁 기자 forward@donga.com