[편집자주] 스타트업(start-up)은 특정한 문제를 해결하기 위해서 ‘시작하는’ 기업을 말합니다. 기업의 생사가 걸려있는 만큼 스타트업은 문제에 대한 가장 효율적인 답을 찾으려고 노력합니다. 이들의 고군분투가 낳은 결과가 현재 우리가 향유하는 ‘혁신’이 된 경우가 많습니다.
다만, 대다수의 스타트업이 좋은 기술과 서비스를 보유하고 있음에도 충분히 성장하지 못하고 있습니다. 다양한 원인이 함께 작용한 결과지만, 가장 큰 문제는 좋은 기술이 있어도 이를 사회에 잘 알리지 못한다는 것입니다. 이에 [스타트업리뷰]를 통해 스타트업의 좋은 기술을 접해보고, 이를 어떻게 사용할지 그리고 업계 관계자들의 시선은 어떠한지 시리즈로 전하고자 합니다.
온라인 쇼핑은 시각 장애인에게 쉽지 않은 일이다. 온라인 쇼핑몰에서 판매 업체들이 상품의 상세 정보를 이미지 파일로 올리기 때문이다. 시각 장애인들이 쓰는 화면낭독기(텍스트를 음성으로 바꿔주는 소프트웨어)는 이미지 속 글자를 인식하지 못한다.
이미지로 된 상품의 상세 설명, 출처=IT동아
하지만, 장애인차별금지법에 따라 웹사이트들은 신체적·기술적 여건과 관계없이 장애인이 원하는 서비스를 이용하도록 접근성을 보장해야 한다. 즉, 온라인 쇼핑몰은 시각 장애인이 서비스를 이용할 수 있도록 대체 텍스트를 제공해야 하는 것이다.
그럼에도 많은 온라인 쇼핑몰은 대체 텍스트를 제공하지 않으면서 “온라인 쇼핑몰이 직접 하루에 수백 건씩 올라오는 상품에 대체 텍스트를 등록하려면 너무 큰 비용이 든다.”라고만 주장하고 있다.
이러한 문제를 해결하기 위해서 IT운영관리 솔루션을 만드는 스타트업 인포플라는 자체 OCR(이미지 속 글자 인식) 기술을 활용해 ‘U See NOW(유씨나우)’ 앱을 개발했다. 이용자들은 U See NOW 를 통해서 온라인 쇼핑몰에 있는 상품 정보 이미지의 글자를 음성으로 들을 수 있다.
인포플라의 최인묵 대표는 “우리는 자체 OCR 기술과 스마트폰의 화면낭독 기능(갤럭시의 토크백, 아이폰의 보이스오버)을 결합해서 U See NOW를 만들었다. 토크백과 보이스오버의 UI(사용자 인터페이스)를 그대로 쓰기 때문에, 이 기능에 익숙한 시각 장애인들은 U See NOW 조작법을 따로 배우지 않아도 된다.”라고 말했다.
U See NOW를 쓰려면, 먼저 갤럭시 스마트폰은 토크백을 아이폰은 보이스오버 기능을 켜야 한다. 화면낭독 기능을 활성화하면, 스마트폰 조작 방식이 달라진다. 갤럭시 스마트폰은 두 손가락으로, 아이폰은 세 손가락으로 드래그(터치 후 손가락을 미는 동작)해야 한다. 앱이나 메뉴를 누를 땐 그 대상을 한번 먼저 탭하고, 다시 두 번 탭해야 한다.
갤럭시의 토크백과 아이폰의 보이스오버, 출처=IT동아
화면낭독 기능의 조작 방식에 익숙해진 뒤 갤럭시 스마트폰과 아이폰으로 바로 U See NOW를 실행했다. 기본 화면에는 G마켓, 11번가, 아마존, 다이소몰 총 4개의 온라인 쇼핑몰이 뜬다. 아마존 같은 미국의 온라인 쇼핑몰에서도 OCR로 상품 정보 이미지의 글자를 추출하고, 소리로 변환할 수 있는 것이다. 상단에 있는 ‘쇼핑몰 등록’ 메뉴를 통해서는 자주 가는 온라인 쇼핑몰을 등록할 수도 있다.
U See NOW 앱에서 쇼핑몰을 등록하는 모습, 출처=IT동아
미리 등록돼 있는 쇼핑몰에 들어가서 앱의 반응 속도를 확인해 봤다. 반응 속도는 안드로이드 버전과 iOS 버전 모두 비슷했지만, 쇼핑몰마다 차이가 있었다. 국내 온라인 쇼핑몰들은 반응이 조금 지체되는 정도였고, 아마존은 꽤 느렸지만 이용이 불가능한 정도는 아니었다.
이후로 U See NOW의 OCR 기능이 잘 작동하는지도 확인했다. 온라인 쇼핑몰에서 상품을 누른 뒤 상품 정보 이미지를 두 번 탭하면, ‘OCR이 글자를 해석한다’는 안내가 나온다. 그리고, 화면 낭독 기능이 이미지의 글자를 소리로 변환한다.
이미지를 누르면 OCR이 이미지 속 글자를 해석하고, 음성낭독 기능이 이를 소리로 변환한다, 출처=IT동아
이렇게 상품 정보 이미지를 찾아서 누르는 것은 비장애인에게 매우 쉬운 일이다. 하지만, 시각 장애인에게는 그렇지 않다. 그래서, 인포플라는 U See NOW 앱 하단에 ‘위에 이미지 이동’, ‘아래 이미지 이동’이라는 버튼을 배치했다.
둘 중 하나의 버튼을 누르면, 상품 상세 페이지에 있는 첫 번째 이미지의 글자가 낭독된다. 그리고, 아래 이미지 이동 버튼을 누르면 바로 아래 이미지의 글자가 소리로 변환된다. 위, 아래 조작 버튼을 누르면서 필요한 정보가 있는 이미지를 찾으면 된다.
U See NOW의 위에 이미지 이동과 아래 이미지 이동 버튼, 출처=IT동아
U See NOW는 한글 인식의 정확도가 상당히 훌륭했다. 대부분 오류 없이 정확하게 인식했다. 글자가 많은 이미지가 아니라면 OCR 인식도 3~4초 안에 끝났다. 글자가 빽빽하게 적힌 이미지라도 7초면 인식이 끝났다.
다만, U See NOW에서 상품 정보 이미지를 눌렀을 때 ‘해석할 수 없는 이미지입니다’라는 안내문구가 나온 적이 있다. 이러한 오류가 발생하지 않도록 개선이 필요하다. 또한, U See NOW의 OCR이 이미지 속 영어 단어를 인식하지 못하는 경우가 있었다. 이는 국내외의 온라인 쇼핑몰에서 공통으로 나타나는 현상이었다.
U See NOW를 실제로 사용해 본 결과, 편리하지만 아직 안정성이 떨어지는 서비스라는 인상을 받았다. 앱의 반응 속도가 빠른 편이 아니라 이용하면서 종종 답답함을 느꼈다. 그리고, 토크백과 보이스오버 기능에도 조작 오류가 있었다. A상품을 눌렀는데 B상품 페이지에 접속되는 일이 종종 발생했다.
다만, 이처럼 쇼핑몰 상품의 대체 텍스트를 제공하는 앱이 거의 없다는 점을 감안하면, U See NOW에 대한 시각 장애인들의 만족도는 상당히 높을 것이라고 예상한다. 게다가 U See NOW는 모든 온라인 쇼핑몰에서 활용이 가능하다는 점도 장점이다.
최인묵 대표는 “보통은 특정 기업이 자사 플랫폼에 상품을 등록하고, 이에 대한 대체 텍스트를 제공하는 것이 일반적이었다. U See NOW는 모든 온라인 쇼핑몰에서 실시간으로 대체 텍스트를 만들어, 시각 장애인에게 이를 제공한다는 점이 큰 차별점이다.”라고 설명했다.
또한, U See NOW는 글자 인식의 정확도와 속도 이 두 가지 요소를 동시에 잡으려고 노력한 점이 돋보인다. 한글 텍스트의 경우, 인포플라의 OCR 기술은 글자를 정확하게 인식하면서도 음성변환속도가 상당히 빠르다.
OCR 기술들은 글자를 정확하게 인식하기 위해서 음성변환속도를 포기하는 경우가 많다. 인포플라는 이용자들의 편의성을 위해서 음성변환속도를 포기하지 않은 것이다. 영어 인식의 정확도가 떨어지는 점은 아쉽지만, 이 부분은 차츰 개선될 것이라고 기대한다.
앞으로 인포플라의 U See NOW는 계속 온라인 쇼핑몰에서만 대체 텍스트를 제공할까? 앱을 사용하면서 일었던 궁금증이다. 인포플라의 OCR 기술은 다방면에 적용된다면, 이를 통해 시각 장애인뿐 아니라 시력이 좋지 않은 중장년층들도 큰 도움을 얻을 수 있을 것이다. 그래서, 최인묵 대표에게 앞으로의 계획에 대해 물었다.
최인묵 대표는 “현재는 온라인 쇼핑몰에만 집중하고 있지만, 앞으로 다른 영역으로도 확장할 계획이 있다. 데이터만 확보된다면, 공공기관의 홈페이지에도 OCR 기술을 제공할 수 있다. 공공 영역은 장애인의 접근성을 높여야 하는 과제가 있기 때문에, 우리 기술에 대한 수요가 충분할 것이다.”라고 답했다.
동아닷컴 IT전문 정연호 기자 (hoho@itdonga.com)