인공지능(AI, artificial intelligence)이 무엇인지에 대해서는 여러 석학들이 다양하게 정의하고 있다. 필자는 AI가 어떤 답을 제공하는 시스템이라기보다는 '가장 답에 가까운 예측을 할 수 있는 시스템'을 의미한다고 생각한다. 100% 맞는 값은 아니더라도 단순한 통계의 결과가 아닌, 가장 맞을 가능성이 놓은 답을 얻는 것이다. 비즈니스 입장에서 그 '답'을 어떤 목적으로 이용하는지에 따라 적용 영역은 무한히 확장될 수 있다. 스타트업, 중소기업, 대기업 등 기업의 크기에 관계없이 인공지능 서비스의 영역이 넓어지고 있다.
세계 최대 클라우드 서비스 업체인 AWS는 사실 상 모든 클라우드 작업을 지원할 수 있도록 서비스를 계속 확대하고 있으며, 2017년 6월 기준 컴퓨팅, 스토리지, 네트워킹, 데이터베이스, 분석, 애플리케이션 서비스, 배치, 관리, 개발자, 모바일, 사물인터넷(IoT), 인공지능(AI), 보안, 하이브리드, 엔터프라이즈 애플리케이션에 걸친 90 여개의 서비스를 제공하고 있다.
고객사가 빌딩 블럭을 조립하듯이 아키텍처를 구성해 빠르게 서비스를 개발할 수 있게 하는 게 AWS의 특징이다. AWS는 고객이 기본 서비스 개발, 시험, 운영 그리고 관리에 들이는 시간을 줄여 실제 중요 비즈니스 핵심과 아이디어 적용 등에 보다 많은 시간을 쓰게 하자는 철학을 갖고 있다. 또 고객의 의견을 경청하고 그 내용을 바탕으로 서비스와 기능을 만들어 제공한다는 철학도 보유하고 있다. AI 서비스들 역시 이런 가치에 근거해 개발됐고 2016년 11월 're:Invent(AWS의 가장 큰 개발자 컨퍼런스)'에서 발표됐다.
AI의 근간은 데이터다. 대량의 데이터를 처리해서 가치 있는 결과를 찾아 비즈니스에 적용하는 '빅데이터 분석'은 이미 수 많은 기업들이 하고 있는 일이다. 빅데이터의 목적이 대량의 데이터를 빠르게 분석하는 것이라면, AI는 한 발짝 더 나가 더 좋은 제품과 서비스를 만드는 데까지 기여할 수 있는 수단이다. 그 영역은 이미지 프로세싱, 음성인식, 자연어 처리, 자동화, 무인 시스템 등 매우 다양하다.
사실 아마존이야말로 이 분야에서 가장 앞서가고 있는 기업이다. 아마존닷컴의 온라인 쇼핑몰을 보자. 아마존닷컴에서 물건을 사본 사람은 아마존닷컴의 개인화된 상품 추천 기능이 매우 정교하다는 것을 알 수 있다. 아마존은 전 세계적으로 배송센터를 운영 중이다. 센터 안에는 매우 방대한 수의 제품들이 보관되어 있으며 주문이 들어오는 즉시 해당하는 물건을 찾아 바로 배송에 들어간다. 포장할 물건을 찾아오는 일은 키바(Kiva) 라는 로봇이 담당한다.
수 백, 수 천대의 로봇이 안전하고 정확하게 물건을 찾아 전달한다. 또 잘 알려진 아마존 알렉사(Alexa)라는 인공지능 비서는 음성인식 능력이 매우 뛰어나다. 알렉사 스킬 키트(Alexa Skills Kit, ASK)를 이용하면 외부 업체들도 수 많은 새로운 기능들을 쉽게 구현해 연동할 수 있다. 알렉사 스킬 키트를 이용하는 개발자들은 AWS의 AWS Lambda라는 서비스를 응용하게 된다. 개발된 코드를 AWS위에서 손쉽게 실행 가능한 것이 장점이다. 또한 NoSQL 데이터 베이스인 Amazon DynamoDB를 데이터 저장소로 응용할 수도 있다. 알렉사는 바로 AWS 위에서 동작하고 있다. 클라우드 베이스의 음성 인식 서비스로 이해할 수 있다.
AI 영역에 클라우드를 이용하는 이유는 클라우드가 주는 장점이 똑같이 AI라는 영역에도 적용되기 때문이다. 복잡한 기술을 직접 개발하고 운영하기 위한 비용과 시간을 아낄 수 있으며, 고객은 본인의 실제 비지니스 모델 자체에 더 많은 역량과 자원을 투자할 수 있다. 만약 직접 AI관련된 기술을 시험하고 개발하기 원한다면, 그 역시 바로 사용할 수 있는 컴퓨팅 자원을 클라우드 상에서 제한없이 사용할 수 있다. AI 가 응용될 수 있는 여러 비지니스 영역에서 매우 적은 리스크와 비용으로 개발을 시작하고 다양한 시도를 할 수 있으며, 기업의 민첩성(Agility)을 최대화 한다.
또한 기존 개발된 AI 서비스를 사용하기만을 원하는 고객 역시 관리형 서비스의 장점을 누려 바로 비지니스를 시작할 수 있다. 다른 클라우드 상의 서비스와 연계(Integration)가 쉽다. AI 관련 서비스라 하더라도 데이터 베이스와, 모바일, 인증, 보안 등의 여러 가지 서비스가 필요하며 AWS는 이미 그러한 연동을 기능으로 제공하고 있다. 마지막으로 비용 효율성이다. AI, Deep Learning과 같은 서비스를 개발한다고 하여 많은 초기 투자 비용이 필요하지 않음은 당연하다.
AWS의 아마존 AI 서비스는 일반 사용자부터 전문가들까지 각자의 니즈와 전문성에 맞게 선택할 수 있게 3단계로 구성되어 있다. 우선 AI의 전문 영역을 직접 손으로 다루고 싶은 연구원이나 데이터 사이언티스트들은 'AI 엔진'을 사용할 수 있다.
딥러닝 프레임워크와 복잡하고 정교한 머신러닝 시스템을 기반으로 서비스 개발이 가능하다. 전문가가 아닌 경우, 즉 복잡한 머신러닝 알고리즘을 연구하기 보다는 머신러닝 기능이 포함되어 쉽게 사용할 수 있는 서비스를 찾는 기업을 위한 'AI 플랫폼'도 다수 있다.
마지막으로, 복잡한 머신러닝 알고리즘이나 머신러닝 모델의 생성이나 구성을 통한 사용까지 고민할 필요가 없이 바로 다양한 애플리케이션을 개발할 수 있게 해 주는 '아마존 AI 서비스'도 있다. 이제 이 글을 통해 일반 기업 매니저들이 쉽게 이해할 수 있도록 아마존의 세 가지 AI 서비스에 대해 자세히 설명하겠다. 아마존의 세 가지 AI 서비스는 '아마존 폴리', '아마존 레코그니션', 아마존 렉스' 등으로 구성되어 있다.
아마존 폴리
아마존 폴리(Amazon Polly)는 텍스트를 생생한 음성으로 변환하는 서비스다. 이를 이용해 음성 지원 서비스를 바로 개발할 수 있다. 사실 TTS(Text to Speech) 기능은 매우 오래된 주제이지만 아마존 폴리의 특징은 실제 사람의 목소리와 음률까지 문맥에 맞춰 생성해 낸다는 것이다. 음성으로 변환할 텍스트를 아마존 폴리 API로 전송하기만 하면 즉시 오디오 형태로 돌아오기 때문에 애플리케이션에서 직접 재생하거나 혹은 MP3, OGG 같은 표준 오디오 파일 형식으로 저장할 수 있다. 음질을 다르게도 선택할 수 있어, 음성 품질과 전송 성능을 조율 할 수 있고, 2017년 5월 현재 24개 언어와 47개 음성을 지원하고 있다(한국어는 아직 서비스되고 있지 않다).
예를 들어 영어의 경우도 미국 영어와 영국 영어를 선택할 수 있으며, 남자 목소리, 여자 목소리와, 어른 목소리, 아이 목소리도 선택이 가능하다. 특히 문맥을 인지해 발음을 구분한다는 것이 특징이다. 예를 들어 다음 문장의 경우, 'NV'를 'Nevada'로 읽어주고 있다. 'Live'의 경우도 동사와 명사일 경우를 구분해 다르게 발음한다.
"Today in Las Vegas, NV (네바다) it's 90℉."
"We live (리브) for the music", live (라이브) from the Madison Square Garden."
AWS 서비스의 장점은 시스템 개발자 본인이 익숙한 프로그래밍 언어를 사용할 수 있다는 것이다. Python, Java, Node.js, .NET, PHP, Ruby, Go, C++ 등 주요 프로그래밍 언어에 모두 적용할 수 있고, 모바일 앱에서도 바로 사용이 가능하다. 클라우드 기반 서비스인만큼 사용량에 따라 비용이 부과되는 것도 특징이다.
일례로 아마존 폴리를 이용해 일반적인 신문기사를 음성으로 읽어주는 서비스를 만들 경우 6500자(약 9분 분량)에 0.03 달러가 과금된다. 마크 트웨인의 ‘허클베리 핀의 모험’의 경우 총 13시간 50분 분량으로 2.4달러가 AWS에 과금되므로, 전자책을 읽어주는 서비스를 개발하는 기업이라면 이를 참고해서 쉽게 자사의 프라이싱 전략을 세울 수 있다. 실제 워싱턴 포스트(Washington Post)의 기사 음성 읽기, 고애니메이트(GoAnimate)의 자막의 음성 변경 등의 고객 사례가 있다.
아마존 레코그니션
아마존 레코그니션(Amazon Rekognition)은 애플리케이션에 이미지 분석 기능을 쉽게 추가할 수 있는 서비스다. 물체, 장면 및 얼굴을 탐지하고, 유명 인사를 인식하고, 이미지에서 부적절한 콘텐츠를 식별해낼 수 있다. 아마존은 아마존 프라임 회원들에게 사진을 저장할 수 있는 클라우드 서비스 '프라임 포토스(Prime Photos)'를 제공하고 있는데, 여기 매일 올라오는 수십 억 장의 이미지들을 분석할 목적으로 개발한 서비스가 바로 아마존 레코그니션이다.
1. 물체 인식
심층 신경망 모델을 사용해 이미지 속의 수많은 물체와 장면을 탐지하고 분류한다. 예를 들어 <그림 3>과 같은 사진이라면 아마존 레코그니션은 모험(adventure), 보트(boat), 래프팅(rafting)이라는 세 가지 키워드를 만들어 JSON Document라는 표준 데이터 형태로 전달해준다. 개발자는 이를 가공해서 쉽게 원하는 서비스를 만들 수 있다.
<그림 4>를 보면, 아마존 레코그니션의 객체인식 기능을 이용해 어떤 서비스들을 구현할 수 있을 지 상상해볼 수 있다.
1)사진 공유 앱이나 서비스에 올라오는 사진들을 자동으로 구분/분류/태깅해서 그에 맞는 서비스로 연결. (예) 산/바다/도시 등의 사진을 올리는 사람을 여행 관련 정보 서비스로 연결시켜주거나, 결혼과 관련된 이미지를 올리는 사람을 출산/집들이 등에 연관된 광고로 연결시켜줄 수 있음
2)사진 내 물체를 탐지해 가치 있는 정보를 추출. (예) 에어비앤비와 같은 숙박알선 서비스에 올린 사진에서 침대, 쇼파, 수영장 등을 인식해서 별도의 정보 입력 없이 자동으로 태깅
3)여행 관련 서비스의 경우 다양한 사진으로부터 여행 관련 정보들을 구분하여 제공. (예) 산, 바다, 도시 등등.
2. 안면 분석
이미지 내에서 안면 위치를 식별하고 안면 속성(예: 미소를 짓고 있는가? 눈을 뜨고 있는가?)을 분석할 수 있다. <그림 5>와 같이 사람의 얼굴을 인식한 후 각각의 특징을 분석해 내며, 각각의 특징에 대해 신뢰도(confidence score)까지 알려주어 어느 정도 정확성을 가지는 지도 알려준다.
안면 인식은 다양한 응용 사례를 생각할 수 있다. 예를 들어 아래와 같은 서비스 개발이 가능하다.
1)사진 출력 서비스: 원하는 분위기의, 또는 가장 잘 나온 사진을 추천
2)온라인 데이팅 서비스: 이상형에 가까운 얼굴 추천
3)리테일 비즈니스: 고객의 움직임이나 기분 등을 인식해 비즈니스에 활용.
4)개인화된 광고 제공: 면도기, 안경 등
예를 들어 대형 마트라면 매장에서 쇼핑 중인 사용자의 감성을 읽어 사용자의 만족도를 예측해 볼 수 있으며, 이러한 감성(sentimental) 정보를 이용해 서비스의 품질을 향상시킬 수도 있다. 마케팅에도 활용이 가능하다. 만약 수염이 없는 남성을 인지했다면 면도기를 광고 할 수 있을 것이며, 안경을 쓴 사람은 안경에 대한 마케팅을 진행할 수도 있다.
<그림 6>은 안면 분석을 이용한 타깃 마케팅 아키텍처의 예시다. 기업의 애플리케이션이 고객의 얼굴 사진을 가져와 AWS 클라우드 상에 올리면 아마존 레코그니션이 안면 분석을 진행하고, 해당 결과를 '아마존 DynamoDB(Amazon DynamoDB, NoSQL 데이터베이스 서비스)'에 저장하고, 이에 맞는 맞춤광고 이미지는 '아마존 S3(Amazon Simple storage service)'에서 가져와 보여주는 형태다. 또 이 작업에서 발생하는 로그 정보는 아마존의 관리형 데이터 저장소인 'Amazon Redshift'에 저장한다.
3. 안면 비교
두 이미지 안의 얼굴이 동일인일 가능성을 측정할 수 있다. 거의 실시간으로 사용자를 기준 사진과 대조할 수 있다. <그림 7>과 같이 다른 표정, 화장, 머리 스타일을 하고 있지만 동일인일 가능성을 예측해 바로 알려준다. 그림에서는 94% 확률로 동일인일 것이라고 알려주고 있다. (실제로 같은 사람임)
안면 비교 기능 역시 다양한 응용 사례를 만들 수 있다.
1)안면 인식을 이용한 사용자 인증(verification)
2)공공 장소에서 특정 사람, 미아 등을 찾는 경우
3)호텔, 카지노 등에서 개별 고객을 바로 인식해 맞춤 서비스 제공이나 VIP 서비스 구현
대리 시험 방지. 온라인 시험의 경우 웹캠으로 응시자 확인
<그림 8>은 기업이나 공기관에서 직원 신원 확인을 하는 보안 시스템 아키텍처의 예시다. 사진을 찍어서 들어온 이미지와, 기존에 저장된 뱃지 사진 정보를 아마존 레코그니션에 보내어 비교한다. 예를 들어 80% 이상의 수치가 나오면 통과가 되며, 그렇지 않으면 보안 팀에 메시지를 전송하는 시스템을 구성할 수 있다.
4. 안면인식
비슷한 기능으로 안면 인식 기능이 있다. 페이스북의 자동 사진 태깅 기능과 유사한 것으로, 이미지에서 탐지된 얼굴에 대해 인덱스를 생성할 수 있다. 특히 특정 이미지를 저장하는 방식이 아니라 분석된 이미지의 구분 가능한 정형화된 정보를 저장하는 것으로, 개인 정보에 대한 침해가 발생할 여지가 없다는 장점이 있다.
안면 인식 기능 역시 아래와 같이 다양한 응용 사례를 만들 수 있다.
1)특정인, 유명인의 사진을 여러 뉴스와 기사에서 자동으로 취합해 데이터화해 서비스 구현
2)가족 사진 공유 서비스에서 각 가족 구성원 얼굴을 구분
5. 이미지 조정
선정적이고 노골적인 콘텐츠를 탐지할 수 있는 기능이다. 예를 들어 수영복 사진의 경우 '84% 확률로 선정적'이라는 식의 분석 결과를 준다. 미성년자가 볼 수 있는 서비스에 적용이 가능하다.
레드핀(Redfin) 은 부동산 중개 서비스 앱으로, 수 백만의 매물의 리스트와 이미지 속성을 빠르게 감별 할 수 있도록 서비스에 응용하고 있다. 스머그머그(SmugMug)는 매일 수 백만 사용자의 수십억 장의 사진을 공유하는 서비스로, 사진의 다양한 컨텐츠를 탐지하는데 사용하고 있다.
아마존 렉스
아마존 렉스(Amazon Lex)는 음성과 텍스트를 사용하는 대화형 인터페이스를 구축하는 서비스다. 음성을 텍스트로 변환하는 자동음성인식(Automatic Speech Recognition)과 텍스트의 의도를 이해하는 자연어처리(Natural Language Understanding) 기능을 제공한다. 알렉사(Alexa)에서 앞 뒤 알파벳 a를 제거한 이름으로, 기업이 알렉사와 흡사한 음성 기반 인터페이스 서비스를 제공할 수 있다. 즉 최신 뉴스 업데이트, 경기 점수, 날씨 등 일상적인 질문에 대해 답을 하는 고객 요청을 위한 챗봇을 몇 분 만에 개발할 수 있다. 아마존 렉스는 페이스북 메신저, 슬랙(Slack), 트윌로(Twilio) 등의 SNS 플랫폼과 연동할 수 있고 스마트폰이나 각종 IoT(사물인터넷) 기기에도 적용할 수 있다.
미국 오하이오 주의 병원 체인 오하이오헬스(OhioHealth)는 아마존 렉스를 이용해 진료 예약이 가능한 챗봇을 개발했다. 또 미국 금융사인 캐피탈원(CapitalOne)은 아마존 렉스를 통해 고객이 각종 금융 정보를 확인할 수 있는 스마트한 서비스를 개발해 제공하고 있다.
이제까지 AWS 클라우드에서 제공하는 세 가지 아마존 AI 서비스, 아마존 폴리, 아마존 레코그니션, 그리고 아마존 렉스에 대해 소개했다. 처음 말했듯 클라우드 상에는 이렇게 바로 애플리케이션에 탑재 가능한 아마존 AI 서비스 외에 개발자가 사용할 수 있는 AI 플랫폼, AI 전문가가 사용할 수 있는 AI 엔진 등도 함께 제공되고 있다. 아마존의 클라우드 기반 AI 기술을 활용하면 기업은 클라우드가 갖고 있는 장점들, 즉 비용 효율성, 서비스의 확장성, 리소스의 탄력성과 안정성, 가용성 등을 누리면서 비즈니스에 새로운 AI 기술을 빠르게 적용할 수 있다.
필자: 김일호 AWS 솔루션즈 아키텍트 수석
김일호 AWS 솔루션즈 아키텍트 수석은 AWS에서 2013년부터 AWS 솔루션즈 아키텍트(Solutions Architect)로서 고객들이 AWS 서비스를 통해 안정적인 아키텍처와 비용 효율적인 서비스를 사용할 수 있도록 도움을 제공하고 있다. 임베디드 시스템 개발자로 IT 업계에 발을 디뎠고, Sun Microsystems에서 시스템 엔지니어로 인프라스트럭처와 Solaris 운영체제 및 가상화를 담당했다.
글 / 김일호 AWS 솔루션즈 아키텍트 수석(ilho@amazon.com)
*본 칼럼은 IT동아의 편집 방향과 다를 수 있습니다.
인공지능과 클라우드가 기업의 비즈니스 전반을 혁신하고 있습니다. 이러한 상황에서 기업과 스타트업은 어떻게 대처해야 할까요? '칼럼: 인공지능 시대'에서 글로벌 인공지능 리더들의 글을 통해 그 답을 알아보겠습니다. 이 칼럼은 IT동아의 기자 대신 인공지능과 클라우드 부문 현업에서 활동 중인 전문가들이 직접 작성합니다.
댓글 0