모바일 왕국을 꿈꾸며!!! mobizen@mobizen.pe.kr

Posted
Filed under 원고 및 발표자료
사용자 삽입 이미지

#1에서는 전체적인 환경 변화와 대화형 플랫폼의 응용 서비스까지 설명을 했다. 이제부터는 입출력에 대한 설명을 하도록 하겠다. '대화'라는 것은 다양한 방식이 있다. 바디 랭귀지도 있고, 얼굴 표정으로 의사 표현을 하기도 하고, 눈동자로 대화를 하기도 한다. 하지만, 일반적인 접근을 하자면 2가지로 구분할 수 있는데 텍스트와 음성이다.



사용자 삽입 이미지

텍스트는 지금까지 디지털 서비스에서 가장 기본적인 입력 수단으로 사용이 되어 왔다. 그런데, 지금까지는 사용자 친화적인 입력 수단이라기 보다는 컴퓨터, 좀 더 자세히 이야기하면 데이터베이스 입력에 좀 더 쉽게 하기 위한 방식으로 UX가 설계되어 왔다. 
예를 들어 세미나의 일정을 캘린더에 등록을 한다고 생각해보자. 위에 보이는 화면은 익숙한 구글 캘린더의 입력 방식이다. 여러개의 데이터 필드 안에 정해진 포맷으로 정보를 입력해야 한다. 같은 텍스트라고 하더라도 대화형 플랫폼에서는 좀 다른 접근이 가능하다. 즉, "11월 15일 오전 9시 40분 ~ 17시 30분까지 한빛미디어 리더스홀에서 2019 IT 트렌드 세미나 진행하는 걸 캘린더에 등록해줘~"라고 이야기를 하면 된다.
이런 이야기를 하더라도 텍스트 입력에 크게 불편함을 느끼지 못하는 분들은 공감을 못할 수 있다. 그것은 우리가 사용하는 한글이 컴퓨터 입력 방식에 크게 불편함이 없기 때문이다. 하지만, 지구상의 문자 중에 그렇지 못한 경우가 많다. 혹시 중국어 입력하는 방식을 아는가? 중국의 문자인 ‘한자’는 컴퓨터나 스마트폰에 입력하기가 불편하다. 대화형 플랫폼 시장이 중국에서 빠르게 성장하는 근본적인 원인이기도 하다.




음성 입력이야기가 나오면 Duplex가 빠질 수가 없다. 많은 분들이 이미 보셨겠지만 2018 Google I/O 개발자 컨퍼런스’에서 공개된 영상을 먼저 보시기를 권한다. 구글 어시스턴트에게 “화요일 오전 10시에서 12시 사이 미용실을 예약해줘”라고 하니 예약 전용 AI 서비스인 듀플렉스가 전화를 걸어서 예약하는 실제 장면을 녹음하여 보여주는 영상이었다.
이 시연에서 듀플렉스는 '음', '아'와 같은 감탄사를 말하고 목소리 톤을 바꾸기도 했다. 그야말로 완성도 높은 기술 수준으로 업계에 큰 충격을 주었다. 시연만을 위한 쇼는 아니었다. 2018년 6월 27일부터 전화 수신을 허용한 업체에 한해서 시범 서비스를 시작했다. 추가로 대형 보험사와 제휴를 통해 콜센터 서비스에 적용하는 방안을 검토 중이라는 루머도 나돌고 있다.



사용자 삽입 이미지

이렇게 대화를 기반으로 하는 입력은 UX 패러다임의 변화를 만들어 낸다. 앱을 실행하는 방식이나 사용자가 원하는 정보를 전달하는 방법, 그리고 실행을 하거나 결제를 하는 방식이 과거와 달라진다는 의미이다. 디지털 업계에서 사용자에게 서비스를 개발하는 저희들과 같은 사람에게는 과거의 지식과 노하우가 전혀 필요가 없어지게 되고 새로운 시대를 준비해야 할 때가 되었다.
업계에서 흔히 말하는 ZERO UI, Screenless UX 시대가 다가 온 것이다. 이러한 시대에는 시각 디자인을 전공하여 웹과 앱의 화면을 설계하는 UI 디자이너보다 사람과의 대화를 통해 원하는 것을 이끌어내는 상담사나 소설가 등이 더 각광받고 있다.



사용자 삽입 이미지
UX로서 대화형 플랫폼의 장점을 기존 앱의 UX와 다소 과장되게 비교를 해보자. 방금 보았던 구글 듀플렉스는  “화요일 오전 10시에서 12시 사이 미용실을 예약해줘”라고 명령을 한게 전부였다. 이와 비슷한 서비스인 카카오 헤어샵을 단계별로 살펴보자.
 먼저, 앱을 다운받아 설치하고 실행을 한다. 제일 먼저 로그인 화면이 나온다. 약관 동의를 하고 나니 드디어 메인 화면을 볼 수 있다. 메인 화면에는 내가 필요한 정보가 보이질 않아 현재 위치와 가장 가까운 미용실을 찾을 수 있는 기능을 통해 집 주변에 있는 미용실을 찾아 선택했다. 위치와 가격, 할인 유무 등을 확인하며 미용실을 선택한다. 선택하고 나니 '예약하기'로 화면이 넘어갔다. 여기선 날짜와 디자이너, 시간을 선택하고 결제하기 화면으로 넘어갈 수 있다. 1:1 비교는 안되겠지만 문장 하나로 끝나는 듀플렉스 보다 훨씬 복잡한 구조를 가지고 있다.



사용자 삽입 이미지

여기에서 또 하나 생각해 볼 것은 기존 시스템과의 연동이다. 지금까지 이러한 미용실 예약 서비스를 만들려면 각 미용실에서 실시간으로 정보를 받아올 수 있는 API 구축이 반드시 필요했다. 그렇지만 이게 현실과 괴리감이 너무 크다. 디지털 회사도 아니고 일반 미용실에서 API를 가지고 있거나 현재 상황을 실시간으로 서버에 업데이트 해줄리가 만무하다. 카카오 헤어샵의 경우도 사실은 뒷단에서 콜센터를 통해 미용실로 전화 예약을 해주는 시스템으로 구성되어 있다.
하지만, 듀플렉스 사례처럼 음성 전화로 예약 서비스를 제공할 수 있다면 현재와 같은 API는 필요가 없다. 선다 피차이 구글 CEO는 듀플렉스를 시연하면서 “미국 소형 점포의 60%는 온라인 예약 서비스가 없어 기존 구글 서비스의 활용이 제한적이었다”며 “이용자가 바빠 직접 전화를 걸어 예약하기 힘들다면 이 기능을 유용하게 사용할 수 있을 것”이라고 설명했다. API뿐만 아니라 온라인 광고 형태, 유료 콘텐츠의 비즈니스 모델 등과 같은 개념들이 모두 변경될 가능성이 있다.



사용자 삽입 이미지
앞에서 보았던 '대화형 플랫폼'의 흐름과 모습이다. 지금까지 챗봇, 스마트 스피커, 가상비서와 같은 응용 서비스의 흐름에 대해서 설명을 했다. 기술상의 문제로 완성도가 떨어지고 있지만 꾸준한 성장세를 이루고 다양한 디바이스에 적용되고 있다는 이야기를 했다. '대화'라는 것은 결국 입력과 출력이며 '텍스트와 음성'을 통한 입출력은 UX 패러다임의 변화라는 이야기까지도 했다. 
이제 마지막으로 대화형 플랫폼에 대한 이야기를 해보고자 한다. 먼저 기술적으로는 사용자 인터페이스를 통해 들어온 정보를 '언어처리/감성파악'을 한 후에 의도를 파악하고 통합 데이터베이스를 통해 응답을 생성하는 구조를 가지고 있다. 대화형 플랫폼은 이러한 기술적인 요소만 있는 것은 아니다. 비즈니스와 서비스의 관점으로 해석을 할 부분도 있는데 마이크로 소프트가 잘 정리를 해두었다.



사용자 삽입 이미지
MS는 'Conversations as a Platform’라는 새로운 이니셔티브를 대대적으로 발표했다. 마이크로소프트는 머신러닝과 자연어의 결합으로 컴퓨팅 방식이 바뀌고, 디지털 개인 비서와 다양한 봇이 일상생활을 돕고자 인간과 상호작용하게 될 것이라고 했다.
Conversations as a Platform의 3가지 기본 원리를 들으면 좀 더 이해하기 쉬울 것이다.
- 인간의 언어가 곧 새로운 UI
- 봇은 새로운 앱, 디지털 비서는 메타
- 인공지능이 모든 상호작용에 관여
MS는 이러한 컨셉을 기반으로 가지고 있는 여러 솔루션들을 'Conversations as a Platform’에 맞추어 재배치하여 패키징을 했는데, 시간이 나실 때 그 배치와 포트폴리오를 한번 살펴보기를 바란다. MS 솔루션을 사용하라는 뜻은 아니고, 대화형 플랫폼의 구성 요소를 이해하는데 도움이 될 것이다.



사용자 삽입 이미지
대화형 플랫폼에는 이미 익숙한 IBM Watson, MS의 코타나 등 많은 사례가 있다. 이 자리에서는 국내에서 잘 알려진 플랫폼보다는 '두어 OS'를 소개하고자 한다. 두어OS는 바이두가 자체적으로 개발한 전형적인 대화형 AI 플랫폼이다. 2015년 9월 처음 공개되었을 때는 스마트 비서 모바일 앱이었다. 이후 계속해서 플랫폼으로 진화하더니 2018년 국제전자제품박람회에서는 두어OS가 탑재된 스마트 스피커, 휴대전화, 레이저 프로젝터 등을 선보였다.
굳이, 두어OS를 소개하는 이유는 첫번째로 중국 시장의 무서움이다. 스트래티지 애널리틱스의 조사에 따르면 2017년 스마트 비서 점유율에서 바이두가 차지하는 비중은 13.2%다. 해당 보고서에서는 바이두의 점유율이 계속 상승해 2018년에는 17.2%, 2023년에는 24.4%까지 증가할 것으로 분석했다.
 두번째는 바이두의 포트폴리오 관리 전략 때문이다. 플랫폼과 디바이스가 수직 통합되는 일반적인 사례와 달리 두어 OS는 하드웨어 개발사들과 제휴를 강화하며 저변을 확보하는데 주력하고 있다. 그렇기 때문에 다양한 사용성과 기능을 확보하며 성장하고 있다.




여러 사례 중에서 TV에 탑재된 두어 OS 영상을 잠깐 소개하고자 한다. TV를 통해 영상을 보면서 추가 정보를 살펴보거나 영상을 제어하는 것은 굉장히 오래된 서비스이며 다양한 시도가 있어 왔다. 이러한 서비스가 대화형 플랫폼과 만날 때, 어떠한 새로운 사용자 경험을 주는지 위의 영상을 통해 짧게나마 살펴보기를 바란다.



사용자 삽입 이미지

대화형 플랫폼에 대한 관심이 뜨겁고 빠르게 발전하고 있지만 효용성에 대한 논쟁과 더불어 현실적인 한계점이 있다. 만약 기술 기반의 기업이라면 이러한 한계점을 해결해야 하고, 이를 제외한 대부분 기업은 한계를 이해하고 회피할 필요가 있다. 몇 가지 중요한 이슈를 나열하고 현실적인 해결책을 함께 고민해보자.



사용자 삽입 이미지

한국에서 살고, 한국인들을 대상으로 서비스를 만들어야 하는 우리로서는 '한국어'가 가장 현실적인 문제점이다. 관련 제품을 내놓은 기업들은 자사 제품을 홍보하면서 인식률을 90% 정도라고 소개하고 있지만 현실적으로 그렇지는 않다. 앞에서도 설명했지만 사용자들의 만족도는 49%에 불과했다. 구글의 인식률이 95%라는 것과는 대조적인 상황이다.
이렇게 한국어 인식률이 떨어지는 근간에는 말뭉치가 부족하기 때문이다. 말뭉치는 컴퓨터가 언어를 학습할 수 있게 하는 데이터를 말하는데 2000억 어절을 확보한 영어에 비해서, 한국어는 2억 어절 정도 밖에 되지 않고 있다. 일반적으로 딥러닝에 적용할 수 있는 수준이 10억 어절이니 사용하기에 턱없이 부족한 양이다.



사용자 삽입 이미지

새로운 기술과 패러다임이 등장할 때, 발전을 가로막는 가장 큰 원인 중에 하나가 법과 제도이다. 예를 들면 개인의 정보를 보호하기 위한 「개인정보 보호법」 및 「정보 통신망 이용촉진 및 정보보호 등에 관한 법률」 등이 있다. 이러한 법은 웹이나 앱 환경을 고려하며 제정된 것으로 챗봇이나 스마트 비서, 스마트 스피커, 커넥티드 디바이스 등에서 대화형 플랫폼을 사용할 때와 맞지 않다. 현재 위치를 기반으로 날씨를 확인하거나 개인 일정이나 연락처에 접근하는 대화형 서비스들은 아직까지 적용이 모호한 상태이다. 



사용자 삽입 이미지
가장 커다란 문제점은 모든 소비자들이 이런 패러다임 변화를 환영하는 것은 아니라는 점이다. 앞에서 대화형 플랫폼의 응용 서비스들에 대해서 성장하고 있다는 여러가지 지표를 보여주었지만, 그게 전부는 아니다. 기술적인 문제도 있겠지만 익숙하지 않은 입력에 대해 거부감을 표시하는 사용자들도 꽤 있다.
제네시스 사용자 경험 현황 보고서에 의하면 지난 12개월 동안 챗봇을 한 번이라도 사용한 사용자는 14%에 불과했다. 고객 상담의 선호도에서도 상담원 전화 86%, 상담원 채팅 55%, 이메일 문의 54%와 비교하면 턱없이 부족한 9%를 기록하고 있다. 아직까지는 대중화되지 못했으며 사용자들에게는 낯선 채널이라는 것을 의미한다.



사용자 삽입 이미지
이러한 한계점은 기술이 발전하고 시간이 흐르면서 점차 해결될 것이다. 한가지 확실한 것은 작게는 대화형 플랫폼 크게는 온오프융합이라는 트렌드는 계속해서 발전할 것이라는 점이다. 기업에 속해있는 담당자라면 이러한 트렌드를 준비해야 한다. 준비를 잘하는 것은 경험을 해보아야 한다. 간단한 챗봇이라도 테스트 삼아 만들어보고 운영을 해보기를 권한다. '아직 그 세상이 오지 않았다'고 안심하고 아무것도 하지 않는다면, 어느 순간 경쟁에서 지쳐지는 스스로의 모습을 보게 될 것이다.



전체 발표 자료는 SlideShare에 올려 놓았으니 필요하신 분들은 다운로드 받아 사용하기 바란다. 1시간이라는 한정된 시간 안에 깊이 있는 내용을 모두 전달하기는 힘들다. 상세 내용이 궁금하신 분은  'IT 트렌드 스페셜 리포트 2019'를 구매해서 보기를 권해드린다. 새로운 내용이 없을 수는 있지만 트렌드를 읽고 생각을 정리하는데 도움이 될 수 있을 것이다. 세미나 당일, 사진 한장을 마지막으로 포스팅을 마친다.



사용자 삽입 이미지
2018/11/24 15:07 2018/11/24 15:07
Posted
Filed under 원고 및 발표자료
사용자 삽입 이미지

작년에 이어서 올해도 공저로 저술한 'IT 트렌드 스페셜 리포트 2019'가 출간되었다. 올해도 7가지 주제를 선정했고, 5G와 대화형 플랫폼을 담당하여 내용을 정리했다. 작년보다 많은 저자들이 참여하면서 서로의 생각을 들어보고 시장의 트렌드를 함께 논의할 수 있는 좋은 기회를 가질 수 있었다. 수능날인 2018년 11월 15일에, 작년과 동일하게 출간 기념 컨퍼런스가 진행이 되었는데, 패널토의와 '대화형 플랫폼'을 주제로 세션 발표를 하였다. 해당 세션 발표 내용을 정리하여 글로 남겨본다.



사용자 삽입 이미지

세션 발표는 작년에 발표했던 '챗봇'에 대한 내용을 요약으로 시작을 했다. 작년 발표 내용은 이곳에 정리를 해 두었으니 먼저 읽어보면 올해의 발표 내용과 비교하면서 정리가 될 것이다.



사용자 삽입 이미지

이제 2018년이 가고 2019년을 준비해야 하는 시기가 되었다. 작년에 'IT 트렌드 스페셜 리포트 2018'를 발간할 당시와 현재가 어떻게 바뀌었는지 짧게 정리를 해보자. 첫번째는 주요 테마가 인공지능에서 4차 산업혁명으로 변화되었다. 이 이야기를 듣는 분들 중에서는 "4차 산업혁명이 아니고 블록체인인 것 같은데.."라고 하시는 분이 있을 수 있다. 화제성면에서는 분명히 블록체인이 맞긴 하지만 업계 전체적인 영향도와 다양한 기술과 연계되는 키워드는 '4차 산업혁명'이라고 생각한다. 이번 책의 주제으로 선정된 이유이기도 하다.
두번째는 챗봇이 대화형 플랫폼으로 진화되었다. 대화형 플랫폼은 '대화'와 '플랫폼'이라는 2가지 키워드로 구성이 되어 있고, 이제부터 자세히 설명을 할 예정이다. 마지막으로 앞에서 설명했던 것처럼 서비스였던 챗봇이 대화형 플랫폼으로 변하면서 '사용자 경험'으로 새롭게 포지셔닝을 했다. 



사용자 삽입 이미지

먼저 '4차 산업혁명'에서부터 이야기를 풀어나가 보자 한다. 개인적으로는 '4차 산업혁명'이라는 번역된 단어가 등장하기 전부터 'Industry 4.0'이라는 키워드를 듣고 좋아했었다. 남들보다 일찍 들었고 칼럼도 몇차례 썼었다. 그런데, 너무나 많은 곳에서 서로 다른 의미로 '4차 산업혁명'이란 단어가 남발되자 점차 거부감이 들기 시작했다. '창조경제'만큼이나 모호한 단어라는 생각이 들기도 했다. 
이번에 책을 쓰기 위해 최초에 저를 흥분시켰던 '4차 산업혁명'의 의미를 처음으로 돌아가 다시 한번 음미를 해보았다. 4차 산업혁명이 매력적인 것은 온라인 세상과 오프라인 세상이 분리되어 있는게 아니고 연결되는 패러다임이라는 점이다. 짧게 요약하자면 '실생활에 친화적'인 혁신이라고 할 수 있겠다. 예를 들면 실생활에 친화적인 서비스이다.  온라인 세상에서 아바타에 옷입히고 이모티콘을 사는 것이 아니고 오프라인에서 필요한 물건을 구입하거나 식사를 주문하는 서비스를 말한다. 
실생활이기 때문에 업무적인 환경도 포함이 된다. 업무에 도움이 되거나 생활에 불편함을 해소하는 서비스들을 이야기한다. 실생활에 친화적인 비즈니스 모델 또한 중앙의 플랫폼 제공업자만 수익을 만드는게 아니라 참여자들 모두가 수익을 만들 수 있는 환경을 의미한다. 실생활에 친화적인 UX 또한 '컴퓨터 중심의' 입력 방식이나 화면 기반의 사용자 경험을 탈피하는 현상을 말한다. 실생활에서 가장 일반화된 UX인 '대화'가 여기에서 등장하는 이유이기도 하다.



사용자 삽입 이미지
이러한 현상을 도식화해서 설명을 하자면 이 그림과 같다. 원 보고서는 '제조업'에 한정하여 표현을 했었는데, 이를 좀 더 포괄적인 내용으로 재구성을 해 보았다. 오프라인 산업은 온라인화되고, 온라인 사업은 오프라인으로 확장하는 모습이 현재라면, 완숙기에 접어들면서 그 부분이 희미해지고 플랫폼을 통한 융합 서비스가 만들어질 수 있을 것이다. 여기에서 말하는 플랫폼은 다양한게 있겠지만, 그 중에서 '대화형 플랫폼'에 집중하여 설명하겠다.



사용자 삽입 이미지
이쯤에서 '대화형 플랫폼'의 흐름과 모습을 살펴보기로 하자. 텍스트와 음성의 형태로 입력/출력이 일어나고 사용자 인터페이스를 통해 대화형 플랫폼에서 분석을 해낸다. 이를 통해 응용 서비스들이 만들어지고 있다. 이 중에서 응용서비스에 대한 설명을 먼저하고, 입력/출력이 되는 텍스트와 음성을 설명하고, 그 다음에 사용자 인터페이스(확장해서 사용자 경험), 그리고 마지막으로 이를 총괄하는 대화형 플랫폼을 설명하도록 하겠다.



사용자 삽입 이미지

그럼 첫번째 응용서비스인 ‘챗봇’을 한번 살펴보기로 하자.텍스트를 기반으로 하는 챗봇은 초기 대화형 플랫폼 시장을 이끌면서 다양한 제품과 튼튼한 생태계를 만들어가고 있다. 별도의 기기나 앱을 사용하지 않더라도 기존의 메신저나 소셜네트워크 서비스를 통해 접근할 수 있으며, 다양한 솔루션이 등장하면서 IT 역량이 크지 않은 기업도 쉽게 챗봇을 만들 수 있는 환경이 마련되고 있다. 지난 1년동안 챗봇의 모습은 크게 4가지로 요약할 수 있다.



사용자 삽입 이미지
먼저 꾸준한 성장을 하고 있는 것을 확인할 수 있다. 시장조사 업체 테크나비오는 전 세계 챗봇 시장이 계속해서 성장하여 2021년 31억 7천만 달러(약 3조 5천억 원)를 넘어설 것으로 전망했다. 이는 연평균 35%의 성장률을 보여준다. 초기 챗봇은 고객 상담과 응대를 중심으로 확대되었다. 이외에 전자상거래 분야나 미디어 콘텐츠 분야, 자산관리사, 컨설팅, 교육 및 서비스 분야 등에서도 다양한 챗봇이 등장하여 사용자들의 편의를 높여주고 있다. 챗봇을 제공하는 서비스들도 증가하여 2017년 15만 개였던 글로벌 챗봇 수는 2022년에는 2천 430만 개가 될 것으로 전망했다.
국내에서 가장 오래된 챗봇 중에 하나가 인터파크가 2016년 5월부터 운영해 온 ‘톡집사’이다. 초반의 톡집사는 업계에서 많은 비평을 받았다. 지인들에게도 이야기 하면 ‘톡집사는 챗봇 아니예요. 잘 사용되지도 않아요’라는 반응을 듣곤했다. 실제로 서비스 초기 이용자는 일 평균 5천 명에 불과했지만 2017년에는 약 1.1만 명으로 증가하더니 2018년 8월 기준으로 주중 이용자 수 2만 명 정도를 유지하고 있다. 2018년 8월에는 누적 이용 건수 1000만을 돌파했다.


사용자 삽입 이미지

예상보다 빠르게 인공지능은 정교해지고, 소위 ‘쓸만해지고’ 있다. 톡집사는 인공지능이 답하기 어려운 복잡한 문의가 들어오면 전문 상담원이 응대하는 형태로 전환되며, 이를 위해 50여 명의 전문 상담원을 두고 있다. 서비스 초기에는 인공지능과 상담원의 대응 비율이 2대8 수준(응대 시간 기준)이었으나, 현재는 약 5대5로 대등한 수준을 유지하고 있다. 데이터만 좀 더 수집된다면 인공지능이 응대하는 비율이 더 높아질 수도 있을 것으로 예상하고 있다.
네덜란드 항공사인 KLM은 ‘블루봇’이라는 챗봇을 오랫동안 운영해오고 있다. KLM도 앞의 톡집사처럼 인공지능이 답변하기 어려운 질문은 전문 상담사가 응대하는데 해당 인력은 250여 명에 이른다. 서비스 초기에는 대부분 응대를 상담사가 처리했고, 인공지능이 답변하더라도 관리자의 확인을 거친 후 전송하는 과정을 거쳐야 했다. 현재는 인공지능이 처리한 응답은 전체의 50% 수준이 됐고 상담사가 답변할 때도 인공지능이 먼저 예상 답변을 만들어주고 있다.



사용자 삽입 이미지

사업에서 긍정적인 성과도 어느 정도 증명을 하고 있다.  인터파크 방문객 중에서 실제 구매로 이어지는 비중은 5% 내외이나, 톡집사 이용 고객의 구매 전환율은 20%로 일반 고객과 비교해서 4배 수준이다. 그만큼 고객에 대한 개인화된 반응과 빠른 대응에 만족도가 높으며 이는 전체 모바일 서비스의 활성화로 이어질 수 있음을 증명한 것이다. 서비스의 활성화가 곧바로 매출로 연결되는 커머스 서비스에서는 매우 중요한 사례로 눈여겨볼 필요가 있다.
카카오는 오픈빌더의 베타 테스트를 진행했었는데, 일차적으로 긍정적인 성과를 이루었다고 평가하고 있다. 롯데리아와 엔제리너스는 고객센터 문의량이 10% 이상 감소했다. 카카오메이커스에서는 챗봇이 주문 내역, 배송 일정을 안내하며 기존 문의 업무의 25%를 소화하고 있다. 프로야구 경기 일정 및 결과, 선수 정보 등을 확인할 수 있는 '프로야구봇'은 현재 매일 8만여 명이 약 42만 회 이상 기능을 사용한다.  다만, 챗봇이 사용되는 장르나 목적에 따라 '성과'의 정의도 다르고 측정도 정확하지 않다. 실제로 비판적인 목소리도 적지 않은게 사실이다.



챗봇 #4 - 레버리지

'케어-ECare-E'라는 이름의 이 로봇은 미국 뉴욕 존 F. 케네디 공항과 샌프란시스코 공항에서 고객들의 짐을 실어 날라주고 있다. 이 로봇은 앞에서 설명한 KLM에서 만들었다. IT기반의 회사를 다니시는 분은 이 이야기를 들으면 로봇과 챗봇이 무슨 관계냐고 할 것이다.
하지만, 오프라인 기업에 있다보면 뭐하나 새롭게 시작하고 이를 기반으로 데이터를 정비하고 조직을 꾸리고 로드맵을 만드는게 굉장히 힘들다는 것을 알게된다. IT기업이나 공항이 아니라 항공사가 이러한 로봇을 만들 수 있었던 것은 '챗봇'을 만들었던 경험을 기반으로 한 것이라고 설명할 수 있다.



사용자 삽입 이미지

챗봇만큼이나 뜨거운 아이템이 스마트 스피커이다. 국내에서만 유독 'AI 스피커'라고 부르는데 해외에서는 '스마트 스피커'라고 부른다. 스크린이 없어도 가장 자연스러운 기기기 '스피커'에 대화형 플랫폼을 내장시켜 사용성을 높였다. 아직은 대중화라고 말할 수는 없지만, 상대적으로 사용자 친화적인 서비스이며 기기라고 생각한다.작년에도 스마트 스피커에 대한 언급을 이 자리에서 했었는데 1년 동안 어떤 변화가 있었는지 짧게 살펴보도록 하자.



사용자 삽입 이미지
글로벌 시장조사업체 카날리스에 따르면 전 세계 스마트 스피커 설치 대수는 올해 말까지 약 1억 대 이상일 것으로 보인다. 이는 지난해 말과 비교했을 때 2.5배 늘어난 규모다. 국내 스마트 스피커의 판매량은 300만대 정도이다. 이는 전세계 스마트 스피커의 점유율 중에서 3%에 해당하는 수치인데 순위로 말하자면 5위에 해당한다. '3%'라는 수치가 작아보일 수도 있지만 지난해와 비교했을 때 미국의 점유율은 73%에서 64%로 9%p 줄어들고, 영국과 독일도 각각 2%p 감소한 상황에서 5위 밖에 있던 한국이 새롭게 들어올 만큼 빠르게 성장하는 시장이다.



사용자 삽입 이미지

아마존 에코를 시작으로 스마트 스피커는 단순 대화형 기기에서 플랫폼이 되어가고 있다. 써드파티 서비스가 연동될 수 있는 아마존 스킬의 증가 추이를 살펴보자. 엄청나게 빠르게 증가를 하고 있다는 것을 알 수 있다. 스마트 스피커를 통해 서비스를 제공하는 것은 아마존만의 전유물이 아니다. 국내 스마트 스피커들도 유사한 행보를 시작했는데 대표적인 사례가 클로바의 ‘확장 서비스'다. 이미 다양한 서비스가 확장 서비스에 포함되었는데 이 중에서 배달의민족을 발견할 수 있다. NUGU를 통해서는 11번가 쇼핑을 하거나 배송 상태를 확인할 수 있다. 도미나피자나 BBQ를 주문하는 것도 가능하다. 



사용자 삽입 이미지

개인적으로 집에 스마트 스피커가 4개가 있다. 그래도 남들보다 이러한 기기에 대한 적응력이 높다고 자부했다. 가장 먼저 구매한 제품이 클로바였는데, 사면서 절대로 '날씨'는 물어보지 않으리라 다짐을 했었다. 그런데, 날씨를 안 물어보려니 할말이 없었다. 결국, 지금은 4개의 스피커에게 아침마다 날씨를 물어보고 있다. 나와 같은 사람이 많은 듯 하다. 사람들이 스마트 스피커에게 물어보는 질문의 2위가 '날씨'이다.
그만큼 아직까지는 사용할게 없고, 기술적이나 서비스적으로나 초기 단계라는 뜻이다. 그럼 3위가 무엇일까? 3위는 '비서 기능'이다. "전화 걸어줘", "TV 켜줘", "알람 설정해줘" 같은 내용이다. 1위는 맛집이다. 식사 전 스마트 스피커를 통해 맛집 추천 서비스를 이용하는 경우가 제일 많은 것으로 확인됐다. 그만큼 아직은 쓸만한 서비스가 부족하고 초기단계인 상황이다.



사용자 삽입 이미지

이렇게 스마트 스피커에 대한 사용자들의 이용만족률(매우+약간 만족)은 49%로 다소 낮은 수준이다. 51%가 보통 또는 불만족을 선택을 했다. 신제품 시장 초기에 흔히 나타날 수 있는 점수이긴 하지만 불만족의 이유가 중요하다.  ‘음성 명령이 잘되지 않는다(50%)’, ‘자연스런 대화가 곤란하다(41%)’, ‘소음을 음성 명령으로 오인한다(36%)’ 등의 순이었다.  
스마트 스피커가 다른 기기들과 근본적으로 구별되는 기본적인 기능임에도 불구하고 제대로 동작을 하지 않는다는 이야기이다. 기술상의 문제나 사용자들의 낯설음도 한 몫을 했겠지만 근본적으로 사용자의 니즈가 아닌 제조사들의 욕심에 의해 빠른 출시를 서둘렀기 때문이다. 제품으로서 완성도가 낮다는 이야기가 되겠다.



사용자 삽입 이미지
이러한 낮은 완성도에도 불구하고 스마트 스피커를 오랫동안 사용하다보니 크진 않지만 생활의 패턴이 변하는 것을 느끼고 있다. 개인의 문제인가 싶어서 관련한 자료를 찾아보았다. NPR과 에디슨 리서치의 보고서가 있었는데, 해당 보고서에 의하면 스마트 스피커를 이용하면서 스마트폰 이용 시간이 줄었다는 응답은 34%, TV 시청 시간이 줄었다는 응답은 30%였다. 스크린을 기반의 미디어 소비가 줄어든다는 뜻이다.
그렇다면 어떤 미디어의 소비가 반대로 증가했을까? 당연히 오디오 기반의 미디어이다. 응답자 대부분은 스마트 스피커를의 주요 용도로 음악 청취를 꼽았는데, 71%는 스마트 스피커를 구입한 이후 음악 듣는 시간이 늘었다고 응답했다. 개인적으로는 이러한 미디어 소비 행태의 변화에 매우 공감이 가고, 오디오 콘텐츠에 대한 선호도가 있는 분들은 스마트 스피커에 대한 만족도가 높을 것이라 추측한다.
시장조사업체 에디슨리서치가 아마존의 스마트 스피커 ‘에코’ 소유자를 대상으로 조사한 자료를 보면 흥미로운 대목이 나타난다. 먼저 1대를 소유한 사람은 58%였고 2대 이상 가진 사람은 42%였다. 여기서 주목할 점은 42%의 사람들이다. 첫 번째 스피커에 실망한 사람이 두 번째 스피커를 살리는 없기 때문이다. 필자는 42%의 소비자들과 오디오 콘텐츠에 강한 상관 관계가 있다고 생각한다.



사용자 삽입 이미지
대화형 플랫폼에 대한 이야기를 하다보면 가상 비서 이야기를 하지 않을 수 없다. 시리에서 시작된 가상비서의 본격적인 탄생은 구글 나우와 코타나, 알렉사 등이 연이어탄생하면서 대형 업체들이 진출을 했다. AI 플랫폼을 기반으로 하여 대화형 기능을 장착한 가상비서는 사실 스마트 스피커 보다도 초기 단계로 보여진다. 그렇기 때문에 지겨운 '가상 비서'에 대한 설명과 상세한 이야기는 하지 않겠다. 2018년에 보여졌던 큰 특징 2가지만 설명하고 지나가려고 한다.



사용자 삽입 이미지
지금까지 스마트 비서는 스마트폰에 탑재된 형태로 시장을 주도했다. 덕분에 iOS를 가지고 있는 애플과 Android를 가지고 있는 구글의 영향력이 절대적이었다. 2018년 7월에 발표된 스트래티지 애널리틱스Strategy Analytics, SA의 보고서에 따르면 현재 스마트 비서의 점유율은 구글 어시스턴트가 46.7%, 애플 시리는 40.1%다. 그런데, 2018년은 가상 비서가 스마트폰에 나와서 멀티 채널과 멀티 디바이스 형태로 발전하면서 고착화된 시장에 서서히 변화를 보인 해이다.
국내에서는 '누구'가 대표적인 사례이다. 스마트 스피커에 탑재되었던 누구는 국내 대표적인 내비게이션 앱인 ‘티맵'에  탑재되면서부터 변곡점을 만들어 냈다. 티맵과 누구의 연동은 사용자가 목적지를 음성으로 설정할 수 있게 하는 게 시작이었다. 티맵의 고객 충성도에 힘을 얻어 반응은 폭발적이었다. 출시된 지 18일 만에 누적 다운로드 300만 명을 넘어섰다. 이후, 주행 중에 누구를 통해 전화를 받거나 걸 수 있게 기능을 추가했다. 최근에는 문자를 주고받을 수도 있게 됐고 스타벅스의 주문 앱 ‘사이렌 오더'와 연동해 스타벅스에 주문도 가능하며, 운전을 하면서 음성으로 멜론에 있는 음악을 재생할 수 있게 되었다. 현재는 티맵 이외에  인터넷TV 셋톱박스, 어린이용 시계 등에도 누구가 들어가고 있다.


가상 비서 #2 - 하이브리드 UX
국내 사용자들에게 '빅스비'는 사실 호감도가 높은 플랫폼은 아니다. 하지만, UX적인 접근에서 매우 흥미로운 방향을 제시하고 있다. 먼저 아래 동영상을 재생해보라. 10초 즈음에 주목하여 살펴보기를 바란다.

일반적으로 '대화형 플랫폼'이라고 하면 스크린에 터치를 전혀 하지 않고 사용하는 모습이 떠오를 것이다. 실제 대부분의 광고 영상이나 컨셉이 그렇기도 하다. 그런데, 스마트폰을 비롯한 각종 기기를 사용하려면 '대화'만으로는 불편할 때가 있다.
빅스비는 다양한 입력 수단과 혼합하여 이용할 수 있게 설계되었다. 화면을 터치하면서 음성 명령을 이용하거나 사용자가 최종 확인 버튼을 누르게 하는 방식이다. 예를 들어 “빅스비, 오늘 찍은 사진 보여줘”라고 음성 명령을 내리면 “X장의 사진이 있어요"라는 답변과 함께 사진을 화면에 보여준다. 여기서 원하는 사진을 터치로 선택하고 “빅스비, 서울 폴더 만들어서 넣어줘"라고 명령하면 “앨범을 만들었어요"라는 답변과 함께 ‘서울' 폴더를 생성해 원하는 사진만 모아준다. 대화형 플랫폼을 터치와 함께 사용하고 있는 것인데 기술 완성도가 아직은 진행 중인 현실을 인정한 UX의 접근이라고 생각한다.
2018/11/24 14:50 2018/11/24 14:50