모바일 왕국을 꿈꾸며!!! mobizen@mobizen.pe.kr

Posted
Filed under 원고 및 발표자료
사용자 삽입 이미지

작년에 이어서 올해도 공저로 저술한 'IT 트렌드 스페셜 리포트 2019'가 출간되었다. 올해도 7가지 주제를 선정했고, 5G와 대화형 플랫폼을 담당하여 내용을 정리했다. 작년보다 많은 저자들이 참여하면서 서로의 생각을 들어보고 시장의 트렌드를 함께 논의할 수 있는 좋은 기회를 가질 수 있었다. 수능날인 2018년 11월 15일에, 작년과 동일하게 출간 기념 컨퍼런스가 진행이 되었는데, 패널토의와 '대화형 플랫폼'을 주제로 세션 발표를 하였다. 해당 세션 발표 내용을 정리하여 글로 남겨본다.



사용자 삽입 이미지

세션 발표는 작년에 발표했던 '챗봇'에 대한 내용을 요약으로 시작을 했다. 작년 발표 내용은 이곳에 정리를 해 두었으니 먼저 읽어보면 올해의 발표 내용과 비교하면서 정리가 될 것이다.



사용자 삽입 이미지

이제 2018년이 가고 2019년을 준비해야 하는 시기가 되었다. 작년에 'IT 트렌드 스페셜 리포트 2018'를 발간할 당시와 현재가 어떻게 바뀌었는지 짧게 정리를 해보자. 첫번째는 주요 테마가 인공지능에서 4차 산업혁명으로 변화되었다. 이 이야기를 듣는 분들 중에서는 "4차 산업혁명이 아니고 블록체인인 것 같은데.."라고 하시는 분이 있을 수 있다. 화제성면에서는 분명히 블록체인이 맞긴 하지만 업계 전체적인 영향도와 다양한 기술과 연계되는 키워드는 '4차 산업혁명'이라고 생각한다. 이번 책의 주제으로 선정된 이유이기도 하다.
두번째는 챗봇이 대화형 플랫폼으로 진화되었다. 대화형 플랫폼은 '대화'와 '플랫폼'이라는 2가지 키워드로 구성이 되어 있고, 이제부터 자세히 설명을 할 예정이다. 마지막으로 앞에서 설명했던 것처럼 서비스였던 챗봇이 대화형 플랫폼으로 변하면서 '사용자 경험'으로 새롭게 포지셔닝을 했다. 



사용자 삽입 이미지

먼저 '4차 산업혁명'에서부터 이야기를 풀어나가 보자 한다. 개인적으로는 '4차 산업혁명'이라는 번역된 단어가 등장하기 전부터 'Industry 4.0'이라는 키워드를 듣고 좋아했었다. 남들보다 일찍 들었고 칼럼도 몇차례 썼었다. 그런데, 너무나 많은 곳에서 서로 다른 의미로 '4차 산업혁명'이란 단어가 남발되자 점차 거부감이 들기 시작했다. '창조경제'만큼이나 모호한 단어라는 생각이 들기도 했다. 
이번에 책을 쓰기 위해 최초에 저를 흥분시켰던 '4차 산업혁명'의 의미를 처음으로 돌아가 다시 한번 음미를 해보았다. 4차 산업혁명이 매력적인 것은 온라인 세상과 오프라인 세상이 분리되어 있는게 아니고 연결되는 패러다임이라는 점이다. 짧게 요약하자면 '실생활에 친화적'인 혁신이라고 할 수 있겠다. 예를 들면 실생활에 친화적인 서비스이다.  온라인 세상에서 아바타에 옷입히고 이모티콘을 사는 것이 아니고 오프라인에서 필요한 물건을 구입하거나 식사를 주문하는 서비스를 말한다. 
실생활이기 때문에 업무적인 환경도 포함이 된다. 업무에 도움이 되거나 생활에 불편함을 해소하는 서비스들을 이야기한다. 실생활에 친화적인 비즈니스 모델 또한 중앙의 플랫폼 제공업자만 수익을 만드는게 아니라 참여자들 모두가 수익을 만들 수 있는 환경을 의미한다. 실생활에 친화적인 UX 또한 '컴퓨터 중심의' 입력 방식이나 화면 기반의 사용자 경험을 탈피하는 현상을 말한다. 실생활에서 가장 일반화된 UX인 '대화'가 여기에서 등장하는 이유이기도 하다.



사용자 삽입 이미지
이러한 현상을 도식화해서 설명을 하자면 이 그림과 같다. 원 보고서는 '제조업'에 한정하여 표현을 했었는데, 이를 좀 더 포괄적인 내용으로 재구성을 해 보았다. 오프라인 산업은 온라인화되고, 온라인 사업은 오프라인으로 확장하는 모습이 현재라면, 완숙기에 접어들면서 그 부분이 희미해지고 플랫폼을 통한 융합 서비스가 만들어질 수 있을 것이다. 여기에서 말하는 플랫폼은 다양한게 있겠지만, 그 중에서 '대화형 플랫폼'에 집중하여 설명하겠다.



사용자 삽입 이미지
이쯤에서 '대화형 플랫폼'의 흐름과 모습을 살펴보기로 하자. 텍스트와 음성의 형태로 입력/출력이 일어나고 사용자 인터페이스를 통해 대화형 플랫폼에서 분석을 해낸다. 이를 통해 응용 서비스들이 만들어지고 있다. 이 중에서 응용서비스에 대한 설명을 먼저하고, 입력/출력이 되는 텍스트와 음성을 설명하고, 그 다음에 사용자 인터페이스(확장해서 사용자 경험), 그리고 마지막으로 이를 총괄하는 대화형 플랫폼을 설명하도록 하겠다.



사용자 삽입 이미지

그럼 첫번째 응용서비스인 ‘챗봇’을 한번 살펴보기로 하자.텍스트를 기반으로 하는 챗봇은 초기 대화형 플랫폼 시장을 이끌면서 다양한 제품과 튼튼한 생태계를 만들어가고 있다. 별도의 기기나 앱을 사용하지 않더라도 기존의 메신저나 소셜네트워크 서비스를 통해 접근할 수 있으며, 다양한 솔루션이 등장하면서 IT 역량이 크지 않은 기업도 쉽게 챗봇을 만들 수 있는 환경이 마련되고 있다. 지난 1년동안 챗봇의 모습은 크게 4가지로 요약할 수 있다.



사용자 삽입 이미지
먼저 꾸준한 성장을 하고 있는 것을 확인할 수 있다. 시장조사 업체 테크나비오는 전 세계 챗봇 시장이 계속해서 성장하여 2021년 31억 7천만 달러(약 3조 5천억 원)를 넘어설 것으로 전망했다. 이는 연평균 35%의 성장률을 보여준다. 초기 챗봇은 고객 상담과 응대를 중심으로 확대되었다. 이외에 전자상거래 분야나 미디어 콘텐츠 분야, 자산관리사, 컨설팅, 교육 및 서비스 분야 등에서도 다양한 챗봇이 등장하여 사용자들의 편의를 높여주고 있다. 챗봇을 제공하는 서비스들도 증가하여 2017년 15만 개였던 글로벌 챗봇 수는 2022년에는 2천 430만 개가 될 것으로 전망했다.
국내에서 가장 오래된 챗봇 중에 하나가 인터파크가 2016년 5월부터 운영해 온 ‘톡집사’이다. 초반의 톡집사는 업계에서 많은 비평을 받았다. 지인들에게도 이야기 하면 ‘톡집사는 챗봇 아니예요. 잘 사용되지도 않아요’라는 반응을 듣곤했다. 실제로 서비스 초기 이용자는 일 평균 5천 명에 불과했지만 2017년에는 약 1.1만 명으로 증가하더니 2018년 8월 기준으로 주중 이용자 수 2만 명 정도를 유지하고 있다. 2018년 8월에는 누적 이용 건수 1000만을 돌파했다.


사용자 삽입 이미지

예상보다 빠르게 인공지능은 정교해지고, 소위 ‘쓸만해지고’ 있다. 톡집사는 인공지능이 답하기 어려운 복잡한 문의가 들어오면 전문 상담원이 응대하는 형태로 전환되며, 이를 위해 50여 명의 전문 상담원을 두고 있다. 서비스 초기에는 인공지능과 상담원의 대응 비율이 2대8 수준(응대 시간 기준)이었으나, 현재는 약 5대5로 대등한 수준을 유지하고 있다. 데이터만 좀 더 수집된다면 인공지능이 응대하는 비율이 더 높아질 수도 있을 것으로 예상하고 있다.
네덜란드 항공사인 KLM은 ‘블루봇’이라는 챗봇을 오랫동안 운영해오고 있다. KLM도 앞의 톡집사처럼 인공지능이 답변하기 어려운 질문은 전문 상담사가 응대하는데 해당 인력은 250여 명에 이른다. 서비스 초기에는 대부분 응대를 상담사가 처리했고, 인공지능이 답변하더라도 관리자의 확인을 거친 후 전송하는 과정을 거쳐야 했다. 현재는 인공지능이 처리한 응답은 전체의 50% 수준이 됐고 상담사가 답변할 때도 인공지능이 먼저 예상 답변을 만들어주고 있다.



사용자 삽입 이미지

사업에서 긍정적인 성과도 어느 정도 증명을 하고 있다.  인터파크 방문객 중에서 실제 구매로 이어지는 비중은 5% 내외이나, 톡집사 이용 고객의 구매 전환율은 20%로 일반 고객과 비교해서 4배 수준이다. 그만큼 고객에 대한 개인화된 반응과 빠른 대응에 만족도가 높으며 이는 전체 모바일 서비스의 활성화로 이어질 수 있음을 증명한 것이다. 서비스의 활성화가 곧바로 매출로 연결되는 커머스 서비스에서는 매우 중요한 사례로 눈여겨볼 필요가 있다.
카카오는 오픈빌더의 베타 테스트를 진행했었는데, 일차적으로 긍정적인 성과를 이루었다고 평가하고 있다. 롯데리아와 엔제리너스는 고객센터 문의량이 10% 이상 감소했다. 카카오메이커스에서는 챗봇이 주문 내역, 배송 일정을 안내하며 기존 문의 업무의 25%를 소화하고 있다. 프로야구 경기 일정 및 결과, 선수 정보 등을 확인할 수 있는 '프로야구봇'은 현재 매일 8만여 명이 약 42만 회 이상 기능을 사용한다.  다만, 챗봇이 사용되는 장르나 목적에 따라 '성과'의 정의도 다르고 측정도 정확하지 않다. 실제로 비판적인 목소리도 적지 않은게 사실이다.



챗봇 #4 - 레버리지

'케어-ECare-E'라는 이름의 이 로봇은 미국 뉴욕 존 F. 케네디 공항과 샌프란시스코 공항에서 고객들의 짐을 실어 날라주고 있다. 이 로봇은 앞에서 설명한 KLM에서 만들었다. IT기반의 회사를 다니시는 분은 이 이야기를 들으면 로봇과 챗봇이 무슨 관계냐고 할 것이다.
하지만, 오프라인 기업에 있다보면 뭐하나 새롭게 시작하고 이를 기반으로 데이터를 정비하고 조직을 꾸리고 로드맵을 만드는게 굉장히 힘들다는 것을 알게된다. IT기업이나 공항이 아니라 항공사가 이러한 로봇을 만들 수 있었던 것은 '챗봇'을 만들었던 경험을 기반으로 한 것이라고 설명할 수 있다.



사용자 삽입 이미지

챗봇만큼이나 뜨거운 아이템이 스마트 스피커이다. 국내에서만 유독 'AI 스피커'라고 부르는데 해외에서는 '스마트 스피커'라고 부른다. 스크린이 없어도 가장 자연스러운 기기기 '스피커'에 대화형 플랫폼을 내장시켜 사용성을 높였다. 아직은 대중화라고 말할 수는 없지만, 상대적으로 사용자 친화적인 서비스이며 기기라고 생각한다.작년에도 스마트 스피커에 대한 언급을 이 자리에서 했었는데 1년 동안 어떤 변화가 있었는지 짧게 살펴보도록 하자.



사용자 삽입 이미지
글로벌 시장조사업체 카날리스에 따르면 전 세계 스마트 스피커 설치 대수는 올해 말까지 약 1억 대 이상일 것으로 보인다. 이는 지난해 말과 비교했을 때 2.5배 늘어난 규모다. 국내 스마트 스피커의 판매량은 300만대 정도이다. 이는 전세계 스마트 스피커의 점유율 중에서 3%에 해당하는 수치인데 순위로 말하자면 5위에 해당한다. '3%'라는 수치가 작아보일 수도 있지만 지난해와 비교했을 때 미국의 점유율은 73%에서 64%로 9%p 줄어들고, 영국과 독일도 각각 2%p 감소한 상황에서 5위 밖에 있던 한국이 새롭게 들어올 만큼 빠르게 성장하는 시장이다.



사용자 삽입 이미지

아마존 에코를 시작으로 스마트 스피커는 단순 대화형 기기에서 플랫폼이 되어가고 있다. 써드파티 서비스가 연동될 수 있는 아마존 스킬의 증가 추이를 살펴보자. 엄청나게 빠르게 증가를 하고 있다는 것을 알 수 있다. 스마트 스피커를 통해 서비스를 제공하는 것은 아마존만의 전유물이 아니다. 국내 스마트 스피커들도 유사한 행보를 시작했는데 대표적인 사례가 클로바의 ‘확장 서비스'다. 이미 다양한 서비스가 확장 서비스에 포함되었는데 이 중에서 배달의민족을 발견할 수 있다. NUGU를 통해서는 11번가 쇼핑을 하거나 배송 상태를 확인할 수 있다. 도미나피자나 BBQ를 주문하는 것도 가능하다. 



사용자 삽입 이미지

개인적으로 집에 스마트 스피커가 4개가 있다. 그래도 남들보다 이러한 기기에 대한 적응력이 높다고 자부했다. 가장 먼저 구매한 제품이 클로바였는데, 사면서 절대로 '날씨'는 물어보지 않으리라 다짐을 했었다. 그런데, 날씨를 안 물어보려니 할말이 없었다. 결국, 지금은 4개의 스피커에게 아침마다 날씨를 물어보고 있다. 나와 같은 사람이 많은 듯 하다. 사람들이 스마트 스피커에게 물어보는 질문의 2위가 '날씨'이다.
그만큼 아직까지는 사용할게 없고, 기술적이나 서비스적으로나 초기 단계라는 뜻이다. 그럼 3위가 무엇일까? 3위는 '비서 기능'이다. "전화 걸어줘", "TV 켜줘", "알람 설정해줘" 같은 내용이다. 1위는 맛집이다. 식사 전 스마트 스피커를 통해 맛집 추천 서비스를 이용하는 경우가 제일 많은 것으로 확인됐다. 그만큼 아직은 쓸만한 서비스가 부족하고 초기단계인 상황이다.



사용자 삽입 이미지

이렇게 스마트 스피커에 대한 사용자들의 이용만족률(매우+약간 만족)은 49%로 다소 낮은 수준이다. 51%가 보통 또는 불만족을 선택을 했다. 신제품 시장 초기에 흔히 나타날 수 있는 점수이긴 하지만 불만족의 이유가 중요하다.  ‘음성 명령이 잘되지 않는다(50%)’, ‘자연스런 대화가 곤란하다(41%)’, ‘소음을 음성 명령으로 오인한다(36%)’ 등의 순이었다.  
스마트 스피커가 다른 기기들과 근본적으로 구별되는 기본적인 기능임에도 불구하고 제대로 동작을 하지 않는다는 이야기이다. 기술상의 문제나 사용자들의 낯설음도 한 몫을 했겠지만 근본적으로 사용자의 니즈가 아닌 제조사들의 욕심에 의해 빠른 출시를 서둘렀기 때문이다. 제품으로서 완성도가 낮다는 이야기가 되겠다.



사용자 삽입 이미지
이러한 낮은 완성도에도 불구하고 스마트 스피커를 오랫동안 사용하다보니 크진 않지만 생활의 패턴이 변하는 것을 느끼고 있다. 개인의 문제인가 싶어서 관련한 자료를 찾아보았다. NPR과 에디슨 리서치의 보고서가 있었는데, 해당 보고서에 의하면 스마트 스피커를 이용하면서 스마트폰 이용 시간이 줄었다는 응답은 34%, TV 시청 시간이 줄었다는 응답은 30%였다. 스크린을 기반의 미디어 소비가 줄어든다는 뜻이다.
그렇다면 어떤 미디어의 소비가 반대로 증가했을까? 당연히 오디오 기반의 미디어이다. 응답자 대부분은 스마트 스피커를의 주요 용도로 음악 청취를 꼽았는데, 71%는 스마트 스피커를 구입한 이후 음악 듣는 시간이 늘었다고 응답했다. 개인적으로는 이러한 미디어 소비 행태의 변화에 매우 공감이 가고, 오디오 콘텐츠에 대한 선호도가 있는 분들은 스마트 스피커에 대한 만족도가 높을 것이라 추측한다.
시장조사업체 에디슨리서치가 아마존의 스마트 스피커 ‘에코’ 소유자를 대상으로 조사한 자료를 보면 흥미로운 대목이 나타난다. 먼저 1대를 소유한 사람은 58%였고 2대 이상 가진 사람은 42%였다. 여기서 주목할 점은 42%의 사람들이다. 첫 번째 스피커에 실망한 사람이 두 번째 스피커를 살리는 없기 때문이다. 필자는 42%의 소비자들과 오디오 콘텐츠에 강한 상관 관계가 있다고 생각한다.



사용자 삽입 이미지
대화형 플랫폼에 대한 이야기를 하다보면 가상 비서 이야기를 하지 않을 수 없다. 시리에서 시작된 가상비서의 본격적인 탄생은 구글 나우와 코타나, 알렉사 등이 연이어탄생하면서 대형 업체들이 진출을 했다. AI 플랫폼을 기반으로 하여 대화형 기능을 장착한 가상비서는 사실 스마트 스피커 보다도 초기 단계로 보여진다. 그렇기 때문에 지겨운 '가상 비서'에 대한 설명과 상세한 이야기는 하지 않겠다. 2018년에 보여졌던 큰 특징 2가지만 설명하고 지나가려고 한다.



사용자 삽입 이미지
지금까지 스마트 비서는 스마트폰에 탑재된 형태로 시장을 주도했다. 덕분에 iOS를 가지고 있는 애플과 Android를 가지고 있는 구글의 영향력이 절대적이었다. 2018년 7월에 발표된 스트래티지 애널리틱스Strategy Analytics, SA의 보고서에 따르면 현재 스마트 비서의 점유율은 구글 어시스턴트가 46.7%, 애플 시리는 40.1%다. 그런데, 2018년은 가상 비서가 스마트폰에 나와서 멀티 채널과 멀티 디바이스 형태로 발전하면서 고착화된 시장에 서서히 변화를 보인 해이다.
국내에서는 '누구'가 대표적인 사례이다. 스마트 스피커에 탑재되었던 누구는 국내 대표적인 내비게이션 앱인 ‘티맵'에  탑재되면서부터 변곡점을 만들어 냈다. 티맵과 누구의 연동은 사용자가 목적지를 음성으로 설정할 수 있게 하는 게 시작이었다. 티맵의 고객 충성도에 힘을 얻어 반응은 폭발적이었다. 출시된 지 18일 만에 누적 다운로드 300만 명을 넘어섰다. 이후, 주행 중에 누구를 통해 전화를 받거나 걸 수 있게 기능을 추가했다. 최근에는 문자를 주고받을 수도 있게 됐고 스타벅스의 주문 앱 ‘사이렌 오더'와 연동해 스타벅스에 주문도 가능하며, 운전을 하면서 음성으로 멜론에 있는 음악을 재생할 수 있게 되었다. 현재는 티맵 이외에  인터넷TV 셋톱박스, 어린이용 시계 등에도 누구가 들어가고 있다.


가상 비서 #2 - 하이브리드 UX
국내 사용자들에게 '빅스비'는 사실 호감도가 높은 플랫폼은 아니다. 하지만, UX적인 접근에서 매우 흥미로운 방향을 제시하고 있다. 먼저 아래 동영상을 재생해보라. 10초 즈음에 주목하여 살펴보기를 바란다.

일반적으로 '대화형 플랫폼'이라고 하면 스크린에 터치를 전혀 하지 않고 사용하는 모습이 떠오를 것이다. 실제 대부분의 광고 영상이나 컨셉이 그렇기도 하다. 그런데, 스마트폰을 비롯한 각종 기기를 사용하려면 '대화'만으로는 불편할 때가 있다.
빅스비는 다양한 입력 수단과 혼합하여 이용할 수 있게 설계되었다. 화면을 터치하면서 음성 명령을 이용하거나 사용자가 최종 확인 버튼을 누르게 하는 방식이다. 예를 들어 “빅스비, 오늘 찍은 사진 보여줘”라고 음성 명령을 내리면 “X장의 사진이 있어요"라는 답변과 함께 사진을 화면에 보여준다. 여기서 원하는 사진을 터치로 선택하고 “빅스비, 서울 폴더 만들어서 넣어줘"라고 명령하면 “앨범을 만들었어요"라는 답변과 함께 ‘서울' 폴더를 생성해 원하는 사진만 모아준다. 대화형 플랫폼을 터치와 함께 사용하고 있는 것인데 기술 완성도가 아직은 진행 중인 현실을 인정한 UX의 접근이라고 생각한다.
2018/11/24 14:50 2018/11/24 14:50