Автоматизация повседневных задач вроде заказа еды — наше недалекое будущее, которое становится все ближе благодаря компаниям Google, Amazon и Baidu, активно инвестирующим в machine learning и искусственный интеллект.
Телефон — основной канал продаж
Несмотря на развитие технологий, телефон все еще остается самым востребованным каналом связи, и в определенных случаях он может генерировать до 80% выручки.
Интернет-магазин и сайт компании можно рассматривать как витрину: если речь идет про сервис или сложный продукт, люди все равно звонят, спрашивают и уточняют интересующие их моменты. Им нужно получать ответы на общие и специфические вопросы, прежде чем они будут готовы расстаться со своими деньгами.
Параллельно есть статистика, подтверждающая, что большинство людей хочет, чтобы их обслужили быстро: 77% покупателей готовы ждать ответа оператора не более 25 секунд. В идеале клиенты хотят, чтобы им ответил живой человек в течение 10-15 секунд и решил их вопрос.
Колл-центр — недешевое удовольствие
Большой штат сотрудников требует от бизнеса ощутимых затрат. Когда приходит время оптимизации расходов, компании начинают экономить прежде всего на обслуживающем персонале: секретари, сотрудники колл-центов, линейные менеджеры.
Этот «достаточно хороший» способ экономии приводит к тому, что клиентам приходится ждать ответа оператора в лучшем случае несколько минут. Для бизнеса подобное ожидание чаще всего заканчивается потерей клиента.
Пришла пора автоматизации
Автоматизация работы колл-центра — тренд, который появился давно. Прежде всего, Сотрудники КЦ занимаются обслуживанием клиентов, когда те хотят что-то купить: нужно ответить на базовые вопросы, помочь оформить заказ, проверить введенную информацию. Плюс существует часть вопросов, связанная с поддержкой: про доставку, про оплату, про то, что что-то пошло не так. Все как и везде, есть два основных блока: продажи и поддержка. И одно без другого не существует.
Шаг первый — интеграция с CRM
В современном мире человек привязан к номеру телефона: мы все пользуемся мессенджерами, социальными сетями, по номеру телефона нас идентифицируют в приложениях, на сайтах и, например, на портале Госуслуг, к телефону также привязываются карты лояльности. Мы перестаем пользоваться городскими номерами — если я звоню с телефона, то с высокой долей вероятности я буду звонить со своего мобильного номера.
Если я что-то заказывал в интернет-магазине, то, скорее всего, я уже есть у вас в CRM, и вы можете посмотреть историю моих заказов и общения со мной. Если я новый клиент, создается и заполняется новая карточка в системе работы с клиентами и заполняется карточка. Эту работу можно назвать первым шагом в процессе автоматизации.
Шаг второй — «умный» IVR
«Умный» IVR умеет общаться с клиентами без участия человека, используя синтез речи или записанные фразы. Если клиент что-то купил или заказал, его заказ появляется в CRM. При входящем звонке поднимается карточка клиента, делается предположение, что, вероятнее всего, у звонящего есть вопрос про доставку этого товара.
Клиента можно спросить «да» или «нет»; если «да», можно проинформировать, что доставка будет послезавтра, в 5 часов вечера. Если это была вся информация, которую хотел уточнить клиент, он положит трубку; если же ему хочется задать вопрос, всегда можно попросить перевести на живого человека, чтобы, например, отменить или скорректировать заказ.
Шаг третий — ML/ИИ/NLP
Тренд, который сейчас набирает обороты, — это возможность «общаться» с клиентом не просто по заданным шаблонам и меню, а разговаривать «свободно», на естественном языке, но в автоматическом режиме. Мы формируем запросы миллионом разных способов, и IVR должен быть к этому готов. «Подготовить» робота можно, используя новые технологии, такие как machine learning, искусственный интеллект и NLP.
Пришла пора роботизации
«Типовых» задач существует множество, каждый бизнес может проанализировать работу своего колл-центра, прослушать диалоги и выделить базу, которую можно автоматизировать, загрузив робота. Естественно, что-то останется на людях: специфика бизнеса, сложные запросы, особые клиенты, которых не понимает распознавание, — всегда есть возможность переключиться на человека, используя его время эффективно.
Благодаря современным технологиям автоматизации любая компания может существенно уменьшить издержки на обучение, зарплату, отпуска и больничные — робот обучается один раз, он не уволится и не уйдет в другую компанию, его всегда можно дообучать. Робот будет работать до тех пор, пока компания платит за его ресурсы: среди них синтез, распознавание, вычислительные ресурсы.
Понимая запросы рынка, ИТ-корпорации объединяют наиболее востребованные технологии в единый стек, который позволяет довести IVR до уровня, когда вы будете с трудом отличать его от живого человека.
Первая часть этого стека — это синтез речи с новыми технологиями типа WaveNet от Google, который звучит как живой человек. Нужно очень постараться, чтобы понять, что с вами говорит робот. Есть и интонации, и паузы, встречаются моменты, связанные с дыханием, — технология «натренирована» на разговорах живых людей.
И это совершенно другой подход: раньше был вокодер, который аналогично тренировали, обучали, записывали фразы, но логика его работы была другой, и он звучал как «железная женщина».
В пример можно привести недавнюю демонстрацию с Google I/O, на которой робот звонил в парикмахерскую, чтобы записаться на стрижку: человек в парикмахерской не понимал, что с ним говорит робот. Грань между «железом» и живым оператором размывается, узнать о том, что вы разговариваете с роботом, можно, только если сценарий пойдет по непредсказуемой ветке, что бывает редко.
Вторая часть — распознавание речи, которое также не первый год переживает активное развитие и подъем, постоянно совершенствуется. Раньше мы могли только мечтать, чтобы понимать какие-то отдельные команды, например, «да», «нет», «хочу», «не хочу», «дайте мне это». Сейчас есть возможность распознавать обычную человеческую речь.
Процент ошибок пока что высок, но со временем он будет понижаться, и в какой-то момент автоматическое распознавание речи будет не сильно отличаться от того уровня, который мы можем слышать как люди, понимать и осознавать. В каких-то случаях распознавание, возможно, даже будет превышать наши ожидания.
И третья часть стека — понимание «живой» человеческой речи, выделение смысла запроса и обучение на примерах. В пример можно привести «Яндекс.Навигатор», который понимает адреса, в произношении которых мы сами не всегда уверены.
Водители из разных стран СНГ возят нас, у каждого водителя есть свой акцент. Иногда они специфично произносят адрес, и мы думаем, что навигатор распознает его неправильно. Но нет, распознавание происходит корректно — это и есть машинное обучение, благодаря которому система уже может понять то, что обычный человек воспринимает с трудом.
Сейчас мы не можем быть уверены на 100% в том, что в разговоре не понадобится живой оператор. Но мы точно уверены в том, что есть «простые» задачи, например, заказ пиццы, где все достаточно стандартизировано — на эту «первую линию» мы как раз можем поставить робота, оставив нестандартные ситуации для операторов.
О Google Dialogflow
Google Dialogflow – это сервис, который возник в результате поглощения компанией Google API.ai, которые делали изначально Speaktoit; когда Google начал заниматься своим ассистентом, компания решила, что эта технология ей близка и интересна. В итоге Google купила API.ai, сделав на её основе Dialogflow. Отмечу, что API.ai — компания с русскими корнями.
Смысл Dialogflow в том, чтобы нести в массы машинное обучение и дать обычным людям возможность тренировать «машину», которая понимает естественную речь, выделяет из нее интенты, может делать так называемый slot filling (это когда мы называем несколько параметров, машина их классифицирует и может запросить недостающую информацию), к которому сводится значительная часть общения. Мы говорим роботу информацию, он получает данные, систематизирует и отвечает на их основе.
Сейчас Dialogflow поддерживает 18 языков, плюс есть возможности по интеграции с внешними сервисами через API, используя которые можно добиться нужного вам результата по автоматизации.
Встроенный machine learning легко обучается на имеющихся примерах: можно выгрузить записи разговоров из колл-центра, проанализировать, загрузить в робота тексты, разметить — через какое-то время, обучившись, робот начнет понимать запросы, которые ему уже показали. Это и есть специальная «магия», в результате которой робот понимает не только прямые запросы, но и аналогичные.
Например, если я загружу запросы «Хочу авиабилеты из Москвы в Питер на послезавтра, в 5 часов вечера» и «Я хочу из Сан-Франциско в Лондон 30 июня, утром» и размечу их, а потом спрошу про другие города и другие даты, робот уже корректно обработает этот запрос и выдаст результаты, поняв о чем идет речь.
Голосовой бот для пиццерии
Самый простой способ продемонстрировать, как может выглядеть интеллектуальный IVR – показать пример из реальной жизни. Протестировать бота можно, перейдя по ссылке: введите свой номер телефона в международном формате, нажмите кнопку «Далее», с указанного номера наберите +74999384952 — это позволит смотреть, как бот в режиме реального времени формирует конкретно ваш заказ.
https://demos05.voximplant.com/pizza/
Мой разговор с роботом длится чуть менее 1,5 минут. Себестоимость обработки сделанного заказа менее 4 рублей при текущем курсе доллара. Цена складывается из времени, которое потребляют перечисленные технологии. Минута разговора с оператором колл-центра при аутсорсе в среднем стоит в районе 9-10 рублей. Выгоду каждый может посчитать сам, опираясь на свой бизнес.
Это реальный бот, на номер которого можно позвонить и пообщаться. Я заранее мог бы бы сказать ему адрес, время и собрать заказ по-другому, но благодаря «заполнению слотов» робот все равно бы «понял» мой заказ, корректно заполнив карточку заказа.
Коллеги из индустрии комментируют, что «нормальный продавец предложил бы напитки и соусы, сделав дополнительную продажу». Все это тоже можно реализовать: это всего лишь дополнительные данные, которые можно добавить к карточке заказа. Не получив данные, в конце разговора робот легко сможет уточнить про напитки, соусы, экспресс-доставку за отдельную плату и количество приборов.
Хозяйке на заметку
Одного Dialogflow недостаточно для создания телефонного бота, нужна специальная связка с телефонией, для которой я использовал Voximplant и его новую функцию Dialogflow Connector, позволяющую подключить любой звонок к Dialogflow-агенту максимально быстро и просто.
В примере использовался синтез от «Яндекса», а не WaveNet, так как в последнем поддерживается только английский язык. В течение года Google обещает подключить к Dialogflow другие языки WaveNet-синтеза — я думаю, что этот же пример на другой технологии в конце года будет звучать по-другому и нам будет действительно сложно отличить робота от человека.