WebimAutomation

О проекте

Программная платформа для создания чат-ботов c искусственным интеллектом (ИИ) на основе нейронных сетей и их интеграции в контакт-центры. Клиентам нужно интегрированное средство для сборки чат-ботов под конкретные задачи акселерации продаж (новые клиенты) и сопровождения (старые). Наш проект сочетает опыт веб-чата Webim.Ru и новые возможности ИИ, ML. Заказчики сократят расходы на контакт-центры и оптимизируют загрузку персонала. Есть спецификации, прототип, команда профессионалов из Webim.

Image
WPPB Image Addons

Решаемые проблемы

1) Заказчики контакт-центров требуют оптимизации процессов и сокращения издержек. Наибольшие расходы = фонд оплаты труда операторов. Значительную часть времени операторы заняты рутинными вопросами.
2) Крупные банки и компании, на которые мы ориентируемся, охватывают значительную территорию с несколькими часовыми поясами. Создать отдельный контакт-центр с операторами в каждом регионе или нанять сотрудников, готовых работать по ночам, слишком затратно.
3) Всех раздражает долгое ожидание ответа оператора при в колл-центрах и веб-чате.
Самое простое решение проблемы (нанять много операторов) является наиболее дорогостоящим.
Более того, новые сотрудники должны пройти обучение. Не все из них смогут усвоить 100% знаний. Нельзя клонировать живого спеца из тех. поддержки. Но можно научить машину на базе его диалогов и затем “клонировать” эту модель.
Проблема более эффективного использования времени и денег во всех описанных выше случаях явно может быть решена путём автоматизации выдачи ответов на повторяющиеся простые вопросы. Однако пользователи рассчитывают на общение на естественном языке, а не через меню или команды. Поэтому мы пришли к идее виртуальных операторов-роботов.
“Мозг” роботов, представленных сегодня на рынке, запрограммирован алгоритмическим путём, через правила/шаблоны. Техническая сложность заключается в том, что клиент может запросить одну и ту же информацию десятками разных способов, и использование шаблонов даёт невысокие результаты при высокой стоимости решения (явным примером является решение Наносемантики).
В нашем случае используются технологии дистрибутивной семантики. В основе системы лежит технология ИНС, которая позволяет формировать специализированное семантическое пространство на основании транскриптов диалогов.
Каждая новая фраза клиента трансформируется в векторную форму и соотносится с векторами из семантического пространства. Таким образом машина определяет смысл вопроса. Проведенные эксперименты показали высокую эффективность данного подхода, целевые цифры автоматизации составляют 50%.
При получении вопроса сеть пытается сформировать на основе своих знаний ответ и коэффициент уверенности - насколько система уверена в релевантности ответа. При превышении порогового значения система отвечает клиенту сама. Иначе она передаёт управление оператору-человеку.
Подготовка исходных данных для обучения сети упрощена и автоматизирована. Найден компромисс между алгоритмическим программированием и машинным обучением. Система будет поставляться с подготовленными корпусами текстов, дающими хорошие результаты и требующими мин. адаптации. Все сложности машинного обучения и анализа текста предоставляются в виде готового решения.
С точки зрения Webim боты являются виртуальными операторами. На них распределяются диалоги по правилам, как для операторов-людей.

Image
WPPB Image Addons

Преимущества нашего решения

Наша команда на протяжении 10+ лет разрабатывает и успешно продаёт сервис Webim - чат в мобильных приложениях и на веб-сайтах. Webim обладает передовыми функциями (кобраузинг, телепорт, автоназначение), высоконадёжен, отлажен и стабилен (доступность >99.9%), приложения для всех платформ (iOS, Android, Windows, Mac, web).
Мало кто лучше нас разбирается в потребностях крупных и средних заказчиков систем для чата и обладает бОльшим объёмом накопленных переговоров между операторами и клиентами. Анализируя этот корпус, мы в состоянии выносить обоснованные выводы о том, как можно роботизировать общение с клиентом в предметных отраслях:
* Телекомы, сотовые операторы
* Банки
* Страховые компании
* Крупные государственные компании
Проект обладает хорошими перспективами продаж: некоторые крупные клиенты Webim продемонстрировали заинтересованность во внедрении операторов-роботов на основе нейросетей. Среди этих клиентов Тинькофф-Банк, HomeCredit Bank, Райффайзен-Банк, МДМ-Банк, Беларусбанк.

Инновационные решения

Наше решение встраивается в сервис Webim и расширяет его возможности, добавляя функциональность создания виртуальных операторов-роботов. Организации-клиенты, уже использующие в своих контакт-центрах сервис Webim, продолжат работу в привычной среде. После внедрения и пуско-наладочных работ потребуется минимальное обучение сотрудников предприятия,
особенно рядовых операторов.
Решение будет функционировать двумя различными способами, имеющими общий научно-исследовательский аппарат, но принципиально разный пользовательский интерфейс:
* Решение 1: на “первой линии” обслуживания находится оператор-человек, а система предлагает ему свои ответы в качестве подсказок, которыми он может воспользоваться, но может и отклонить.
* Решение 2: виртуальный оператор-робот находится на “первой линии” и автономно общается с клиентом, а система полностью управляет распределением вызовов на таких операторов (для этого средствами платформы создаётся пул виртуальных операторов определённого типа).

Процесс добавления нового типа виртуальных операторов-роботов состоит из следующих шагов:
1. Администратор организации-клиента готовит первичный материал для обучения искусственной нейронной сети (ИНС). Для этого администратор извлекает из накопленной базы переговоров операторов тексты тех диалогов и тех операторов, которые признаны успешными в плане решения той проблемы, по решению которой планируется “натаскать” робота. Эта задача упрощается поставляемыми с нашей системой готовыми корпусами текстов, по которым гарантируется хорошее обучение ИНС.
2. Экспортированный текстовый материал очищается экспертом и специальными утилитами от “мусора” и неудачных реплик, а также превращается в набор пар (context/response, c/r), каждая из которых маркирована по релевантности (1 если ответ действительно подходит контексту, 0 если не подходит). На выходе - файл текстового формата CSV.
3. Препроцессинг: текст парсится и готовится для обработки по существу, слова заменяются на ID из словаря, на выходе формат Example TFRecords.
4. В удобном административном интерфейсе нашей платформы создаётся новый тип виртуального оператора. Выбирается наименование, условия переадресации вызовов, параметры работы пула, тип модели, тип и параметры ИНС, параметры обучения и валидации, заливается материал с шагов 2-3.
5. Далее начинается моделирование желаемого поведения робота. Наша платформа сочетает алгоритмический способ формирования бота на основе специального языка разметки и машинное обучение ИНС. Для быстрого старта, платформа комплектуется заготовками готовых ботов, одного из которых можно “клонировать” и начать “допиливать” под нужды заказчика.
6. Сначала пишутся самые простые сценарии диалогов с помощью специализированного языка разметки - например, приветствия, самые шаблонные ответы и проч., не требующие обучения.
7. Затем в платформу импортируется подготовленный на шагах 1-3 исходный массив текстов.
8. Импортированные тексты процессятся с помощью Statistics-Based-методик лексико-семантического анализа.
9. Далее к боту привязывается модель ИНС с заданными ранее типом, конфигурацией и параметрами. Например, Retrieval-Based-модель, сеть Dual Encoder LSTM, обучаемая методом Deep Learning с выбранными метриками (например, Recall@k). Платформа поставляется с готовыми моделями ИНС, особенности архитектур сетей скрыты от заказчика и разбираться ему в них не нужно.
10. Обучение и периодическая валидация сети проводятся до тех пор, пока значения по выбранным метрикам не достигнут выбранных пороговых значений.
11. Далее построенная модель/сеть тестируется (evaluation) сначала в автоматическом режиме (путём подачи на вход ранее заготовленного набора данных, для которых уже известна релевантность ответов) с вычислением значений метрик, а, когда желаемые уровни метрик достигнуты, то и живым человеком-экспертом (администратором) в ручном режиме. Обучение и подбор параметров модели/сети продолжаются до тех пор, пока созданный робот не будет готов для практического применения.
12. Виртуальный оператор подключается к реальному контакт-центру методом 1 (в виде подсказок живым операторам). Собирается статистика удачных/неудачных ответов, допиливается модель.
13 Когда процент удачных ответов превышает пороговое значение (обычно 50-85%), робота можно выпускать на “первую линию” (метод работы №2).

Инновационность подхода заключается в интеграции аппарата искусственного интеллекта виртуальных операторов в платформу контакт-центра и чата, на данный момент ни один из существующих продуктов на рынке не предлагает такого интегрированного решения. В них либо реализован механизм машинного обучения, но как система массового обслуживания система слаба, либо наоборот - примитивный алгоритмический бот-конструктор добавлен в традиционную платформу для операторов. Кроме того, гибридный механизм программирования ботов сочетает преимущества двух подходов: алгоритмического (путём написания категорий-сценариев на специализированном языке разметки ботов) и нейросетевого (через обучение ИНС на корпусе готовых стенограмм диалогов между операторами и клиентами).
Первый подход позволяет быстро научить бота четко отвечать на простые вопросы, второй подход позволяет справляться с более сложными вопросами, учитывать синонимию, контекст, query intents и быть устойчивым к мелким ошибкам в запросах. Векторизация исходных запросов в выбранном срезе многомерного семантического пространства позволяет найти релевантные знания в “памяти” бота, даже если запрос выражен другими словами, чем в тексте при тренинге ИНС. Использование нейросетей не только для анализа запроса, но и для последовательной генерации ответа с учётом контекста создают у пользователя полную иллюзию общения с живым человеком.
Пользователи (клиенты) получат прямой human readable (на естественном языке) доступ к знаниям лучших экспертов без участия человека.