Цель данной работы - разработка системы классификации обращений абонентов в колл-центр группы компаний "Орион Телеком".
Разработка системы проводилась на языке программирования Python. Для создания классификатора использовался пакет инструментов машинного обучения scikit-learn. Для распознавания речи абонентов был применён сервис по распознавания речи на русском языке Yandex SpeechKit.
Классификация обращений абонентов - актуальная проблема современного клиенто-ориентированного бизнеса, в частности телекоммуникационных компаний, в которых взаимодействие клиента и оператора осуществляется максимально оперативно посредством телефонного разговора. Для своевременного принятия управленческих решений, бизнесу требуется оперативная и точная статистика существующих проблем и поступающих обращений, чего человеческие ресурсы колл-кентра самостоятельно предоставить не в состоянии. Применение автоматических систем распознавания речи и классификации текстов решает данную проблему и позволяет бизнесу упростить процесс сбора данных и сосредоточиться на анализе и принятии решений.
Результатом данной работы является набор приложений предназначенных для распознавания текста в аудиофайлах обращений абонентов, классификации данных обращений по классам и подклассам, а также записи результатов распознавания и классификации в корпоративную базу данных. Итоговая система была внедрена в внутреннюю инфраструктуру компании ООО «Орион Телеком».