churn-prediction-from-call-transcripts

Нейросеть, обученная на расшифровках звонков телеком-оператора, научилась отличать клиента, который скоро уйдёт, от того, кто останется. Без данных о платежах, тарифах и истории обращений — только по тексту одного разговора. Точность — около 80%.

Это результат исследования Zhong и Li (2019), представленного на Международной конференции по инновациям в искусственном интеллекте. Звучит как лабораторный курьёз, но за ним стоит фундаментальная идея, которая меняет подход к удержанию клиентов: текст разговора содержит больше информации о намерениях клиента, чем привычные метрики CRM.

Что именно «видит» модель в тексте

Zhong и Li обучили свёрточную нейросеть на реальных транскриптах звонков в службу поддержки телекоммуникационной компании. Модель получала на вход только текст — последовательность слов, которые произнёс клиент, и последовательность слов, которые произнёс оператор. Никаких метаданных: ни срока договора, ни суммы последнего платежа, ни количества предыдущих обращений.

Результат — точность предсказания 78,95–80,18%, что на 2,9 процентных пункта выше базовых моделей, построенных на структурированных данных. Один разговор оказался достаточным для классификации: уйдёт клиент или нет.

Почему текст работает? Потому что человек, принявший решение об уходе, разговаривает иначе. Классическая лингвистика давно описывает маркеры неудовлетворённости: снижение вариативности лексики, односложные ответы, рост негативных конструкций, отсутствие встречных вопросов. Клиент, который готов уйти, отвечает короче, суше, без деталей. Он не жалуется развёрнуто — он отвечает формально, как человек, которому уже всё равно.

Исследование из Сиднейского технологического университета подтверждает эту логику на массиве из почти двух миллионов звонков. Авторы использовали методологию LIWC (словарь из 6 400 терминов, разработанный психолингвистом Джеймсом Пеннебейкером) для извлечения лингвистических признаков из расшифровок. Семь из десяти наиболее значимых предикторов оттока оказались текстовыми — не финансовыми, не поведенческими, а именно лингвистическими.

Почему CRM не ловит ранние сигналы

Типичная модель оттока в компании строится на структурированных данных: сумма на счёте, частота покупок, количество обращений в поддержку, результаты NPS-опросов. Эти данные полезны, но у них есть системное ограничение — они фиксируют то, что уже произошло.

Клиент снизил объём закупок — это видно в CRM. Клиент перестал открывать рассылки — это видно в email-аналитике. Клиент поставил 4 балла вместо 5 в NPS — это видно в отчёте. Но всё это — следствия, а не причины. К моменту, когда эти метрики меняются, решение об уходе, как правило, уже принято.

Текст разговора фиксирует более ранний момент — тот, когда клиент ещё формулирует своё отношение. Он ещё не ушёл, не снизил частоту покупок, не написал жалобу. Но в его речи уже произошли изменения: ответы стали короче, формулировки — размытее, вопросов стало меньше.

Исследователи из Сиднейского технологического университета в своей работе подчёркивают масштаб этого разрыва: структурированные данные составляют примерно 20% доступной информации о клиенте. Остальные 80% — неструктурированная информация: звонки, письма, сообщения, обращения в чат. Большинство моделей оттока работают с меньшей частью данных, игнорируя большую.

Это не значит, что CRM-данные бесполезны. Это значит, что модель, которая учитывает только их, видит лишь часть картины. Текстовые сигналы не заменяют метрики CRM — они дополняют их, причём в самом ценном месте: на раннем этапе, когда с оттоком ещё можно работать.

Как устроена комбинация сигналов

Отдельный текстовый маркер — слабый предиктор. Клиент может ответить односложно, потому что занят. Может использовать негативную конструкцию, потому что описывает проблему, которую хочет решить. Один сигнал сам по себе мало что значит.

Сила текстовой аналитики — в комбинации. По данным экспертного опроса G2 (2026), самые точные модели оттока работают не с одним сигналом, а с набором: падение вовлечённости в продукт, негативная тональность в переписках и звонках, снижение частоты контактов. Каждый из этих сигналов по отдельности — шум. Вместе — паттерн.

Платформа Velaris, по данным того же опроса G2, фиксирует снижение оттока на 15% и ускорение реакции на треть за счёт анализа текстовых сигналов в переписке и звонках. ChurnZero анализирует тональность и динамику диалогов в письмах, тикетах и на встречах, чтобы ловить риск до того, как клиент попросит закрыть договор.

Механизм здесь не сложный. Один разговор с коротким ответом — норма. Три разговора подряд, в которых клиент отвечает односложно, не задаёт вопросов и использует формальные конструкции — сигнал. Если к этому добавляется снижение активности в продукте и отсутствие реакции на письма, вероятность оттока резко вырастает.

В академическом контексте это подтверждено работой, опубликованной в Springer (CICLing 2017): добавление текстового анализа к классическим моделям оттока значимо повышает точность предсказания. Текст — не альтернатива структурированным данным, а дополнение, которое превращает модель из ретроспективной в предиктивную.

Какие текстовые признаки имеют значение

Интуитивно кажется, что главный признак — негативные слова. Клиент жалуется — значит, он недоволен и скоро уйдёт. На практике всё устроено тоньше.

Исследователи из Сиднейского технологического университета в анализе почти двух миллионов звонков обнаружили, что лингвистические признаки, извлечённые с помощью LIWC и TF-IDF, оказались более значимыми предикторами, чем финансовые и демографические переменные. При этом самые сильные признаки — не прямые жалобы, а структурные характеристики речи: частотность определённых слов, используемые категории лексики, соотношение разных типов конструкций.

Клиенты с высоким риском оттока в этом исследовании чаще использовали слова, связанные с деньгами и закрытием счёта. Они реже задавали уточняющие вопросы. Их речь отличалась более низкими показателями «добросовестности» и «согласия» по шкалам LIWC — то есть содержала меньше конструкций, характерных для заинтересованного, вовлечённого собеседника.

Для бизнеса это означает конкретную вещь: признаки оттока в тексте — не эмоциональные всплески, а постепенные сдвиги в речевом поведении. Клиент не кричит и не жалуется. Он просто говорит иначе — и эту разницу можно зафиксировать системно.

AWS Machine Learning Blog описывает аналогичный подход на примере Amazon SageMaker: модель, комбинирующая текстовые данные из транскриптов с профилями клиентов через трансформеры, предсказывает отток точнее, чем модели, работающие только со структурированными данными. Текст добавляет измерение, которого нет в таблицах CRM.

Как это работает на практике

Когда мы в imot.io размечаем звонки и переписки, мы видим похожие закономерности по тексту диалогов. В одних разговорах клиент задаёт уточняющие вопросы, использует развёрнутые формулировки, обсуждает детали и варианты. В других — односложно отвечает на вопросы оператора и не инициирует ни одной темы.

Эту разницу можно зафиксировать через теги и правила. Наличие или отсутствие определённых фраз, длина реплик клиента, частота негативных конструкций, появление маркеров завершения контакта («ладно», «хорошо, спасибо», «я понял»), отсутствие встречных вопросов — всё это размечается по тексту, без анализа голоса. Модель не угадывает настроение по интонации — она считывает структуру диалога по тексту.

Ценность такой разметки — в масштабе. Менеджер может интуитивно заметить, что конкретный клиент стал «холоднее» в последнем разговоре. Но когда звонков сотни и тысячи, интуиция не масштабируется. Текстовая аналитика позволяет увидеть паттерн на всём массиве: какой процент клиентов демонстрирует признаки снижения вовлечённости, в каких сегментах это происходит чаще, как меняется картина из месяца в месяц.

Мы не строим предиктивную модель оттока в классическом смысле — для этого нужны данные о поведении клиента за пределами разговора. Мы делаем другое: подсвечиваем текстовые сигналы, которые должны попасть в такую модель. Разговор фиксирует то, что не попадает ни в CRM, ни в NPS-опрос: реальные формулировки, которыми клиент описывает свою ситуацию. И если эти формулировки меняются — это данные, с которыми можно работать до того, как клиент уйдёт.

Почему текстовая аналитика — это инструмент удержания, а не контроля

Традиционно анализ звонков ассоциируется с контролем качества: соблюдение скрипта, выполнение чек-листа, оценка работы оператора. Это нужная функция, но она направлена внутрь компании. Вопрос «правильно ли работает сотрудник» важен, однако он не отвечает на другой вопрос — «что происходит с клиентом».

Анализ текстовых сигналов разворачивает оптику на клиента. Вместо «сказал ли менеджер обязательную фразу» — «как ведёт себя клиент в разговоре и что это означает для его лояльности». Это принципиально другая задача.

Отток в среднем B2B SaaS-сегменте обходится дорого: привлечение нового клиента стоит в 5–7 раз дороже, чем удержание существующего. Телеком-индустрия, на данных которой проводилось исследование Zhong и Li, теряет более 30% абонентов ежегодно — самый высокий показатель среди крупных отраслей. Если текстовая аналитика позволяет обнаружить 80% потенциальных уходов до того, как они произойдут, экономический эффект очевиден.

Здесь стоит оговориться: точность 80% не означает, что система ловит каждого уходящего клиента. Это значит, что из 100 клиентов, отмеченных как группа риска, примерно 80 действительно уйдут. С оставшимися 20 можно поработать на удержание — и часть из них останется. Без сигнала все 100 уйдут незамеченными.

Итоги

Текст одного разговора содержит достаточно информации для предсказания оттока с точностью около 80%. Это подтверждено на реальных данных телеком-оператора в рецензируемом исследовании Zhong и Li (2019).
Главные предикторы оттока в тексте — не эмоциональные всплески, а структурные сдвиги: снижение вариативности лексики, сокращение длины реплик, рост формальных конструкций, отсутствие встречных вопросов.
Текстовые признаки дополняют, а не заменяют CRM-данные. Комбинация обоих типов данных даёт более точные модели оттока, чем каждый тип по отдельности.
Сигналы оттока появляются раньше, чем они становятся видны в метриках CRM. Текст фиксирует изменение отношения клиента до того, как оно выражается в снижении активности или отказе от подписки.
Для работы с текстовыми сигналами не обязательна сложная предиктивная модель. Достаточно системной разметки разговоров по тегам и правилам, которая позволяет выделять клиентов с характерными речевыми паттернами.

Если вы хотите посмотреть, как текстовые сигналы оттока выглядят на ваших звонках — мы можем разобрать выборку на аудите и показать, какие разговоры содержат ранние маркеры ухода.

Оставить заявку на аудит »

Источники

Zhong E., Li B. (2019). Predicting Customer Churn in the Telecommunication Industry by Analyzing Phone Call Transcripts with Convolutional Neural Networks. Proceedings of the 3rd International Conference on Innovation in Artificial Intelligence (ICIAI) — точность предсказания оттока по транскриптам 78,95–80,18%.

G2 Expert Survey (2026). AI in Churn Reduction: What G2’s 2026 Expert Survey Found — Velaris: ~15% снижение оттока, 33% ускорение реакции. ChurnZero: анализ тональности и динамики в переписках и звонках.

Springer / CICLing (2017). Customer Churn Prediction Using Sentiment Analysis and Text Classification of VOC — добавление текстового анализа к классическим моделям оттока значимо повышает точность предсказания.

AWS Machine Learning Blog. Analyze customer churn probability using call transcription and customer profiles with Amazon SageMaker — комбинирование текстовых данных из транскриптов с профилями клиентов улучшает предсказание оттока.

University of Technology Sydney. Leveraging Unstructured Call Log Data for Customer Churn Prediction — анализ ~2 млн звонков, 7 из 10 наиболее значимых предикторов оттока — текстовые признаки LIWC и TF-IDF.

MDPI / Machine Learning and Knowledge Extraction (2025). Customer Churn Prediction: A Systematic Review of Recent Advances — систематический обзор 240 рецензируемых исследований по предсказанию оттока (2020–2024), отраслевая статистика оттока.

Можно ли предсказать отток клиента по одному разговору — и что для этого нужно