personalization · AI-лидерство

А как проверить гипотезу без модели?

Как без сбора данных, обучения модели, проверить гипотезу на реальных клиентах?

Какие есть способы проверки гипотезы на реальных клиентах?

Пример сырых данных
Дата По умолчанию Изменил? Новая сумма Открыл на
12.02100 000 ₽Нет100 000 ₽
03.03100 000 ₽Да300 000 ₽300 000 ₽
17.0450 000 ₽Нет50 000 ₽
29.05100 000 ₽Да500 000 ₽500 000 ₽
11.07250 000 ₽Да150 000 ₽150 000 ₽
22.09100 000 ₽Да1 000 000 ₽1 000 000 ₽
14.1150 000 ₽Нет50 000 ₽
Распределение открытых вкладов
Открытия
50 тыс. 100 тыс. 500 тыс. 1 млн. 5 млн.
Ищем, какие суммы показывались клиентам, как они их меняли и где сосредоточен основной объём открытий.
Исторические данные
Разбивка на бакеты
Кандидаты для пилота
Бакеты сумм
Бакет Доля Средний чек Потенциал
50–100 тыс.34%78 000 ₽высокий
100–200 тыс.21%146 000 ₽высокий
200–300 тыс.12%248 000 ₽средний
300–500 тыс.11%382 000 ₽средний
500 тыс.–1 млн.13%710 000 ₽высокий
1–3 млн.7%1 640 000 ₽точечный
3–5 млн.2%3 480 000 ₽точечный
Быстрый аналитический скрипт
df['bucket'] = pd.cut(df['opened_sum'], buckets)
summary = df.groupby('bucket').agg({
    'opened_sum': ['count', 'mean'],
    'default_sum': 'mean'
})
pilot_candidates = [50000, 75000, 100000,
                    150000, 200000, 300000,
                    500000, 750000, 1000000]
Суммы, которые можно взять в пилот
50 000 ₽ 75 000 ₽ 100 000 ₽ 150 000 ₽ 200 000 ₽ 300 000 ₽ 500 000 ₽ 750 000 ₽ 1 000 000 ₽
Это пилот, а не раскатка на весь поток
100% общего потока клиентов 10% идут в пилот
Контроль
50 тыс.
Группа 2
75 тыс.
Группа 3
100 тыс.
Группа 4
150 тыс.
Группа 5
200 тыс.
Группа 6
300 тыс.
Группа 7
500 тыс.
Группа 8
750 тыс.
Группа 9
1 млн.
Пилот нужно описать до запуска
Иначе после теста легко начать менять гипотезу, метрики и способ расчёта под уже полученный результат.
Гипотеза

Если показывать персональную сумму по умолчанию, средняя сумма открытого вклада вырастет без критического роста обращений клиентов.

Группы

Контроль: стандартная сумма 50 тыс. Тест: 8 групп с альтернативными суммами из заранее выбранного набора.

Даты проведения

Например: 14 дней теста + заранее определённое окно наблюдения до подведения итогов.

Метрики

Средняя сумма вклада, конверсия в открытие, процентный доход, обращения со стороны клиентов.

Как считаем заранее

Фиксируем основную метрику, вторичные метрики и правило сравнения контрольной и тестовой групп до старта пилота.

Статистический критерий

Заранее выбираем метод сравнения групп и порог значимости, например p-value < 0.05.

Что такое p-value?

Это вероятность увидеть такой результат случайно, если на самом деле эффекта нет. Если p-value ниже заранее выбранного порога, сигнал заслуживает внимания.

Как будем подводить итоги
  • сравниваем контроль и тест;
  • считаем средние значения и конверсию;
  • проверяем статистическую значимость;
  • смотрим побочные эффекты;
  • решаем: масштабировать, доработать или закрыть пилот.
До пилота и во время пилота
Открытия
До пилота Во время пилота
50 тыс. 100 тыс. 300 тыс. 500 тыс. 1 млн.
Что важно

Во время пилота кривая начинает смещаться: часть клиентов открывает вклады на более высокие суммы, но не все тестовые группы дают положительный результат.

Сравнение тестовых групп с контролем 50 тыс.
Группа Средняя сумма Конверсия Доход Обращения
75 тыс. +6.2% -1.1% +3.4% +2.0%
100 тыс. +9.8% +1.6% +7.1% +0.8%
150 тыс. +12.4% +0.4% +8.9% +1.3%
200 тыс. +10.1% -0.7% +5.2% +2.4%
300 тыс. +14.7% -2.5% +4.1% +3.6%
500 тыс. +18.2% -4.4% -1.2% +5.1%
750 тыс. +11.0% -6.2% -3.5% +6.4%
1 млн. +8.6% -8.1% -5.7% +7.8%
Не все тестовые группы дают положительный эффект. Задача пилота — найти диапазоны, которые реально работают лучше контроля.
✓ Гипотеза подтверждается

Пилот показал, что изменение суммы по умолчанию влияет на поведение клиентов

Это означает, что следующий шаг — не просто продолжать перебирать произвольные диапазоны, а строить модель, которая будет выбирать более подходящую сумму для конкретного клиента.

Пилот
Подтверждение эффекта
Построение модели
Что даст модель
  • учитывать поведение клиента;
  • учитывать профиль и контекст;
  • выбирать не диапазон «на глаз», а оптимальную сумму;
  • максимизировать доход, сумму вклада и конверсию.
Потенциальный эффект
+7–12% к средней сумме вклада
+4–8% к доходу в пилотной группе
1.2–1.8× точнее выбор суммы после модели
И как же сделать модель?

Выводы

Начните без модели

Даже без готовой модели гипотезу можно проверить на реальных клиентах — через упрощённый пилот и управляемый эксперимент.

Ключевая идея

Не пытаться сразу сделать идеальную персонализацию, а проверить, влияет ли сама логика изменения суммы по умолчанию на поведение клиентов.

После пилота модель

Если упрощённый пилот показывает сигнал, тогда уже имеет смысл вкладываться в данные, модель и полноценное внедрение.