personalization · AI-лидерство

Как сделать модель?

Переход от пилота к промышленной модели персонального выбора параметра для клиента. Покажем как делать модель на учебном примере со стоимостью недвижимости в Австралии. Задача аналогичная, предсказать стоимость объекта!

Перенесемся в Австралию

Возьмем популярный датасет для обучения машинному обучению (Data Science), который часто встречается на платформе Kaggle. Он идеально подходит для тренировки алгоритмов предсказания цен.

Что там за объекты?
В файле собраны данные о продаже недвижимости в Мельбурне, Австралия. Обычно он содержит около 13 580 записей.
Основные параметры (колонки):
Тип жилья: дома (h), таунхаусы (t) и квартиры (u).
География: адрес, район (Suburb) и расстояние до центра города (Distance).
Характеристики: количество комнат, ванных, парковочных мест, площадь земли и площадь здания.
Цена: итоговая стоимость продажи.

Что в нем интересного?
«Грязные» данные: В оригинальном файле много пропусков (например, год постройки или площадь здания часто не указаны). Это делает его отличным тренажером для очистки данных.
Эффект пандемии: Данные охватывают период примерно с 2016 по 2018 год, что позволяет увидеть рынок Мельбурна на пике перед определенными экономическими колебаниями.
Австралийская специфика: В отличие от американских датасетов, здесь часто учитывается «метод продажи» (на аукционе или частная сделка), что сильно влияет на цену.

Данные об объектах недвижимости Мельбурна

Давайте угадаем стоимость недвижимости?

Постановка задачи

Не просто модель регрессии, а управленческая логика применения ИИ

Сейчас мы не уходим сразу в код. Сначала фиксируем задачу руководителя: что именно предсказывает модель, как прогноз влияет на решение и где возникает экономический эффект.

Оценка объекта≈ 24,8 млн ₽ориентир для сделки

Прогноз

→

Решение

→

Эффект

Что именно предсказывает модель

Нас интересует не абстрактный score, а конкретный прогноз стоимости объекта — ориентир для дальнейшего действия.

Как прогноз влияет на решение

Прогноз должен менять поведение компании: покупать объект, не покупать его или использовать оценку как ориентир переговорной позиции.

Где возникает экономический эффект

Эффект появляется не в метрике самой модели, а в снижении потерь: меньше переплачиваем, реже упускаем выгодные объекты и точнее оцениваем актив.

Ключевая мысль: сама по себе модель не создает ценность. Ценность появляется тогда, когда прогноз меняет решение и уменьшает потери.

Бизнес-постановка

оценивает недвижимость для быстрых сделок;
принимает решение, покупать объект или нет;
либо использует модель как ориентир для оценки актива.

Цена ошибки модели

Переоценили объект

можем купить слишком дорого или завысить оценку актива.

Недооценили объект

можем упустить выгодный объект или занизить потенциал сделки.

Что сравниваем в Colab

Без MLпростое базовое решение

ML-модельпрогноз стоимости объекта

Экономический эффекткак прогноз меняет решение и уменьшает потери

Обсудим результаты демо

В нашем демо мы использовали только основные характеристики объекта. Какие дополнительные данные, на ваш взгляд, могли бы наиболее значительно увеличить точность прогноза стоимости недвижимости и почему?

Мы увидели, что модель снижает потери и увеличивает прибыль. Какие следующие шаги вы бы предприняли, чтобы еще больше максимизировать этот экономический эффект, исходя из полученного прогноза?

Какую информацию из нашей "decision frame" (таблицы решений) вы считаете наиболее важной для принятия окончательного решения о покупке/продаже, и как вы бы интегрировали эту информацию в текущие бизнес-процессы?

Что для нас опаснее: переоценка или недооценка?

Что нужно добавить, чтобы из демо перейти к реальному внедрению?

🚀 Перенесемся в Австралию