Анализ потенциала локаций и сравнение прогнозных значений с фактическими. Как улучшить?

Цель

Выбрать лучшие локации для бизнеса, выбрать лучшие ТЦ для размещения торговой точки. Выяснить, какой у точки потенциал и понять, почему.

Контекст:

Одна из актуальных задач бизнеса в сфере ретейла – найти правильную локацию и реализовать максимальным образом её потенциал. Расскажем о том, как данные помогают это делать и почему вариант с почти эталонной точностью не всегда хорош.

Ключевые показатели

Количество видов данных — более 1 000 (плюс их комбинации)
Количество городов для анализа в России – 3000+
Массивы анализируемых данных — десятки терабайтов
Реализованные релевантные проекты — более 100
Экспертиза по направлениям бизнеса – количество не ограничено
Бюджет на проект – от 200 000 рублей
Зона покрытия – вся Россия
case-key

Решение

Когда мы трансформируем сеть или помогаем найти локации для открытия новых точек, мы должны предельно понятно и аргументированно объяснять управляющему сети и менеджменту заказчика, почему мы предлагаем такое, а не иное решение, и откуда берётся предлагаемый прогноз.

Для этого мы подробнее описываем два наших подхода. Первый – это использование статистических моделей. Их прогноз учитывает обычно 3000+ исходных переменных и заранее подготовленных «фичей» (features), что увеличивает точность и прогностическую ценность выводов. Главное преимущество такого подхода – его высокая точность. Но есть и минусы, главный из них – трудная интерпретируемость методологии расчёта. Часть, например, регрессию, легко интерпретировать и понять, но есть ещё вычисления, которые, условно говоря, происходят внутри модели, их нелегко понять человеку, а ещё труднее перевести с языка программирования и высшей математики и статистики на язык бизнес пользователя и найти правильные соответствия в бизнес-словаре, чтобы поняли все участники проекта. Зачастую это просто невозможно, и для бизнес заказчика расчёты и высоконагруженные вычисления становятся «чёрным ящиком», который выдаёт решения, которые неизвестно как приняты.

Именно по этой причине мы используем и второй подход. Вместе с заказчиком мы составляем набор экспертных правил, машинная статистика подсказывает, какие факторы больше всего влияют на результат, и мы присваиваем различным параметрам и характеристиками различный вес в зависимости от большей и меньшей важности для исследуемого бизнеса.

Сумма баллов и разделяет локации на лучшие, средние и худшие. Это максимально прозрачная и логичная процедура оценки и сравнения. В качестве примера рассмотрим оценку доступности ТЦ. Сколько остановок и маршрутов рядом? Какая доля жителей может доехать до ТЦ без пересадок? Если 20% города могут доехать, то таким ТЦ можно дать 1 балл дополнительно. Если в радиусе двух километров нет других больших знаковых ТЦ, то даём ещё один балл. Если в радиусе 1 км живёт больше 50 тысяч человек, то ещё один балл. Сколько жителей и трафика приходится на 1 кв.м. ТЦ, на разные виды арендаторов ТЦ и так далее и так далее. Итого, ключевых экспертных правил обычно от 10-ти до 15-ти. Они не даются полностью на откуп машине, любой эксперт может проверить их, пересчитать, изменить вес, приоритет, очерёдность или градацию параметров. Социально-демографические параметры тоже участвуют в расчётах. Например, если нам важна целевая семейная аудитория, а профиль ТЦ строительный, то такой ТЦ по этому параметру получит 0 баллов или даже отрицательный балл, чтобы сразу убрать его из списка.

Прогноз расходится с фактическими результатами. Что делать?

После того, как мы проанализировали все факторы и построили прогноз, например, заявили возможность потенциальной выручки в 10 миллионов заказчик может возразить: «У нас есть точка в этом ТЦ, и она приносит в два раза меньше прибыли». Путём анализа основных факторов, влияющих на прибыль, мы выясняем, что «проседает». Первым делом мы дополнительно выверяем, нет ли ошибок в расчётах, исходных данных, согласованных для расчёта правилах, а потом собираем внутренние, дополнительные факторы.

Например, мы вплотную приблизились к расположению конкретной точки в конкретном ТЦ и видим большую разницу между ожидаемым и реальным финансовым результатом. В этом случае совместно с менеджментом компании мы анализируем уровень конверсии посетителей ТЦ в посетителей магазина, а также конверсию посетителей в покупателей, формулируем и выявляем дополнительные характеристики, которые влияют на различия прогноза и факта. Здесь мы в большей мере даем инструменты и помогаем самому заказчику найти причину. Заказчик безусловно может сделать и часто делает всё это и без нас, но мы нужны на этапе подготовки данных, математики и вычислений для определения потенциала, с которым сравнивается фактический результат и структурирования дополнительных разделяющих факторов.

Как дополнительный фактор можно использовать замер трафика у конкретной точки. Если она «на улице», то эти расчёты у заказчика уже есть, т.к. наши модели его рассчитывают и учитывают на первом этапе. Если речь идёт о внутренних помещениях, например, удаленность от продуктового магазина или фудкорта, это можем посчитать мы или сотрудник компании. Главное, что в результате у нас не останется не покрытых аналитикой видов данных и возможных причин снижения эффективности и отличия факта от прогноза. Это касается не только «неэффективных» точек. С точки зрения работающей сети она может быть успешна, но анализ показывает, что комбинация факторов позволяет получить результат лучше, значит, потенциал недоиспользован. И с этим обязательно надо работать.

Кроме стандартных сценариев, объединённая экспертная команда может разработать несколько планов расположения точки в том или ином месте ТЦ и оценить, где результат лучше: рядом с такими брендами по соседству или с другими, на каком этаже и каком расстоянии от кинотеатра, эскалатора, фудкорта и т.д. В чём ценность такой дополнительной экспертизы? Анализ различных внутренних факторов после оцифровки и помещения его в модели для расчётов позволит сформулировать «ключ к успеху» и уже автоматизированным способом оценить и проанализировать, например, привлекательность всех ТЦ в стране. Это самый перспективный способ с высокой точностью «прогнать» тысячи вариантов и выбрать лучшие. Любая иная экспертиза или метод проб и ошибок будут стоить дороже и займут годы. Здесь же мы получаем рейтинг ТЦ, но не общий по рынку, а целевой, по выверенным параметрам для конкретной сети.

Результат

Когда мы решаем задачи оптимизации сети, мы выбираем самые подходящие локации, делаем предиктивный анализ трафика и рассчитываем финансовый результат организации, мы уделяем внимание всем доступным для нас видам цифровых данных. Конкуренция, общий трафик, целевой трафик, спрос. Внутренние и дополнительные характеристики, как качество персонала, навигация и реклама. В результате заказчик получает максимально полную выгрузку лучших решений и легко адаптируемую для всего бизнеса модель расчёта и прогноза выручки, рентабельности бизнеса в зависимости от различных переменных.