Визуализация в Superset
Теория: Воронкообразные диаграммы
Продолжаем работу с BI-инструментами и создадим воронку продаж в Apache Superset. С воронками мы уже знакомы по работе в Google Sheets и продвинутой аналитике, где создавали необходимые агрегаты. Теперь переходим к следующему этапу – автоматизации этого процесса.
Для работы нам понадобится Google Sheets с данными о продажах. В таблице у нас будет два поля: стадия продажи и ID пользователя. Давайте разберем, какие стадии продаж у нас есть:
- Реклама продукта
- Переход на домашнюю страницу
- Добавление товаров в корзину
- Совершение покупки
- Ожидание доставки
Начнем с подключения данных. В Superset заходим в свой workspace и подключаем Google Sheets. Для этого сделаем таблицу общедоступной (даем права на чтение или редактирование). Затем скопируем ссылку на таблицу. Наконец, в Superset создаем новое подключение, называем его, задаем тип (Google Sheets) и вставляем ссылку.
Важный момент: в SQL Lab при работе с Google Sheets нужно учитывать регистр. Название таблицы с большой или маленькой буквы – для системы это разные вещи.
Теперь самое интересное – создание воронки. У графика воронки есть три основных параметра:
- Dimensions (измерения по стадиям процесса)
- Metrics (агрегаты для каждого статуса)
- Filters (для фильтрации данных по периодам)
Дополнительно настраиваем параметры:
- В Dimensions добавляем наши стадии
- В Metrics ставим Count Distinct для ID пользователей
- Включаем SortByMetric для сортировки по убыванию
В результате получаем наглядную воронку, которая показывает:
- Сколько людей увидели рекламу
- Сколько перешли на сайт
- Сколько добавили товары в корзину
- Сколько совершили покупку
- Сколько ожидают доставку
Дополнительно мы можем настроить кастомизацию как изменение цветов, настройку меток, выбор масштаба и отображение процентов при наведении. В конце работы не забываем сохранить наш чарт – он пригодится для создания дашбордов далее.
Выводы
Сегодня мы научились создавать воронку продаж в Apache Superset. Это мощный инструмент для визуализации данных, который поможет вам лучше понимать ваши данные и принимать более обоснованные решения. Теперь вы можете создавать воронки для любых процессов и анализировать их эффективность.




