Визуализация в Superset
Теория: Столбчатые диаграммы
В этом уроке мы продолжим изучать визуализацию данных с помощью промышленных BI-инструментов и научимся создавать столбчатые диаграммы (барчарты). Это очень полезный инструмент, который часто используется для анализа данных в бизнесе.
Начнем с подключения к данным. Для работы нам нужна база PostgreSQL. Если вы уже работали с Superset раньше, у вас должно быть создано рабочее пространство и настроено подключение к базе.Зайдем в Settings, затем в разделе Data выберем Data Connections. Здесь должно быть активное подключение к PostgreSQL с двумя важными галочками: возможность работать в SQL Lab и выполнять DML операции (UPDATE, DELETE, INSERT).
На этот раз мы воспользуемся столбчатой диаграммой. Это отличный способ показать, как меняются наши данные. Представьте, что у вас есть продажи за разные дни – высота каждого столбика будет показывать, сколько именно продаж было в конкретный день. Можно сразу увидеть, в какие дни продажи были выше, а в какие ниже.
Теперь сделаем это в Superset. Для начала нам нужно создать датасет. Зайдем в раздел датасетов и выберем нашу базу PostgreSQL. В схеме public находим таблицу sales – она будет основой для нашей диаграммы. Но чаще всего просто одной таблицы недостаточно. Нам нужно собрать данные из разных таблиц, и тут нам поможет SQL Lab.
Для примера, визуализируем объемы продаж по продавцам:
После выполнения запроса сохраняем его как датасет – это важно, потому что потом мы будем использовать его для создания диаграммы.
Теперь самое время создать нашу диаграмму. Выбираем тип графика – bar chart. Что нам нужно настроить:
- По горизонтали (X-axis) ставим имя продаца, sales_person – будем смотреть продажи по каждому продавцу
- По вертикали (Metrics) – сумму продаж, total_revenue
Полезная функция – row limit. Например, можно ограничить вывод только на 5 продавцов. Это удобно, когда у вас много данных и вы хотите сосредоточиться на самых важных.
Также с помощью кастомизации можно настроить цвета, добавить легенду, изменить подписи. Это особенно полезно, когда вы готовите отчет для руководства или презентацию для клиентов.
Когда диаграмма готова, обязательно сохраняем её. Уже с сохраненной можно быстро обновлять данные, менять настройки и делиться с коллегами.
На практике, когда вы будете работать с реальными данными (а их обычно гораздо больше, чем в нашем примере), диаграммы получаются еще информативнее. Вы сможете увидеть тренды, сезонность, аномалии в данных.
Выводы
Сегодня мы научились создавать столбчатые диаграммы в Superset. Это отличный инструмент для визуализации данных, который поможет вам лучше понимать ваши данные и принимать более обоснованные решения.




