Сопоставление данных из различных систем
Источники для сквозной аналитики
Введение в сквозную аналитику начинается с процесса сопоставления данных из разных источников. Давайте более подробно разберем эту тему.
Сквозная аналитика использует множество источников данных, включая автоматизированные и полуавтоматизированные системы, данные, собранные сотрудниками компании и информацию, поступающую от внешних компаний. Иногда крупные компании могут нанимать маркетинговые агентства для продвижения своих продуктов, но это не является обязательным. Ритейлеры такие как Х5, Перекресток, и Пятерочка, представляют собой основных розничных продавцов товаров массового потребления в России.
Некоторые производители, такие как заводы кондитерских изделий "Красный Октябрь" и "Бабаевский", начинают открывать собственные магазины для продажи своей продукции. Однако большинство розничных магазинов предлагают товары разных брендов, и для производителей, таких как "Красный Октябрь", они также представляют собой источник данных для сквозной аналитики.
В страховых компаниях есть страховые агенты, которые заключают договоры со страхователями. Эти агенты получают вознаграждение за продажу страховых услуг, и существуют специальные расчеты, чтобы определить размер этой комиссии. Например, если компания производит и продает свои продукты, то она имеет дело как с производством, так и с продажей. Она также может использовать различные аналитические инструменты, чтобы оптимизировать процессы и повысить эффективность маркетинга.
Сквозная аналитика также включает в себя мобильные приложения, которые служат источником информации для маркетинга. Это позволяет компаниям отслеживать поведение клиентов, их предпочтения, а также определять, какие товары привлекают наибольший интерес. Это также помогает определить, почему некоторые товары долго остаются в корзине покупателя и как можно улучшить процесс покупки.
Кроме того, данные могут поступать вручную или автоматически из разных источников, таких как веб-сайты, площадки объявлений, и маркетплейсы. Для компаний также важно следить за трафиком на своем собственном сайте, анализируя количество посещений, продолжительность сессий и глубину просмотра страниц. Эти метрики помогают понять, насколько лояльными являются посетители и какие страницы на сайте наиболее привлекательны для них.
Сквозная аналитика позволяет компаниям собирать, анализировать и использовать данные из разных источников для оптимизации своей деятельности и улучшения взаимодействия с клиентами.
Практика
У нас есть данные по регистрациям в таблице registrations и по покупкам в таблице payments
SELECT * FROM registrations;
cookie_id | user_id | registration_date |
---|---|---|
1 | user1 | 2023-01-01T00:00:00.000Z |
2 | user2 | 2023-01-02T00:00:00.000Z |
3 | user3 | 2023-01-03T00:00:00.000Z |
4 | user4 | 2023-01-04T00:00:00.000Z |
5 | user5 | 2023-01-05T00:00:00.000Z |
6 | user6 | 2023-01-06T00:00:00.000Z |
7 | user7 | 2023-01-07T00:00:00.000Z |
8 | user8 | 2023-01-08T00:00:00.000Z |
9 | user9 | 2023-01-09T00:00:00.000Z |
SELECT * FROM payments;
user_id | amount | payment_date |
---|---|---|
user1 | 100 | 2023-02-01T00:00:00.000Z |
user2 | 200 | 2023-02-02T00:00:00.000Z |
user3 | 300 | 2023-02-03T00:00:00.000Z |
user4 | 400 | 2023-02-04T00:00:00.000Z |
user5 | 500 | 2023-02-05T00:00:00.000Z |
user6 | 600 | 2023-02-06T00:00:00.000Z |
user7 | 700 | 2023-02-07T00:00:00.000Z |
user8 | 800 | 2023-02-08T00:00:00.000Z |
user9 | 900 | 2023-02-09T00:00:00.000Z |
Ссылка на датасет
Давайте расчитаем средний LTV пользователя. Напомним, что LTV расчитывается как произведение стоимости покупок пользователя на количество покупок за период.
Объединим таблицы и посчитаем срок активности каждого клиента. Будем считать, что дата последней покупки (в нашем случае для упрощения всего одна покупка) это конец периода, а дата регистрации - начало. Так как пользователи платят каждый месяц, то переведем жизненный срок в месяцы.
SELECT
r.user_id,
p.amount,
EXTRACT(YEAR FROM AGE(p.payment_date, r.registration_date)) * 12 +
EXTRACT(MONTH FROM AGE(p.payment_date, r.registration_date)) AS lifetime
FROM registrations AS r
LEFT JOIN payments AS p
ON r.user_id = p.user_id
LIMIT 3;
user_id | amount | lifetime |
---|---|---|
user1 | 100 | 1 |
user2 | 200 | 1 |
user3 | 300 | 1 |
https://www.db-fiddle.com/f/2gR99rUuRhS4FftgVAwZWo/3
Наконец, расчитаем средний месячный чек пользователя и средний срок активности. И перемножив, найдем средний LTV.
WITH tab AS (
SELECT
p.amount AS amount,
EXTRACT(YEAR FROM AGE(p.payment_date, r.registration_date)) * 12 +
EXTRACT(MONTH FROM AGE(p.payment_date, r.registration_date)) AS lifetime
FROM registrations AS r
LEFT JOIN payments AS p
ON r.user_id = p.user_id
)
SELECT
ROUND(AVG(t.amount)) AS avg_amount,
ROUND(AVG(t.lifetime)) AS avg_lifetime,
ROUND(AVG(t.amount) * AVG(t.lifetime)) AS avg_ltv
FROM tab AS t;
avg_amount | avg_lifetime | avg_ltv |
---|---|---|
500 | 1 | 500 |
https://www.db-fiddle.com/f/2gR99rUuRhS4FftgVAwZWo/4
Для полного доступа к курсу нужен базовый план
Базовый план откроет полный доступ ко всем курсам, упражнениям и урокам Хекслета, проектам и пожизненный доступ к теории пройденных уроков. Подписку можно отменить в любой момент.