Зарегистрируйтесь для доступа к 15+ бесплатным курсам по программированию с тренажером

Точечная диаграмма Аналитические задачи в бизнесе

В этом уроке мы изучим, что такое точечная диаграмма и на примерах разберем, какие аналитические задачи она помогает решать. В итоге мы научимся строить точечную диаграмму в Google Sheets.

Точечная диаграмма позволяет увидеть разброс и взаимосвязь в данных, что помогает решать некоторые важные задачи в бизнесе.

Что такое точечная диаграмма

Точечная диаграмма или scatter plot — это способ представления данных, в котором каждый объект представляется точкой. Каждая такая точка характеризуется двумя величинами:

  • По оси X
  • По оси Y

Представим, что нам предстоит решать аналитические задачи частной клиники «Здоровье».

Можно построить точечную диаграмму для клиентов этой клиники по двум величинам:

  • Возраст
  • Доход (в тысячах рублей)

Вот как будет выглядеть эта диаграмма в Google Sheets:

avatar

С помощью такой диаграммы можно извлечь несколько полезных фактов о разбросе данных и взаимосвязях в них. Далее мы разберем, что это за факты и какие аналитические задачи можно решить с их помощью.

Разброс данных

Разброс данных — это диапазон значений, в пределах которых изменяется величина.

Если посмотреть на диаграмму клиентов клиники «Здоровья», то можно сделать следующие выводы о разбросе величин:

  • Возраст клиентов клиники — от 20 до 38 лет
  • Доход клиентов клиники — от 20 до 80 тысяч рублей

По этой диаграмме также можно посмотреть на разброс одной величины относительно другой. Например, клиенты с доходом выше 40 тысяч рублей обычно имеют возраст от 20 до 28 лет, не старше.

Одна из аналитических задач, для которой пригодятся выводы выше — сегментация клиентов. Сегментировать клиентов — значит разделить их на такие группы, с которыми бизнес может работать по-разному для увеличения прибыли.

Таким образом клиентов клиники «Здоровье» можно разделить на два сегмента:

  • Клиенты с доходом более 40 тысяч рублей и возрастом менее 28 лет
  • Клиенты с доходом менее 40 тысяч рублей и возрастом от 28 лет (потому большая часть клиентов старше 28 обладают именно таким уровнем дохода)

Покажем эти сегменты на диаграмме:

avatar

Далее с такими сегментами можно работать по-разному, чтобы увеличить прибыль частной клиники. Представим, что клиника предлагает клиентам пакет профилактических услуг.

Если клиника не анализирует данные, то она предлагает всем клиентам один и тот же вариант. Одним он кажется слишком дешевым и неполным, другим — слишком дорогим. Так бизнес упускает клиентов и недополучает прибыль.

Если клиника проведет анализ данных, ее руководство увидит, что клиенты делятся на два сегмента. В таком случае можно предложить два пакета профилактических процедур — подороже и подешевле. Так все клиенты получат подходящую услугу, и клиника заработает больше.

Разумеется, в реальном бизнесе такие выводы должны подкрепляться исследованиями или опросами клиентов. В рамках урока мы приводим примеры, которые показывают, к каким бизнес-решениям могут подтолкнуть данные о клиентах.

Взаимосвязь данных

В обоих сегментах клиентов мы на диаграмме видим взаимосвязь возраста и дохода. В каждом сегменте большему значению возраста соответствует большее значение дохода:

avatar

Это наблюдение помогает решать задачи прогнозирования в бизнесе. Например, у нас появился клиент в возрасте 30 лет. Его доход мы не знаем, но хотим порекомендовать ему подходящий пакет процедур.

Если клиент старше 28, можно предположить, что его доход меньше 40 тысяч рублей. Ему стоит предложить бюджетный вариант — выше вероятность, что клиент согласится.

Если бы клиника не анализировала данные, она бы предложила этому клиенту дорогой пакет услуг и, скорее всего, получила бы отказ.

Как построить точечную диаграмму в Google Sheets

Рассмотрим, как строится диаграмма в Google Sheets:

  1. Для начала откроем таблицу с данными. Об этом можно прочитать в официальной справке Google Sheets

  2. Проверяем, что наши данные отобразились корректно. Нажимаем на пункт «Вставка» в верхней панели, чтобы вставить элемент поверх таблицы. Далее выбираем «Диаграмма»:

    avatar

  3. Здесь мы видим, что на правой панели появился редактор диаграмм. В пункте «Тип диаграммы» находим раздел «Точечные» и выбираем «Точечная диаграмма»:

    avatar

  4. Нажимаем на значок диапазона данных и выделяем всю таблицу, включая заголовки столбцов. Нажимаем «Ок»: avatar

  5. Нажимаем чекбоксы «Заголовки — значения строки 1». Проверяем, что в оси X и параметрах указаны верные столбцы: avatar

Подробнее о построении точечных диаграмм в Google Sheets можно почитать в официальной справке.

Выводы

В этом уроке мы познакомились с точечной диаграммой и узнали, как она может быть полезна для бизнеса. Теперь вы умеете строить такую диаграмму в Google Sheets.

Вспомним ключевые выводы урока:

  • Точечной диаграммой называют способ представления данных, где каждый объект — это точка
  • Каждая точка на диаграмме характеризуется двумя величинами — по осям X и Y. Например, возраст и доход клиента
  • Точечная диаграмма помогает увидеть разброс значений величин и взаимосвязь между объектами
  • Понимание разброса одной величины относительно другой помогает разделить объекты на группы — например, сегментировать клиентов
  • Знание взаимосвязи объектов помогает восполнять недостающие данные и принимать полезные решения для бизнеса

Самостоятельная работа

Сегментация клиентов — это одна из популярных аналитических задач в маркетинге. Разберем ее подробнее на конкретной задаче.

Напомним, что при сегментировании клиентов мы разделяем их на такие группы, с которыми бизнес может работать по-разному и таким образом увеличивать прибыль.

Представим, что мы хотим сегментировать клиентов магазина электроники.

Нажмите, чтобы увидеть тестовые данные

Чтобы решить эту задачу, мы изучим тестовые данные по ссылке.

Тестовые данные

В данных мы видим такие признаки:

  • Частота покупок — среднее количество покупок клиента за месяц

  • Средний чек — средняя сумма покупок клиента за месяц

  • Возраст — текущий возраст клиента на момент сбора данных

  • Возвраты — среднее количество возвратов клиента за месяц

Шаг 1. В таблице данных есть четыре признака. Постройте точечные диаграммы, в которых все признаки будут сочетаться друг с другом. У вас должно получиться шесть графиков:

  • Возвраты vs Возраст

  • Возвраты vs Частота покупок

  • Возраст vs Средний чек

  • Возраст vs Частота покупок

  • Возвраты vs Средний чек

  • Средний чек vs Частота покупок

Построив эти графики, вы увидите, как разделяются данные в разрезе разных признаков.

Нажмите, чтобы увидеть диаграммы

У нас получились такие графики:

eyJpZCI6ImZjYTk4MDI0NTNkNjhhNGZlZjk4ZWVkNmYxYzU2MWI5LnBuZyIsInN0b3JhZ2UiOiJjYWNoZSJ9?signature=1b3f0a2c4e47b882b5361d4474afdc150843b2343376c8e9f44f2f274f1ff23b
eyJpZCI6IjdmMTYwOTA5NjZjNDk0YmJhOGE0ZjE2ZDUyMTgzNGFjLnBuZyIsInN0b3JhZ2UiOiJjYWNoZSJ9?signature=82c829dd9a9d06f9285fd758f9e286cb05d8b0fb6f148adb17a9bc5b22cb00da
eyJpZCI6ImRmZDJkNmYwZGYxZTMxYzM0YmRhYTBmOTM0NjY2NmY4LnBuZyIsInN0b3JhZ2UiOiJjYWNoZSJ9?signature=e22ec19efc529db0b2cb92b70a4736479ddc69b45f199ee569b681b6b183b6cc
eyJpZCI6IjVlNmVjZWRkZjRmZGU0MDcxMjBkYWM2ZGI0ZTM5MzNhLnBuZyIsInN0b3JhZ2UiOiJjYWNoZSJ9?signature=574b0dee48ae7005a6393bab5600e8d5a24a02695a2c5604534b3fa349e2ba3f
eyJpZCI6ImYzMjcyYjdlMWNiOTgzMjZjODVhODMzOTA0OTYxZDFiLnBuZyIsInN0b3JhZ2UiOiJjYWNoZSJ9?signature=16f8c97fcc0c8a29a76540a7eb96d9d297d383e4e5ab192a3d7359d172093037
eyJpZCI6ImFhM2Y4ZjFhYTU5YzRjOWI2Y2ZmNTY0OTA3YTI0NzIzLnBuZyIsInN0b3JhZ2UiOiJjYWNoZSJ9?signature=0458412bd99144d9ace66d7d5907177c66eabcdfb4f716be66787412e4568778

Шаг 2. Посмотрите еще раз на диаграммы выше. Определите, какая диаграмма позволяет четче всего разделить клиентов на группы. Придумайте названия для этих сегментов клиентов.

Нажмите, чтобы увидеть возможный ответ

Почти на всех диаграммах можно увидеть разделение на две группы. При этом диаграмма «Средний чек vs Частота покупок» позволяет увидеть самое четкое разделение на группы — на диаграмме точки расположены ближе всего друг к другу:

eyJpZCI6ImFhM2Y4ZjFhYTU5YzRjOWI2Y2ZmNTY0OTA3YTI0NzIzLnBuZyIsInN0b3JhZ2UiOiJjYWNoZSJ9?signature=0458412bd99144d9ace66d7d5907177c66eabcdfb4f716be66787412e4568778

В таком разделении можно интерпретировать сегменты так:

  • Высокоактивные клиенты с высоким средним чеком и высокой частотой покупок

  • Низкоактивные клиенты с низким средним чеком и низкой частотой покупок

Шаг 3. Как думаете, как можно работать с каждым из выделенных сегментов? Если бы вы были аналитиком, что бы вы порекомендовали? Предложите пару идей.

Нажмите, чтобы увидеть возможный ответ

Мы предложили такие стратегии работы с сегментами:

  • Высокоактивным клиентам можно предложить бонусные программы и скидки на повторные покупки, чтобы они продолжали покупать именно в нашем магазине. Также этих клиентов можно заинтересовать участием в эксклюзивных акциях и событиях — например, вечеринках для посетителей и презентациях новых продуктов

  • Низкоактивным клиентам подойдут скидки и специальные предложения, которые могли бы подтолкнуть их к покупке. Кроме того, можно предоставить им персональные рекомендации продуктов на основе их предыдущих покупок, чтобы поднять уровень их заинтересованности

Тут важно сказать, что в реальной практике сегментация клиентов выполняется с помощью более сложных инструментов:

  • Аналитики часто рассматривают три признака или более. Такие сочетания сложно показать на графике, поэтому в таких случаях используют кластеризацию и другие алгоритмы

  • Далеко не всегда аналитики полагаются только на имеющиеся данные — они могут создавать дополнительные признаки для исследования

Подробнее об этом мы говорили в других курсах профессии «Аналитик данных».


Дополнительные материалы

  1. Как построить точечную диаграмму в Google Sheets
  2. Доход в зависимости от возраста

Аватары экспертов Хекслета

Остались вопросы? Задайте их в разделе «Обсуждение»

Вам ответят команда поддержки Хекслета или другие студенты

Об обучении на Хекслете

Для полного доступа к курсу нужен базовый план

Базовый план откроет полный доступ ко всем курсам, упражнениям и урокам Хекслета, проектам и пожизненный доступ к теории пройденных уроков. Подписку можно отменить в любой момент.

Получить доступ
1000
упражнений
2000+
часов теории
3200
тестов

Открыть доступ

Курсы программирования для новичков и опытных разработчиков. Начните обучение бесплатно

  • 130 курсов, 2000+ часов теории
  • 1000 практических заданий в браузере
  • 360 000 студентов
Отправляя форму, вы принимаете «Соглашение об обработке персональных данных» и условия «Оферты», а также соглашаетесь с «Условиями использования»

Наши выпускники работают в компаниях:

Логотип компании Альфа Банк
Логотип компании Aviasales
Логотип компании Yandex
Логотип компании Tinkoff
Рекомендуемые программы
профессия
новый
Собирайте, анализируйте и интерпретируйте данные, улучшайте бизнес-процессы и продукт компании. Обучитесь работе с библиотеками Python
9 месяцев
с нуля
Старт 7 ноября

Используйте Хекслет по-максимуму!

  • Задавайте вопросы по уроку
  • Проверяйте знания в квизах
  • Проходите практику прямо в браузере
  • Отслеживайте свой прогресс

Зарегистрируйтесь или войдите в свой аккаунт

Отправляя форму, вы принимаете «Соглашение об обработке персональных данных» и условия «Оферты», а также соглашаетесь с «Условиями использования»
Изображение Тото

Задавайте вопросы, если хотите обсудить теорию или упражнения. Команда поддержки Хекслета и опытные участники сообщества помогут найти ответы и решить задачу