Включено в курс
Чему вы научитесь
- Поймете, как осуществить чтение и запись таблиц в популярные табличные форматы
- Научитесь фильтровать значения и оперировать с их подмножествами
- Познакомитесь с агрегированием и группированием данных
- Освоите объединение и изменение формы таблиц
Описание
На этом курсе вы изучите анализ данных с помощью библиотеки Pandas. Вы узнаете много нового о порядке работы с данными в Python, научитесь фильтровать данные, обрабатывать строки и столбцы в таблицах. В итоге вы освоите все необходимые возможности Pandas: научитесь читать и записывать данные в популярные табличные форматы, строить сложные агрегации, объединять несколько таблиц в одну.
Библиотека Pandas пригодится, если вам интересна подготовка данных и их анализ с использованием языка Python. Знания из этого курса позволят вам преобразовывать неструктурированные данные в табличный вид для наглядности.
Данный курс предполагает, что у вас есть предварительная подготовка по Python. Если это не так, то обратитесь к курсам:
Они помогут получить основное представление о Python, его принципах и особенностях, сформируют навыки работы с коллекциями.
Программа курса
-
2
Использование Pandas для работы с табличными данными
Познакомимся с последовательностью действий аналитика в задачах анализа данных с использованием Pandas -
3
Чтение и запись табличных данных в файловую систему
Научимся читать табличные данные из файловой системы и записывать в нее результаты обработки данных в табличном виде -
4
Работа с индексами
Разберемся с использованием индексов для получения значений, переиндексированием и изменением названий столбцов/строк. Научимся работать с конкретной строкой или столбцом таблицы -
5
Фильтрация значений и подготовка данных для анализа
Познакомимся с инструментами Pandas для подготовки и первичного анализа данных -
6
Применение функций к столбцам и строкам таблицы
Разберем уход от поэлементных операций с данными — применение векторизованных функций для ускорения операций над строками и столбцами -
7
Визуализация данных
Научимся использовать средства визуализации для анализа данных, которые интегрированы в Pandas -
8
Сводные таблицы
Разберем агрегирование данных с использованием сводных таблиц данных и анализ макропоказателей -
9
Изменение формы и объединение таблиц
Рассмотрим объединение нескольких таблиц в одну, а также представление сводных таблиц в различных разрезах строк и столбцов -
10
Работа с Excel-файлами в Pandas
Овладеем навыками работы с популярными форматами файлов .xlsx и .xls приложения Microsoft Excel с использованием средств библиотеки Pandas -
12
Дополнительные материалы
Статьи и видео, подобранные командой Хекслета. Помогут глубже погрузиться в тему курса
Формат обучения
Испытания
Это практические задания, которые мы советуем выполнить после завершения курса. Задания помогут вам получить дополнительный опыт в программировании и закрепить полученные навыки. Обычно мы рекомендуем выполнить 3-5 испытаний. Но если не получается, не отчаивайтесь. Просто вернитесь к ним позже
Отзывы
В тесте ошибка как мне кажется - после заполнения пропусков - тест смотрит на количество NAN == 2, но должен сравнивать с 0 так как мы же их все заменили