как отфильтровать данные в pandas

Аватар пользователя Ivan Mamtsev
Ivan Mamtsev
29 мая 2024

Для фильтрации данных в pandas можно использовать методы loc и iloc или функцию query.

  1. Метод loc позволяет выбирать строки и столбцы по меткам индекса и названиям столбцов. Например, для отображения только строк, в которых значение в столбце 'колонка' больше 10, можно использовать следующий код:
df_filtered = df.loc[df['колонка'] > 10]
  1. Метод iloc позволяет выбирать строки и столбцы по их числовым индексам. Например, для отображения только первых 5 строк и первых 3 столбцов можно использовать следующий код:
df_filtered = df.iloc[:5, :3]
  1. Функция query позволяет использовать строковые выражения для фильтрации данных. Например, для отображения только строк, в которых значение в столбцах 'колонка1' больше 10 и 'колонка2' меньше 20, можно использовать следующий код:
df_filtered = df.query('колонка1 > 10 and колонка2 < 20')

Это лишь некоторые из методов фильтрации данных в pandas. Другие возможности включают использование методов isin(), between(), и применение пользовательских функций с помощью метода apply().

0 0
Познакомьтесь с основами аналитики данных бесплатно