как объединить датафреймы pandas

Аватар пользователя Elena Gromova
Elena Gromova
23 сентября 2024

Для объединения датафреймов в библиотеке Pandas можно использовать несколько методов, в зависимости от условий объединения:

Метод pd.concat()

Этот метод позволяет объединить датафреймы по вертикали или по горизонтали. При объединении по вертикали датафреймы сопоставляются по столбцам, а при объединении по горизонтали - по строкам.

Пример:

import pandas as pd

df1 = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})
df2 = pd.DataFrame({'A': [7, 8, 9], 'B': [10, 11, 12]})

result = pd.concat([df1, df2], axis=0) # объединение по вертикали

Метод pd.merge()

Данный метод позволяет объединить датафреймы по значениям столбцов. Метод merge() аналогичен операции JOIN в SQL и поддерживает объединения типа inner, outer, left и right.

Пример:

result = pd.merge(df1, df2, on='A', how='inner') # объединение по столбцу 'A' типом inner

Метод pd.join()

Этот метод позволяет объединить датафрейм с другим датафреймом или Series на основе индексов.

Пример:

df3 = pd.DataFrame({'C': [13, 14, 15]}, index=[1, 2, 3])

result = df1.join(df3, how='inner') # объединение по индексу типом inner

Выбор метода объединения зависит от целей и требований конкретной задачи. Необходимо обращать внимание на тип объединения, значения с которыми нужно сопоставить данные, и структуру исходных датафреймов.

0 0
Познакомьтесь с основами аналитики данных бесплатно