Создание и использование Pandas Pivot Table
Pandas pivot table - это мощный инструмент, который облегчает агрегацию и анализ данных в таблицах Python. Этот инструмент позволяет преобразовывать столбцы в строки, а также облегчает агрегирование данных с различными функциями, такими как сумма, среднее значение, максимальное значение и минимальное значение.
Пример использования:
Для создания сводной таблицы с помощью pandas pivot table необходимо выполнить несколько шагов:
Шаг 1: Импортируем библиотеку Pandas
import pandas as pd
Шаг 2: Создаем DataFrame
df = pd.DataFrame({'name': ['Alice', 'Bob', 'Charlie', 'David','Eva','George'],
'gender': ['F', 'M', 'M', 'M','F','M'],
'age': [25, 32, 18, 47,28,33],
'city': ['London', 'New York', 'Paris', 'Moscow','Paris','London'],
'salary': [50000, 70000, 48000, 100000,65000,80000]})
Шаг 3: Создаем сводную таблицу
pivot_table = pd.pivot_table(df,
index=['gender','city'],
values=['age','salary'],
aggfunc={'age': 'mean', 'salary': 'sum'})
Шаг 4: Выводим результат
print(pivot_table)
Результат:
age salary
gender city
F London 25 65000
Paris 28 65000
M Moscow 47 100000
New York 32 70000
Paris 18 48000
London 33 80000
В этом примере мы создали сводную таблицу, которая группирует данные по полу и городу, и агрегирует данные по среднему возрасту и сумме зарплаты.
Таким образом, pandas pivot table является мощным инструментом для агрегирования и анализа данных в таблицах Python. Он позволяет создавать сводные таблицы со множеством функций агрегирования и группировки, что позволяет анализировать данные и находить в них интересные закономерности.