Работа с индексами в pandas: обзор, примеры, рекомендации
Pandas index - это массив меток (labels), которые помогают быстро и эффективно обращаться к данным в DataFrame. Каждый элемент в массиве меток соответствует одной строке в DataFrame, а общее количество элементов соответствует общему количеству строк в DataFrame.
Index может быть представлен в разных формах, включая числовой, временной, строковый и т.д. Например, в DataFrame с информацией о студентах индексы могут быть их именами или номерами студенческих билетов.
Пример создания индекса в Pandas выглядит следующим образом:
python
import pandas as pd
# Создание DataFrame
data = {'Name': ['John', 'Alex', 'Michael'], 'Age': [25, 27, 30], 'Subject': ['Math', 'Science', 'English']}
df = pd.DataFrame(data)
# Создание index по умолчанию (0, 1, 2 и т.д.)
df_default_index = df.copy()
# Создание index с использованием столбца 'Name'
df_name_index = df.set_index('Name')
print('DataFrame с индексом по умолчанию:')
print(df_default_index)
print('DataFrame с индексом по имени:')
print(df_name_index)
В данном примере сначала была создана DataFrame «df» с тремя столбцами - Name, Age и Subject. Затем были созданы два новых DataFrame с разными типами индекса: df_default_index с индексом по умолчанию и df_name_index с индексом по столбцу Name.
Индекс может использоваться для выборки определенных строк из DataFrame. Например, чтобы выбрать только данные о студенте Michael, мы можем использовать следующий код:
python
michael_data = df_name_index.loc['Michael']
print(michael_data)
Этот код вернет все данные о студенте Michael из DataFrame, так как мы использовали индекс по столбцу 'Name'. Таким образом, индекс позволяет быструю и эффективную работу с данными в DataFrame.