Get Dummies - учебники, сделанные для тех, кто начинает всё сначала
Get Dummies - это одна из функций библиотеки Pandas в языке программирования Python. Она используется для конвертации категориальных переменных в числовые переменные, которые могут быть использованы алгоритмами машинного обучения.
Например, у нас есть столбец 'Color' с категориальными значениями 'Red', 'Green' и 'Blue', тогда мы можем использовать функцию 'get_dummies' для создания трех новых столбцов ('Color_Red', 'Color_Green' и 'Color_Blue'), которые будут содержать значения 1 или 0. 1 представляет наличие данной категории в записи, 0 - отсутствие.
Вот пример кода:
python
import pandas as pd
# создаем DataFrame с категориальными значениями
df = pd.DataFrame({'Color': ['Red', 'Green', 'Blue', 'Red', 'Green', 'Red']})
# создаем столбцы-флаги для каждой категории с помощью функции get_dummies
dummies = pd.get_dummies(df['Color'], prefix='Color')
# объединяем DataFrame и столбцы-флаги
df = pd.concat([df, dummies], axis=1)
# выводим результат
print(df)
Этот код создаст новый DataFrame, который будет содержать пять столбцов: столбец 'Color' с категориальными значениями и три столбца-флага для каждой категории 'Color_Red', 'Color_Green' и 'Color_Blue'. Каждый флаг будет иметь значение 1 в строке, где значение соответствующей категории в столбце 'Color', и 0 - во всех остальных строках.
Результат будет выглядеть так:
Color Color_Blue Color_Green Color_Red
0 Red 0 0 1
1 Green 0 1 0
2 Blue 1 0 0
3 Red 0 0 1
4 Green 0 1 0
5 Red 0 0 1
Таким образом, мы можем использовать функцию 'get_dummies' для преобразования категориальных переменных в числовые переменные и использовать их в алгоритмах машинного обучения для прогнозирования и классификации.