Get Dummies - учебники, сделанные для тех, кто начинает всё сначала

Get Dummies - это одна из функций библиотеки Pandas в языке программирования Python. Она используется для конвертации категориальных переменных в числовые переменные, которые могут быть использованы алгоритмами машинного обучения.

Например, у нас есть столбец 'Color' с категориальными значениями 'Red', 'Green' и 'Blue', тогда мы можем использовать функцию 'get_dummies' для создания трех новых столбцов ('Color_Red', 'Color_Green' и 'Color_Blue'), которые будут содержать значения 1 или 0. 1 представляет наличие данной категории в записи, 0 - отсутствие.

Вот пример кода:

python
import pandas as pd
# создаем DataFrame с категориальными значениями
df = pd.DataFrame({'Color': ['Red', 'Green', 'Blue', 'Red', 'Green', 'Red']})
# создаем столбцы-флаги для каждой категории с помощью функции get_dummies
dummies = pd.get_dummies(df['Color'], prefix='Color')
# объединяем DataFrame и столбцы-флаги
df = pd.concat([df, dummies], axis=1)
# выводим результат
print(df)

Этот код создаст новый DataFrame, который будет содержать пять столбцов: столбец 'Color' с категориальными значениями и три столбца-флага для каждой категории 'Color_Red', 'Color_Green' и 'Color_Blue'. Каждый флаг будет иметь значение 1 в строке, где значение соответствующей категории в столбце 'Color', и 0 - во всех остальных строках.

Результат будет выглядеть так:


   Color  Color_Blue  Color_Green  Color_Red
0    Red           0            0          1
1  Green           0            1          0
2   Blue           1            0          0
3    Red           0            0          1
4  Green           0            1          0
5    Red           0            0          1

Таким образом, мы можем использовать функцию 'get_dummies' для преобразования категориальных переменных в числовые переменные и использовать их в алгоритмах машинного обучения для прогнозирования и классификации.

Похожие вопросы на: "get dummies "

ADB Run: Как работать с ADB в командной строке для разработки мобильных приложений
True or False: Everything You Need to Know!
Скачать SQL Server Management Studio - управляйте базами данных Microsoft SQL Server
Что такое токен стамп и как он работает?
Instagram API: как использовать функционал на своём сайте
Классы HTML: уроки для начинающих и продвинутых
Telegram ID - уникальный идентификатор в мессенджере Телеграм
PHP Магические Методы - Используйте свойства и методы оператора
Использование неинициализированной локальной переменной C
Конвертировать SVG в JPG