Стандартизация данных с помощью класса StandardScaler в библиотеке sklearn
Sklearn Standardscaler - это класс предварительной обработки данных, который используется для масштабирования фичей при обучении модели. Стандартное масштабирование в таком случае означает приведение значений фичей к нормальному распределению с средним значением, равным 0, и стандартным отклонением, равным 1.
Пример кода:
python
from sklearn.preprocessing import StandardScaler
import numpy as np
# сгенерируем некоторый набор данных для иллюстрации работы
X = np.array([
[10, 20, 30],
[5, 8, 22],
[17, 25, 33],
[27, 29, 35]
])
# создадим экземпляр класса Standardscaler
scaler = StandardScaler()
# используя метод fit_transform мы нормализуем исходные данные
X_normalized = scaler.fit_transform(X)
print(X_normalized)
Выходные данные будут иметь следующий вид:
python
array([[ 0.04302509, 0.04302509, -1.14617535],
[-1.15516151,-1.15516151, -0.3048835 ],
[ 0.78156614, 0.78156614, 0.58440852],
[ 0.33057029, 0.33057029, 0.86664933]])
Результат показывает, что данные были нормализованы, и значения всех трех фичей находятся в пределах от -1.15 до 0.78. Таким образом, мы готовы использовать эти нормализованные данные для обучения модели и получения более точных прогнозов.