Стандартизация данных с помощью класса StandardScaler в библиотеке sklearn

Sklearn Standardscaler - это класс предварительной обработки данных, который используется для масштабирования фичей при обучении модели. Стандартное масштабирование в таком случае означает приведение значений фичей к нормальному распределению с средним значением, равным 0, и стандартным отклонением, равным 1.

Пример кода:

python
from sklearn.preprocessing import StandardScaler
import numpy as np
# сгенерируем некоторый набор данных для иллюстрации работы
X = np.array([
      [10, 20, 30],
      [5, 8, 22],
      [17, 25, 33],
      [27, 29, 35]
])
# создадим экземпляр класса Standardscaler
scaler = StandardScaler()
# используя метод fit_transform мы нормализуем исходные данные
X_normalized = scaler.fit_transform(X)
print(X_normalized)

Выходные данные будут иметь следующий вид:

python
array([[ 0.04302509,  0.04302509, -1.14617535],
       [-1.15516151,-1.15516151, -0.3048835 ],
       [ 0.78156614,  0.78156614,  0.58440852],
       [ 0.33057029,  0.33057029,  0.86664933]])

Результат показывает, что данные были нормализованы, и значения всех трех фичей находятся в пределах от -1.15 до 0.78. Таким образом, мы готовы использовать эти нормализованные данные для обучения модели и получения более точных прогнозов.

Стандартизация данных с помощью класса StandardScaler в библиотеке sklearn

Похожие вопросы на: "sklearn standardscaler "