How to Use the Confusion Matrix in scikit-learn for Model Performance Evaluation
Confusion Matrix - это таблица, используемая для оценки качества алгоритма классификации путем сравнения предсказанных значений с фактическими значениями. Она показывает количество верно и неверно классифицированных примеров в каждой из категорий.
В sklearn confusion matrix может быть вычислена с помощью функции confusion_matrix. Она принимает два параметра: фактические значения целевой переменной и предсказанные значения целевой переменной.
Пример кода:
python
from sklearn.metrics import confusion_matrix
# Допустим, фактические значения y_true и предсказанные значения y_pred:
y_true = [1, 1, 0, 1, 0, 0, 1, 0, 1, 0]
y_pred = [1, 1, 1, 0, 1, 0, 0, 0, 1, 1]
# Вычисляем confusion matrix:
matrix = confusion_matrix(y_true, y_pred)
print(matrix)
В результате мы получим следующую таблицу:
[[2 2]
[3 3]]
Читаем ее следующим образом: алгоритм правильно предсказал 2 примера из класса 0, ошибочно предсказал 3 примера из класса 0 в класс 1. Он также правильно предсказал 3 примера из класса 1, но ошибочно предсказал 2 примера класса 1 в класс 0.
Confusion matrix может быть полезна для дальнейшего анализа качества работы алгоритма классификации и определения наиболее ошибочных классов.