confusion_matrix#

sklearn.metrics.confusion_matrix(y_true, y_pred, *, labels=None, sample_weight=None, normalize=None)#

计算混淆矩阵以评估分类的准确性。

根据定义,混淆矩阵 \(C\) 是这样的:\(C_{i, j}\) 等于已知属于组 \(i\) 且被预测为属于组 \(j\) 的观测数。

因此在二分类中,真阴性的计数是 \(C_{0,0}\) ,假阴性是 \(C_{1,0}\) ,真阳性是 \(C_{1,1}\) ,假阳性是 \(C_{0,1}\)

更多信息请参阅 用户指南

Parameters:
y_true形状为 (n_samples,) 的类数组

地面真值(正确的)目标值。

y_pred形状为 (n_samples,) 的类数组

分类器返回的估计目标。

labels形状为 (n_classes,) 的类数组,默认=None

用于索引矩阵的标签列表。这可以用于重新排序或选择标签的子集。 如果给定 None ,则按排序顺序使用在 y_truey_pred 中至少出现一次的标签。

sample_weight形状为 (n_samples,) 的类数组,默认=None

样本权重。

Added in version 0.18.

normalize{‘true’, ‘pred’, ‘all’},默认=None

对混淆矩阵在真实(行)、预测(列)条件下或所有总体上进行归一化。如果为 None,则混淆矩阵不会被归一化。

Returns:
C形状为 (n_classes, n_classes) 的 ndarray

混淆矩阵,其第 i 行和第 j 列条目表示真实标签为第 i 类且预测标签为第 j 类的样本数。

See also

ConfusionMatrixDisplay.from_estimator

给定估计器、数据和标签绘制混淆矩阵。

ConfusionMatrixDisplay.from_predictions

给定真实和预测标签绘制混淆矩阵。

ConfusionMatrixDisplay

混淆矩阵可视化。

References

[1]

Wikipedia 关于混淆矩阵的条目 (Wikipedia 和其他参考文献可能使用不同的轴约定)。

Examples

>>> from sklearn.metrics import confusion_matrix
>>> y_true = [2, 0, 2, 2, 0, 1]
>>> y_pred = [0, 0, 2, 2, 0, 2]
>>> confusion_matrix(y_true, y_pred)
array([[2, 0, 0],
       [0, 0, 1],
       [1, 0, 2]])
>>> y_true = ["cat", "ant", "cat", "cat", "ant", "bird"]
>>> y_pred = ["ant", "ant", "cat", "cat", "ant", "cat"]
>>> confusion_matrix(y_true, y_pred, labels=["ant", "bird", "cat"])
array([[2, 0, 0],
       [0, 0, 1],
       [1, 0, 2]])

在二分类情况下,我们可以如下提取真阳性等:

>>> tn, fp, fn, tp = confusion_matrix([0, 1, 0, 1], [1, 1, 1, 0]).ravel()
>>> (tn, fp, fn, tp)
(0, 2, 1, 1)