了解混淆矩阵如何评估分类性能。探索 TP、FP、TN 和 FN,以优化您的 Ultralytics YOLO26 模型,提高准确性。
混淆矩阵是机器学习 classify 问题的一种性能度量工具,其输出可以是两个或更多类别。 它是一个包含预测值和实际值四种不同组合的表格,作为模型评估中 数据可视化 的基本要素。 与简单准确率不同,如果数据集不平衡,简单准确率可能会产生误导,而混淆矩阵提供了 计算机视觉 (CV) 模型出错的详细分析。 通过将预测结果与 真实标签 进行比较,开发人员可以确定系统是否混淆了两个特定类别,或者完全未能 detect 某个物体。
该矩阵本身通常分为四个象限用于二分类,尽管对于Ultralytics YOLO26处理的多类别问题,它会进行扩展。这四个组成部分代表了模型预测与图像中实际存在情况的交集。
混淆矩阵中的原始数据用于计算描述模型性能的更高级指标。理解这些派生指标对于优化神经网络至关重要。
混淆矩阵定义的具体错误成本决定了模型如何针对不同行业进行调整。
在医疗AI领域,混淆矩阵关乎安全。当训练用于医学图像分析以detect肿瘤的模型时,假阴性(漏诊肿瘤)远比假阳性(将良性斑点标记为可疑,供医生复查)糟糕。因此,工程师在这些矩阵中优先考虑召回率(Recall)而非精确率(Precision),以确保不遗漏任何潜在健康风险。
相反,在制造业质量控制中,效率是关键。如果一个对装配线零件进行classify的系统产生过多的假阳性(将合格零件标记为有缺陷),就会导致不必要的浪费并减缓生产。在这种情况下,混淆矩阵帮助工程师调整模型以最大化精确率(Precision),确保被拒绝的确实是有缺陷的,从而简化自动化机器学习工作流程。
在使用现代框架时,生成此矩阵通常是标准验证流程的一部分。以下示例演示了如何验证一个
YOLO26模型 并使用 访问混淆矩阵数据 ultralytics 包装
from ultralytics import YOLO
# Load a pre-trained YOLO26 model
model = YOLO("yolo26n.pt")
# Validate the model on the COCO8 dataset
# This automatically generates and plots the confusion matrix
metrics = model.val(data="coco8.yaml")
# Access the confusion matrix object directly
print(metrics.confusion_matrix.matrix)
区分混淆矩阵与相似的评估术语非常重要。
开启您的机器学习未来之旅