深圳Yolo 视觉
深圳
立即加入
词汇表

混淆矩阵

通过混淆矩阵了解模型性能。探索各项指标、实际应用以及优化 AI 分类准确性的工具。

混淆矩阵是机器学习(ML)中使用的一种综合性能测量工具。 混淆矩阵是机器学习(ML)中用来评估分类模型准确性的一种综合性能测量工具。 分类模型的准确性。与简单的准确率得分不同、 只告诉你正确预测的百分比不同,混淆矩阵提供了一个细化的 模型如何对每个类别进行分类。它直观地显示了预测标签与实际地面实况之间的差异。 真实情况之间的差异,让开发人员能够准确定位模型 "混乱 "或系统性错误的位置。这种 这种详细程度对于完善复杂的 计算机视觉 (CV)系统至关重要,例如那些 构建的 Ultralytics YOLO11.

矩阵的核心组成部分

混淆矩阵将分类器的预测结果分成四个不同的类别,通常采用网格布局。 网格布局。这些成分有助于识别一个模型是否存在特定类型的错误,例如 "误报 "或 "错过目标":

  • 真阳性 (TP):模型能正确预测阳性类别。例如,在 物体检测中,模型成功 识别出过马路的行人。
  • 真阴性 (TN):模型能正确预测负类。在制造领域的人工智能缺陷检测系统中 ,当 模型正确地将功能部件识别为无缺陷。
  • 假阳性 (FP):模型错误地预测了阳性类。这通常称为 I 类错误。举个例子 将摇摆的树枝标记为入侵者。
  • 假阴性 (FN):模型错误地预测了负类。这被称为 第二类错误。如果一个 如果医疗诊断工具未能detect 实际存在的肿瘤,就会出现这种情况。

模型评估的重要性

虽然宽泛的指标对高层次的概览很有用,但在处理 不平衡数据集时至关重要。如果一个数据集包含 95 只猫和 5 只狗,那么一个每次都简单地猜测 "猫 "的模型可以达到 95% 的准确率,但在寻找狗时却毫无用处。 准确率,但在寻找狗时却毫无用处。混淆矩阵会立即显示出这一失败,因为 "狗 "的真阳性为零。 狗 "类的真阳性。

这一细目是计算其他关键绩效指标的基础。 绩效指标的基础。通过分析矩阵 工程师可以得出

  • 精确度:正面预测的准确度(TP / (TP + FP))。
  • 召回(灵敏度):捕获 捕捉所有实际阳性病例的能力(TP / (TP + FN))。
  • F1 评分:精确度和召回率的调和平均值,可均衡反映模型的鲁棒性。

实际应用

混淆矩阵的重要性因具体应用和不同错误的 "成本 "而异。 不同错误的 "代价"。

  • 医疗诊断:在医疗保健领域的人工智能中,假阴性的成本极高。 成本极高。如果设计一个模型来detect X 光片上的肺炎,错过一个阳性病例(FN)可能会延误 挽救生命的治疗。因此,开发人员会分析混淆矩阵,以最大限度地提高召回率,确保即使是细微的 疾病征兆也会被标记出来,供人类检查。您可以阅读更多有关 医学影像评估的更多信息,以了解这些 利害关系。
  • 欺诈检测:在金融系统中,假阳性(将合法交易标记为欺诈行为 欺诈)会惹恼客户,并阻止客户使用资金。然而,假阴性(允许实际欺诈)会造成 直接经济损失。通过使用混淆矩阵,数据科学家可以调整 置信度阈值,找到最佳权衡、 平衡安全性和用户体验。
  • 自动驾驶汽车:对于 对于自动驾驶汽车来说,区分静止物体和移动行人 区分静止物体和移动行人至关重要。混淆矩阵可帮助工程师了解系统是否 是否经常混淆特定类别,例如将灯柱误认为是人,从而进行有针对性的 数据增强来纠正这种行为。

用代码分析结果

"(《世界人权宣言》) ultralytics 库会在验证过程中自动计算并保存混淆矩阵。 混淆矩阵。这样,用户就能直观地看到数据集中所有类别的性能。

from ultralytics import YOLO

# Load the YOLO11 model
model = YOLO("yolo11n.pt")

# Validate the model on a dataset like COCO8
# This generates the confusion matrix in the 'runs/detect/val' directory
results = model.val(data="coco8.yaml")

# You can also programmatically access the matrix data
print(results.confusion_matrix.matrix)

与相关术语的比较

必须将混淆矩阵与衍生指标区分开来。准确率 精确度召回率都是单个数字的总结,而 混淆矩阵是计算这些数字的原始数据来源。它提供的是 "全貌",而不是一个快照。此外,在 对象检测中,矩阵经常与 交集大于联合(IoU 阈值进行交互,以确定什么是真阳性,从而为计算机视觉任务中的评估增加了另一层深度。 计算机视觉任务。

加入Ultralytics 社区

加入人工智能的未来。与全球创新者联系、协作和共同成长

立即加入