词汇表

混淆矩阵

通过混淆矩阵了解模型性能。探索各项指标、实际应用以及优化 AI 分类准确性的工具。

混淆矩阵是机器学习（ML）中使用的一种综合性能测量工具。混淆矩阵是机器学习（ML）中用来评估分类模型准确性的一种综合性能测量工具。分类模型的准确性。与简单的准确率得分不同、只告诉你正确预测的百分比不同，混淆矩阵提供了一个细化的模型如何对每个类别进行分类。它直观地显示了预测标签与实际地面实况之间的差异。真实情况之间的差异，让开发人员能够准确定位模型 "混乱 "或系统性错误的位置。这种这种详细程度对于完善复杂的计算机视觉 (CV)系统至关重要，例如那些构建的 Ultralytics YOLO11.

矩阵的核心组成部分

混淆矩阵将分类器的预测结果分成四个不同的类别，通常采用网格布局。网格布局。这些成分有助于识别一个模型是否存在特定类型的错误，例如 "误报 "或 "错过目标"：

真阳性 (TP)：模型能正确预测阳性类别。例如，在物体检测中，模型成功识别出过马路的行人。
真阴性 (TN)：模型能正确预测负类。在制造领域的人工智能缺陷检测系统中中，当模型正确地将功能部件识别为无缺陷。
假阳性 (FP)：模型错误地预测了阳性类。这通常称为 I 类错误。举个例子将摇摆的树枝标记为入侵者。
假阴性 (FN)：模型错误地预测了负类。这被称为第二类错误。如果一个如果医疗诊断工具未能detect 实际存在的肿瘤，就会出现这种情况。

模型评估的重要性

虽然宽泛的指标对高层次的概览很有用，但在处理不平衡数据集时至关重要。如果一个数据集包含 95 只猫和 5 只狗，那么一个每次都简单地猜测 "猫 "的模型可以达到 95% 的准确率，但在寻找狗时却毫无用处。准确率，但在寻找狗时却毫无用处。混淆矩阵会立即显示出这一失败，因为 "狗 "的真阳性为零。狗 "类的真阳性。

这一细目是计算其他关键绩效指标的基础。绩效指标的基础。通过分析矩阵工程师可以得出

精确度:正面预测的准确度（TP / (TP + FP)）。
召回(灵敏度）：捕获捕捉所有实际阳性病例的能力（TP / (TP + FN)）。
F1 评分:精确度和召回率的调和平均值，可均衡反映模型的鲁棒性。

实际应用

混淆矩阵的重要性因具体应用和不同错误的 "成本 "而异。不同错误的 "代价"。

医疗诊断：在在医疗保健领域的人工智能中，假阴性的成本极高。成本极高。如果设计一个模型来detect X 光片上的肺炎，错过一个阳性病例（FN）可能会延误挽救生命的治疗。因此，开发人员会分析混淆矩阵，以最大限度地提高召回率，确保即使是细微的疾病征兆也会被标记出来，供人类检查。您可以阅读更多有关医学影像评估的更多信息，以了解这些利害关系。
欺诈检测：在金融系统中，假阳性（将合法交易标记为欺诈行为欺诈）会惹恼客户，并阻止客户使用资金。然而，假阴性（允许实际欺诈）会造成直接经济损失。通过使用混淆矩阵，数据科学家可以调整置信度阈值，找到最佳权衡、平衡安全性和用户体验。
自动驾驶汽车：对于对于自动驾驶汽车来说，区分静止物体和移动行人区分静止物体和移动行人至关重要。混淆矩阵可帮助工程师了解系统是否是否经常混淆特定类别，例如将灯柱误认为是人，从而进行有针对性的数据增强来纠正这种行为。

用代码分析结果

"(《世界人权宣言》) ultralytics 库会在验证过程中自动计算并保存混淆矩阵。混淆矩阵。这样，用户就能直观地看到数据集中所有类别的性能。

from ultralytics import YOLO

# Load the YOLO11 model
model = YOLO("yolo11n.pt")

# Validate the model on a dataset like COCO8
# This generates the confusion matrix in the 'runs/detect/val' directory
results = model.val(data="coco8.yaml")

# You can also programmatically access the matrix data
print(results.confusion_matrix.matrix)

与相关术语的比较

必须将混淆矩阵与衍生指标区分开来。准确率 精确度和召回率都是单个数字的总结，而 混淆矩阵是计算这些数字的原始数据来源。它提供的是 "全貌"，而不是一个快照。此外，在对象检测中，矩阵经常与交集大于联合（IoU 阈值进行交互，以确定什么是真阳性，从而为计算机视觉任务中的评估增加了另一层深度。计算机视觉任务。

混淆矩阵

培训Ultralytics YOLO 模型，以简化各行业的工作流程

灵活的企业许可解决方案，助力您的创新

使用Ultralytics YOLO在数秒内训练人工智能模型

矩阵的核心组成部分

模型评估的重要性

实际应用

用代码分析结果

与相关术语的比较

阅读更多此类别的内容

理解为何人机协同标注至关重要

什么是数据集蒸馏？快速概述

Oakley Meta AI眼镜正以视觉人工智能技术重新定义眼镜行业

加入Ultralytics 社区