术语表

回顾

了解什么是机器学习中的 Recall,为什么它很重要,以及它如何确保人工智能模型有效捕捉关键的积极实例。

使用Ultralytics HUB 对YOLO 模型进行简单培训

了解更多

召回率是机器学习(ML)和统计分类中的一个重要性能指标,用于衡量模型识别数据集中所有相关实例的能力。具体来说,它量化了被模型正确预测为阳性的实际阳性案例的比例。Recall 也称为灵敏度或真阳性率 (TPR),在未能检测到阳性实例(假阴性)会带来严重后果的情况下,Recall 尤为重要。它有助于回答以下问题"在所有实际的阳性实例中,模型正确识别了多少?对模型进行评估需要了解各种指标,而 Recall 则提供了一个关于完整性的重要视角。

如何计算召回率

Recall 的计算方法是用真阳性(TP)的数量除以真阴性和假阴性(FN)的总和。真阳性是指被正确识别为阳性的实例,而假阴性是指被模型错误地分类为阴性的阳性实例。高召回分数表明模型能有效地找到数据中的大部分正向实例。这一指标是评估模型性能的基础,尤其是在物体检测图像分类等任务中。在模型评估过程中,Ultralytics HUB等工具和平台通常会同时显示 Recall 和其他指标。

召回与相关指标相关指标

要了解召回率,往往需要将其与其他常见的评价指标进行比较:

  • 准确率Recall 侧重于捕捉所有实际的正向实例,而 Precision 则衡量模型做出的正向预测的准确性(TP / (TP + 假阳性))。精度和召回率之间往往存在权衡;提高一个精度可能会降低另一个精度。这就是所谓的精度-召回权衡
  • 准确度准确度衡量的是模型在所有类别中的整体正确性((TP + 真实负值)/总预测)。然而,准确率可能会产生误导,尤其是在不平衡的数据集上,一个类别的数量明显多于其他类别。在这种情况下,少数类别的召回率往往是更有参考价值的指标。
  • F1 分数F1 分数是精确度(Precision)和召回率(Recall)的调和平均值,它提供了一个单一的指标来平衡这两个方面。当您需要在找到所有正向实例(召回率)和确保识别出的实例确实是正向实例(精确率)之间进行折中时,F1 分数非常有用。您可以查看有关YOLO 性能指标的详细指南,了解更多信息。

重要性和应用

高召回率在一些应用中至关重要,因为在这些应用中,遗漏阳性实例的代价很高或很危险。重点是尽量减少误判。

  • 医学图像分析在诊断系统中,例如从扫描图像中检测癌症肿瘤,最大限度地提高召回率至关重要。未能检测出疾病(假阴性)会对患者的健康造成严重影响,因此最好能有一些假阳性(将健康组织标记为潜在病变),可以通过进一步检测排除。医疗保健领域的人工智能在很大程度上依赖于用于筛查的高召回率模型,这为《放射学》等期刊所讨论的进步做出了贡献:人工智能》等杂志所讨论的进展。例如,检测脑肿瘤需要高灵敏度。
  • 欺诈检测:在金融系统中,识别欺诈交易至关重要。高召回率模型可确保大多数实际欺诈企图被抓获,从而最大限度地减少经济损失。虽然这可能会导致标记一些合法交易进行审查(假阳性),但漏掉欺诈交易(假阴性)的成本通常要高得多。许多金融领域的人工智能应用都优先考虑 "召回"(Recall)。
  • 安防系统对于旨在检测入侵者或威胁的监控系统而言,高召回率可确保不会遗漏潜在的危险。错过实际威胁(假阴性)可能会危及安全,这在人工智能驱动的安防应用中就能看到。
  • 制造过程中的质量控制在自动检测系统中,高召回率可帮助识别生产线上几乎所有的缺陷产品,防止缺陷产品流入消费者手中。漏检缺陷(假阴性)会导致客户不满和安全问题。进一步了解人工智能在制造业中的应用

Ultralytics YOLO 模型中的召回率

计算机视觉(CV)和诸如 Ultralytics YOLO等模型中,召回率是与精确度和平均精确度 (mAP)并列的关键指标,用于评估物体检测实例分割等任务的性能。在召回率和精确率之间取得良好的平衡往往是实现强大的实际性能的关键。例如,在比较YOLOv8 和YOLO11 等模型时,召回率有助于了解每个模型识别所有目标对象的能力。用户可以使用以下框架训练自定义模型PyTorchTensorFlow等工具跟踪 Recall Weights & BiasesUltralytics HUB 中的集成功能。了解 Recall 有助于针对特定用例优化模型,可能涉及超参数调整或探索不同的模型架构,如YOLOv10或最新的 YOLO11.Ultralytics 文档等资源提供了全面的培训和评估指南。

阅读全部