了解什么是机器学习中的召回率(Recall),为什么它很重要,以及它如何确保 AI 模型有效地捕获关键的阳性实例。
召回率,也称为灵敏度或真阳性率,是 机器学习 (ML) 和统计学中的一个基本评估指标。它衡量的是模型正确识别数据集中所有相关实例的能力。简单来说,召回率回答了这个问题:“在所有实际阳性实例中,模型正确预测为阳性的有多少?” 高召回率表明该模型能够有效地找到它应该找到的东西,从而最大限度地减少漏报阳性病例(假阴性)的数量。在未能检测到阳性病例会产生重大后果的应用中,此指标尤为重要。
在许多现实场景中,漏检(错过检测)的成本远高于误报(虚假警报)的成本。因此,优先考虑高召回率至关重要。例如,在医学图像分析或欺诈检测等任务中,高召回率模型可确保尽可能多地捕获真实案例以供进一步审查,即使这意味着某些非案例被错误地标记。
在计算机视觉 (CV)和像Ultralytics YOLO这样的模型中,召回率是一个关键指标,与精确率和平均精度均值 (mAP)一起用于评估目标检测和实例分割等任务的性能。在召回率和精确率之间取得良好的平衡通常对于强大的实际性能至关重要。例如,在比较YOLOv8与YOLO11等模型时,召回率有助于了解每个模型识别所有目标对象的程度。用户可以使用PyTorch或TensorFlow等框架训练自定义模型,并使用Weights & Biases或Ultralytics HUB中的集成功能跟踪召回率。了解召回率有助于优化特定用例的模型,可能涉及超参数调整或探索不同的模型架构,如YOLOv10或最新的YOLO11。Ultralytics文档等资源提供了关于训练和评估的全面指南。
区分召回率与其他常见的评估指标非常重要。