了解平均精度均值 (mAP) 在评估自动驾驶和医疗保健等 AI 应用中的目标检测模型时的重要性。
平均精度均值 (mAP) 是 计算机视觉中广泛使用的关键评估指标,尤其是在目标检测任务中。它提供了一个综合评分,通过测量模型在所有对象类别中预测的准确性来总结模型的性能。mAP 评分考虑了分类的正确性(对象是否与模型所说的相符?)以及定位的质量(预测的边界框与实际对象的位置匹配程度如何?)。由于它提供了平衡的评估,因此 mAP 已成为比较不同目标检测模型(如 Ultralytics YOLO)性能的标准指标。
为了理解mAP,首先掌握其核心组成部分会很有帮助:精确率(Precision)、召回率(Recall)和交并比(Intersection over Union,IoU)。
mAP 计算综合了这些概念。对于每个对象类别,通过在各种 置信度分数 阈值下绘制精确率与召回率,生成 精确率-召回率曲线。该类别的平均精确率 (AP) 是此曲线下的面积,提供了一个代表模型在该特定类别上的性能的单一数字。最后,通过取所有对象类别的 AP 分数的平均值来计算 mAP。一些评估方案,如流行的 COCO 数据集 的评估方案,通过平均多个 IoU 阈值上的 mAP 来进一步提供更强大的评估。
虽然与其他的评估指标相关,但 mAP 有其独特的用途。
标准化的基准数据集对于推进目标检测领域至关重要。PASCAL VOC 和COCO等数据集使用 mAP 作为其主要指标,用于对公共排行榜上的提交内容进行排名。这使得研究人员和从业人员能够客观地比较不同的模型,例如YOLOv8和YOLO11。
诸如 Ultralytics HUB 这样的平台突出显示 mAP,以帮助用户在模型训练和验证期间跟踪性能。为这些模型提供支持的底层深度学习框架(如 PyTorch 和 TensorFlow)提供了构建和训练模型的必要工具,这些模型最终使用 mAP 进行评估。
mAP 指标是开发可靠的 AI 系统的基础。