深圳Yolo 视觉
深圳
立即加入
词汇表

平均精度mAP)

了解平均精度mAP) 在评估自动驾驶和医疗保健等人工智能应用的物体检测模型中的重要性。

平均精度mAP) 是用于评估计算机视觉模型,特别是用于评估计算机视觉模型的 计算机视觉模型,特别是那些 用于物体检测实例分割的模型。与简单的 分类精确度只确定图像标签是否正确,而mAP 评估的是一个模型在以下两个方面的能力 正确classify 物体并使用边界框在图像中精确定位物体的能力。 定位。这种双用途评估使其成为 等现代架构的行业标准。 YOLO11等现代架构的行业基准。

mAP的组成部分

要理解mAP,首先必须理解三个基本概念之间的关系: 交集大于联合 (IoU)、 精确度和召回率。

  • 联合交叉(IoU):它测量的是预测方框与地面实况(实际物体位置)之间的空间重叠度。 地面实况(实际物体位置)之间的空间重叠。它是一个从 0 到 1 的比率。较高的IoU 表示 模型的定位非常接近实际情况。
  • 精确度:衡量预测的可靠性。高 高精度意味着当模型预测一个物体时 很可能是正确的,从而将误报率降到最低。
  • 召回:用于衡量模型找到所有现有对象的能力。高 召回率意味着模型能捕捉到场景中的大部分物体 场景中的大部分物体,从而最大限度地减少误判。

mAP 计算包括绘制 精度-调用曲线 曲线。平均精度"AP)基本上就是这条曲线下的面积。最后,mAP 中的 mAP 中的 "平均值 "来自于对数据集中所有类别的这些AP 分数的平均值。 最后,mAP 中的 "平均值 "来自于对数据集中所有类别的 AP 分数进行平均,从而得出一个单一的综合分数。

mAP vs.mAP

在阅读研究论文或模型比较页面时,您会 经常会看到报告中的mAP 有不同的后缀。这些后缀指的是将检测视为 "正确 "的IoU 门限。 "正确"。

  • mAP:如果预测结果与地面实况至少有mAP%的重叠,则该指标认为预测是正确的。 50%.这是旧数据集的标准,如 PascalVOC 等旧数据集的标准。这是一个宽松的指标 是一种宽松的指标,它优先考虑找到目标而不是完全对齐。
  • mAP:COCO 数据集推广,是现代的 现代黄金标准。它将从IoU 0.50 到 0.95 以 0.05 为IoU 计算出的mAP 平均值。这将奖励 不仅能找到物体,而且能以极高的像素级精度定位的模型给予奖励。 Ultralytics YOLO11.

实际应用

由于mAP 同时考虑了误报和漏报,因此在高风险环境中至关重要。

  1. 自动驾驶:在汽车人工智能领域,自动驾驶汽车必须 detect 行人、其他车辆和交通标志。高mAP 分数可确保感知系统不会错过障碍物(高召回率 障碍物(高召回率),同时避免因错误检测导致的虚假制动(高精度)。
  2. 医疗诊断:在 在医学图像分析中,识别肿瘤 或骨折需要高精确度,以避免不必要的活组织检查;还需要高召回率,以确保任何情况都不会得不到治疗。 治疗。医疗保健领域的人工智能依靠mAP 验证模型是否能够可靠地协助放射科医生处理各种患者数据。

区分mAP 与相关指标

必须将mAP 与类似的评估术语区分开来,以便为您的项目选择正确的衡量标准。

  • 与精确度的关系: 准确率是指 正确预测与总预测之比。它在图像分类中效果很好,但在物体检测中却失效了 因为它没有考虑 "背景 "类别或方框的空间重叠。
  • 对比 F1 分数: F1 分数是 精确度和召回率在特定置信度阈值下的调和平均值。虽然 mAP 操作点,但mAP 更稳健,因为它评估的是所有置信度阈值的性能,而不是一个阈值。 mAP 更为稳健,因为它评估的是所有置信度阈值的性能,而不仅仅是一个阈值。

用Python计算mAP

Ultralytics Python 软件包可自动完成计算 mAP 的复杂过程。 计算mAP 的复杂过程。通过在训练有素的模型上运行验证模式,您可以立即检索到 50%阈值和更严格的 50-95% 范围内的mAP 分数。 50%阈值和更严格的 50-95% 范围的 mAP 分数。

from ultralytics import YOLO

# Load the YOLO11 nano model
model = YOLO("yolo11n.pt")

# Validate on the COCO8 dataset (downloads automatically)
metrics = model.val(data="coco8.yaml")

# Access the mAP50-95 attribute from the box metrics
# This returns the mean average precision averaged over IoU 0.5-0.95
print(f"mAP50-95: {metrics.box.map}")

这一工作流程允许开发人员在标准 数据集进行基准测试,确保其应用程序在部署前达到必要的性能标准。 在部署前达到必要的性能标准。

加入Ultralytics 社区

加入人工智能的未来。与全球创新者联系、协作和共同成长

立即加入