了解什么是 Intersection over Union (IoU),它是如何计算的,以及它在对象检测和 AI 模型评估中的关键作用。
交并比 (IoU) 是 计算机视觉 (CV) 中一项基础的评估指标,尤其是在目标检测任务中。它衡量的是两个边界框之间的重叠程度:模型生成的预测边界框和人工标注的正确轮廓(即真实边界框)。最终的评分是一个介于 0 和 1 之间的值,用于量化模型在图像中定位目标的准确程度。分数为 1 表示完全匹配,而分数为 0 表示完全没有重叠。此指标对于评估 Ultralytics YOLO11 等模型的定位精度至关重要。
从本质上讲,IoU 计算的是预测边界框与真实边界框的交集(重叠区域)与并集(两个框覆盖的总面积)之比。想象一下两个重叠的正方形。“交集”是它们重叠的共享区域。“并集”是两个正方形覆盖的总面积,重叠部分仅计算一次。通过将交集除以并集,IoU 提供了一种标准化度量,用于衡量预测框与实际对象的对齐程度。这个简单但强大的概念是现代深度学习 (DL)对象检测的基石。
使用 IoU 的一个关键部分是设置“IoU 阈值”。此阈值是一个预定义的值(例如 0.5),用于确定预测是否正确。如果预测框的 IoU 分数高于此阈值,则将其归类为“真正例”。如果分数低于此阈值,则将其归类为“假正例”。此阈值直接影响其他性能指标,如精确率和召回率,并且是计算平均精度均值 (mAP)的关键组成部分,mAP 是评估 COCO 等基准数据集上目标检测模型的标准指标。
IoU 对于验证无数 AI 系统的性能至关重要。以下是一些示例:
IoU 不仅仅是一个评估指标;它也是训练过程不可或缺的一部分。许多现代目标检测架构,包括 Ultralytics YOLOv8 和 YOLO11 的变体,直接在其损失函数中使用 IoU 或其变体。这些基于 IoU 的高级损失函数,如 Generalized IoU (GIoU)、Distance-IoU (DIoU) 或 Complete-IoU (CIoU),有助于模型学习预测不仅重叠良好,而且还考虑中心之间距离和纵横比一致性等因素的边界框。与传统的回归损失相比,这可以加快收敛速度并提高定位性能。您可以在我们的文档中找到不同 YOLO 模型之间的详细比较。
在模型训练和超参数调优期间监控 IoU 有助于开发人员改进模型,从而获得更好的定位。 诸如Ultralytics HUB之类的工具允许跟踪 IoU 和其他指标,从而简化模型改进周期。 尽管标准 IoU 用途广泛,但有时可能不敏感,尤其是不重叠的框。 这种限制促使了上述IoU 变体的开发。 尽管如此,IoU 仍然是计算机视觉评估的基石。
虽然 IoU 至关重要,但重要的是要了解它与其他指标的关系: