了解什么是 "交集大于联合"(IoU)、它是如何计算的,以及它在物体检测和人工智能模型评估中的关键作用。
交集大于联合(IoU)是计算机视觉(CV)中的一个基本评估指标,尤其适用于物体检测任务。它衡量两个边界之间的重叠程度:模型生成的预测边界框和地面实况边界框,即手工标注的正确轮廓。由此得出的分值介于 0 和 1 之间,用于量化模型在图像中定位物体的准确程度。1 表示完全匹配,0 表示完全没有重叠。这一指标对于评估Ultralytics YOLO11 等模型的定位精度至关重要。
IoU 的核心是计算预测边界框和地面实况边界框的交集(重叠面积)与联合(两个框覆盖的总面积)之比。想象一下两个重叠的正方形。交点 "是两个正方形重叠的区域。结合部 "是两个方框覆盖的总面积,重叠部分只计算一次。通过用 "交集 "除以 "结合部",IoU 提供了一种标准化的测量方法,用于衡量预测方框与实际物体的吻合程度。这一简单而强大的概念是现代深度学习(DL)用于物体检测的基石。
使用 IoU 的一个关键部分是设置 "IoU 阈值"。该阈值是一个预定义值(如 0.5),用于确定预测是否正确。如果预测框的 IoU 分数高于该阈值,则被归类为 "真阳性"。如果得分低于这个阈值,则为 "假阳性"。该阈值直接影响精度和召回率等其他性能指标,也是计算平均精度 (mAP) 的重要组成部分,平均精度是评估COCO 等基准数据集上物体检测模型的标准指标。
IoU 对于验证无数人工智能系统的性能至关重要。下面是几个例子:
IoU 不仅仅是一个评估指标,它也是训练过程本身不可或缺的一部分。许多现代物体检测架构,包括Ultralytics YOLOv8和 YOLO11 的变体,都在其损失函数中直接使用 IoU 或其变体。这些先进的基于 IoU 的损失函数,如 Generalized IoU (GIoU)、Distance-IoU (DIoU) 或 Complete-IoU (CIoU),有助于模型学习预测边界框,这些边界框不仅重叠度高,而且还考虑了中心间距离和长宽比一致性等因素。与传统的回归损失相比,这种方法收敛更快,定位性能更好。您可以在我们的文档中找到不同 YOLO 模型之间的详细比较。
在模型训练和超参数调整过程中监控 IoU 可以帮助开发人员完善模型,从而实现更好的定位。Ultralytics HUB等工具可以跟踪 IoU 和其他指标,从而简化模型改进周期。尽管标准 IoU 用途广泛,但有时并不灵敏,尤其是对于非重叠方框。这一局限性促使了上述IoU 变体的开发。尽管如此,IoU 仍然是计算机视觉评估的基石。
虽然 IoU 至关重要,但了解它与其他指标的关系也很重要: