敬请关注 YOLO Vision 2025!
2025年9月25日
英国夏令时 10:00 - 18:00
混合活动
Yolo Vision 2024
词汇表

锚箱

了解锚点盒如何实现基于锚点的物体检测、分类先验、回归和 NMS,并应用于自动驾驶和零售业。

锚点框是许多基于锚点的物体检测模型的基础组件,是一组预定义的具有特定高度和宽度的参考框。这些方框可作为图像中物体潜在位置和比例的先验或有根据的猜测。模型不会盲目地搜索物体,而是将这些锚点作为起点,预测偏移量,以完善其位置和大小,从而与实际物体相匹配。这种方法将复杂的物体定位任务转化为一个更易处理的回归问题,即模型学会调整这些模板,而不是从头开始生成方框。

锚箱的工作原理

其核心机制是在图像的不同位置铺设密集的锚点网格。在每个位置,都使用了不同比例和长宽比的多个锚点,以确保能有效检测到不同形状和大小的物体。在模型训练过程中,检测器的主干系统首先从输入图像中提取特征图。然后,检测头利用这些特征为每个锚点框执行两项任务:

  • 分类:它能预测锚点框中包含相关对象的概率,并给出类别标签和置信度分数
  • 回归:它可以计算将锚框转换为紧紧包围对象的最终边界框所需的精确调整(或偏移)。

在训练过程中,该模型使用交集大于联合(IoU)等指标来确定哪些锚点框与地面实况对象最为匹配。预测完成后,会应用一个名为 "非最大值抑制"(NMS)的后处理步骤,以消除同一对象的多余和重叠锚点。

锚箱与其他概念的比较

必须将锚框与计算机视觉中的相关术语区分开来:

  • 边界框锚点框是检测过程中使用的预定义模板,而边界框则是精确定位检测对象的最终精细输出。
  • 无锚检测器:虽然YOLOv5Faster R-CNN系列等基于锚点的模型依赖于这些预设,但现代架构已越来越多地转向无锚点检测器Ultralytics YOLO11等模型通过识别关键点或中心直接预测物体位置,从而简化了模型设计,并提高了对非常规形状物体的性能。您可以阅读更多有关YOLO11 无锚设计优势的信息。

实际应用

锚点盒的结构化方法使其在对象具有可预测形状和大小的情况下非常有效。

  1. 自动驾驶:在汽车行业的解决方案中,基于锚点的探测器在识别汽车、行人和交通标志方面表现出色。这些物体相对一致的长宽比与预定义的锚点非常吻合,因此英伟达(NVIDIA)和特斯拉(Tesla)等公司开发的系统能够进行可靠的检测。
  2. 零售分析:对于人工智能驱动的库存管理,这些模型可以高效地扫描货架以清点产品。包装商品的统一尺寸和形状使其成为基于锚的方法的理想候选对象,有助于实现库存监控自动化并减少人工操作。

这些模型通常使用PyTorchTensorFlow 等强大的深度学习框架开发。对于继续学习,DeepLearning.AI等平台提供了有关计算机视觉基础的综合课程。

加入 Ultralytics 社区

加入人工智能的未来。与全球创新者联系、协作和共同成长

立即加入
链接已复制到剪贴板