敬请关注 YOLO Vision 2025!
2025年9月25日
英国夏令时 10:00 - 18:00
混合活动
Yolo Vision 2024
词汇表

基于 Anchor 的检测器

了解基于 Anchor 的检测器如何通过精确定位、尺度适应性和实际应用来革新目标检测。

基于 Anchor 的检测器是目标检测模型中的一个基础类别,广泛应用于计算机视觉领域。这类模型通过使用预定义的 Anchor 框集合来识别和定位图像中的目标,这些 Anchor 框本质上是以各种尺寸和宽高比平铺在图像上的模板网格。模型预测如何平移和缩放这些 Anchor 框,以匹配目标的真实边界框,以及置信度分数,指示目标的存在。这种方法通过将寻找目标的问题转化为相对于这些固定 Anchor 的回归和分类任务,从而简化了问题。

基于 Anchor 的架构的突出例子包括 R-CNN 系列(如 Faster R-CNN)和早期的单阶段检测器(如 SSD (Single Shot MultiBox Detector))以及许多 YOLO 模型,包括非常成功的 Ultralytics YOLOv5

基于 Anchor 的检测器如何工作

基于Anchor的检测背后的核心思想是使用一组预定义的参考框作为起点。在模型训练过程中,检测器学习为每个anchor框执行两个主要任务:

  1. 分类:确定锚框是否包含感兴趣的对象,或者它是否只是背景。
  2. 回归:计算调整锚框所需的精确偏移量(x、y、宽度、高度),使其紧密地包围检测到的对象。

这些预测是由模型的检测头在处理了骨干网络提取的图像特征后做出的。由于单个对象可能被多个锚框检测到,因此使用称为非极大值抑制 (NMS)的后处理步骤来滤除冗余检测并仅保留最合适的框。这些模型的性能通常使用诸如平均精度均值 (mAP)交并比 (IoU)之类的指标来评估。

基于 Anchor 的检测器 vs. 无 Anchor 检测器

近年来,无锚框检测器已成为一种流行的替代方案。与基于锚框的模型不同,无锚框方法直接预测对象的位置和大小,通常通过识别关键点(如对象中心或角点)或预测从点到对象边界的距离,从而无需预定义的锚框形状。

主要区别包括:

  • 复杂性:基于 Anchor 的模型需要仔细设计和调整 Anchor 参数(大小、比例、尺度),这可能取决于数据集。无 Anchor 模型简化了检测头设计。
  • 灵活性: 无锚框方法可以更好地适应具有异常长宽比或固定锚框集无法很好表示的形状的对象。
  • 效率:消除 anchors 可以减少模型需要进行的预测数量,从而可能加快推理并简化后处理。

虽然像 YOLOv4 这样的基于 anchor 的检测器非常成功,但许多现代架构,包括 Ultralytics YOLO11,已经采用了无 anchor 设计,以利用它们在简单性和效率方面的优势。您可以探索 YOLO11 中无 anchor 检测的优势,并查看 不同 YOLO 模型之间的比较

实际应用

基于 Anchor 的检测器广泛应用于目标具有相对标准形状和尺寸的各种应用中。

  • 自动驾驶:在汽车行业的解决方案中,这些检测器非常适合识别车辆、行人和交通标志。这些对象的可预测形状与预定义的锚点非常吻合,从而为像 NVIDIATesla 这样的公司实现了可靠的检测。
  • 零售分析:对于AI 驱动的库存管理,基于 Anchor 的模型可以有效地扫描货架以清点产品。包装商品的统一尺寸和形状使其成为此方法的理想选择,有助于实现库存监控的自动化。
  • 安全与监控: 在固定监控摄像头拍摄的视频中识别人或车辆是另一个强大的用例。这是构建诸如Ultralytics安全警报系统指南等应用的基础。

工具与训练

开发和部署目标检测模型(无论是基于 anchor 的还是无 anchor 的)涉及使用诸如 PyTorchTensorFlow 之类的框架以及诸如 OpenCV 之类的库。诸如 Ultralytics HUB 之类的平台为训练自定义模型、管理数据集和部署解决方案提供了简化的工作流程,支持各种模型架构。为了进一步学习,像 Papers With Code 这样的资源列出了最先进的模型,并且来自诸如 DeepLearning.AI 之类的平台的课程涵盖了基础概念。

加入 Ultralytics 社区

加入人工智能的未来。与全球创新者联系、协作和共同成长

立即加入
链接已复制到剪贴板