深圳Yolo 视觉
深圳
立即加入
词汇表

基于 Anchor 的检测器

了解基于 Anchor 的检测器如何通过精确定位、尺度适应性和实际应用来革新目标检测。

基于锚点的检测器是计算机视觉 (CV) 中的一类基本模型。 计算机视觉 (CV)中用于解决物体检测问题的基本模型。 物体检测问题。这些系统依赖于 预定义的边界框(称为 锚点框,作为参考模板平铺在图像上。 锚点框作为参考模板铺满整个图像。网络不需要从头开始预测物体的位置,而是计算如何移动和缩放这些固定的锚点,以紧密贴合图像中的物体。 移动和缩放这些固定锚点的大小,以紧密贴合场景中的物体。这种方法实质上是将 复杂的定位任务转化为结构化回归问题,为 深度学习 (DL)模型学习空间 层次结构。

基于锚点的检测机制

基于锚点的检测器的工作流程包括在输入图像上生成密集的锚点网格,每个锚点的比例和长宽比各不相同。 不同的比例和长宽比,以捕捉不同大小和形状的物体。当图像通过 模型的主干,提取并分析特征图。 对于每个锚点位置,检测头 检测头同时执行两个 预测:

  1. 分类:模型会分配一个概率分数,显示锚点是包含特定类别的物体,还是仅仅是背景噪声。 特定类别的物体,还是仅仅是背景噪音。
  2. 边框回归:模型预测偏移值(中心、宽度和高度的坐标 高度的坐标),以调整锚点的尺寸,使其与地面实况边框相匹配。 边界框

模型训练过程中,算法使用一种称为 交集大于联合(IoU)的指标来 确定哪些锚点与已知对象充分重叠。只有IoU 最高的锚点才会被视为 正样本。由于这一过程会产生数以千计的候选方框,因此需要一个称为 非最大值抑制 (NMS) 的后处理步骤,以去除多余的重叠,只保留最准确的检测结果。

基于锚点的架构与无锚点的架构

重要的是要将这些模型与现代无锚探测器区分开来。 无锚探测器。虽然基于锚的 系统,如最初的Faster R-CNNUltralytics YOLOv5等基于锚的系统则依赖于手动调整锚 维度,而无锚点模型则直接预测物体中心或关键点。

  • 基于锚点:需要定义锚点大小和比例的超参数,这可能对特定数据集很敏感。 对特定数据集敏感。对于标准对象来说,它们历来都是稳健的。
  • 无锚:无需预设框,简化了架构,减少了计算开销。 计算开销。最先进的 Ultralytics YOLO11利用无锚方法 实现了卓越的速度和灵活性,尤其适用于几何形状不规则的物体。您可以阅读更多关于 无锚设计的 YOLO11无锚设计的优势 中无锚设计的优势。

实际应用

尽管有更新的方法出现,但基于锚点的检测器在许多已建立的管道中仍然很普遍,因为在这些管道中,物体的形状是一致的、可预测的。 形状是一致且可预测的。

  • 自动驾驶:在开发 系统必须可靠 detect 汽车、卡车和交通标志。由于车辆通常保持一致的长宽比,因此基于锚点的 模型对行业领导者如 WaymoMobileye 等行业领先企业所使用的感知堆栈。
  • 零售库存管理:对于 人工智能在零售业的应用:摄像头监控货架,track 库存水平。 库存水平。谷物盒或饮料罐等产品具有标准化的形状,可与经过调整的 锚定模板完美对齐,从而实现高精度计数和物体跟踪。 物体跟踪

利用Ultralytics实施

您可以使用 ultralytics 包装虽然最新的模型 是无锚的,但该框架支持各种架构。下面的示例演示了如何使用预先训练好的模型 推理:

from ultralytics import YOLO

# Load a pre-trained object detection model
# Note: YOLOv5 is a classic example of an anchor-based architecture
model = YOLO("yolov5su.pt")

# Perform inference on a local image
results = model("path/to/image.jpg")

# Display the resulting bounding boxes and class labels
results[0].show()

了解基于锚点的检测器的机械原理,为掌握计算机视觉的发展和计算机视觉背后的设计选择奠定了坚实的基础。 计算机视觉的发展以及 等先进算法背后的设计选择奠定了坚实的基础。 YOLO11以及未来迭代的 YOLO26

加入Ultralytics 社区

加入人工智能的未来。与全球创新者联系、协作和共同成长

立即加入