了解基于 Anchor 的检测器如何通过精确定位、尺度适应性和实际应用来革新目标检测。
基于锚点的检测器是计算机视觉 (CV) 中的一类基本模型。 计算机视觉 (CV)中用于解决物体检测问题的基本模型。 物体检测问题。这些系统依赖于 预定义的边界框(称为 锚点框,作为参考模板平铺在图像上。 锚点框作为参考模板铺满整个图像。网络不需要从头开始预测物体的位置,而是计算如何移动和缩放这些固定的锚点,以紧密贴合图像中的物体。 移动和缩放这些固定锚点的大小,以紧密贴合场景中的物体。这种方法实质上是将 复杂的定位任务转化为结构化回归问题,为 深度学习 (DL)模型学习空间 层次结构。
基于锚点的检测器的工作流程包括在输入图像上生成密集的锚点网格,每个锚点的比例和长宽比各不相同。 不同的比例和长宽比,以捕捉不同大小和形状的物体。当图像通过 模型的主干,提取并分析特征图。 对于每个锚点位置,检测头 检测头同时执行两个 预测:
在模型训练过程中,算法使用一种称为 交集大于联合(IoU)的指标来 确定哪些锚点与已知对象充分重叠。只有IoU 最高的锚点才会被视为 正样本。由于这一过程会产生数以千计的候选方框,因此需要一个称为 非最大值抑制 (NMS) 的后处理步骤,以去除多余的重叠,只保留最准确的检测结果。
重要的是要将这些模型与现代无锚探测器区分开来。 无锚探测器。虽然基于锚的 系统,如最初的Faster R-CNN和 Ultralytics YOLOv5等基于锚的系统则依赖于手动调整锚 维度,而无锚点模型则直接预测物体中心或关键点。
尽管有更新的方法出现,但基于锚点的检测器在许多已建立的管道中仍然很普遍,因为在这些管道中,物体的形状是一致的、可预测的。 形状是一致且可预测的。
您可以使用 ultralytics 包装虽然最新的模型
是无锚的,但该框架支持各种架构。下面的示例演示了如何使用预先训练好的模型
推理:
from ultralytics import YOLO
# Load a pre-trained object detection model
# Note: YOLOv5 is a classic example of an anchor-based architecture
model = YOLO("yolov5su.pt")
# Perform inference on a local image
results = model("path/to/image.jpg")
# Display the resulting bounding boxes and class labels
results[0].show()
了解基于锚点的检测器的机械原理,为掌握计算机视觉的发展和计算机视觉背后的设计选择奠定了坚实的基础。 计算机视觉的发展以及 等先进算法背后的设计选择奠定了坚实的基础。 YOLO11以及未来迭代的 YOLO26。

