遇见 YOLO26: 下一代视觉 AI。
Ultralytics
返回 Ultralytics 词汇表

Anchor-Based Detectors

探索基于锚点的检测器如何使用预定义的边界框进行目标检测。了解它们的核心机制、实际应用案例,以及它们与现代、更快的 Ultralytics YOLO26 的对比。

基于锚框的检测器是计算机视觉中一类基础的目标检测模型,它们利用一组预定义的边界框来定位和分类对象。这些系统并非尝试从零开始预测物体的坐标,而是从被称为锚框的固定参考模板开始。神经网络随后经过训练,以确定这些模板中哪一个最匹配图像中的物体,并计算出将锚框与目标完美对齐所需的特定偏移量(位置和尺寸的调整)。这种方法将困难的任意坐标预测问题转化为更稳定的回归任务,这是早期深度学习 (DL) 架构(如 Faster R-CNN 和 SSD)开发中的关键突破。

Link to this section基于锚框的机制如何工作#

基于锚框的检测器的核心操作围绕将输入图像划分为密集网格展开。在该网格的每个单元格中,模型会生成多个具有不同尺度和纵横比的锚框,以应对不同物体的形状,例如高大的行人或宽大的车辆。随着图像数据通过模型的骨干网络,网络会提取丰富的特征以执行两项同步任务:

  1. 分类: 模型为每个锚框分配一个概率分数,预测它包含特定类别的物体(例如“汽车”、“狗”)还是仅仅是背景噪声。

  2. 边界框回归: 对于被识别为包含物体的锚框,网络会预测校正因子以优化锚框的中心 x, y 坐标、宽度和高度,从而得出一个紧凑的边界框

模型训练期间,这些检测器使用一种称为交并比 (IoU) 的指标将预定义的锚框与数据集中提供的真值标签进行匹配。重叠度高的锚框被视为正样本。由于此过程会生成数千个潜在检测结果,因此在推理过程中会应用一种称为非极大值抑制 (NMS) 的过滤算法,以消除冗余框,并仅保留每个物体最准确的预测结果。

Link to this section与无锚框检测器的比较#

尽管基于锚框的方法多年来确立了行业标准,但该领域已向无锚框检测器演进。对于现代从业者来说,理解两者之间的区别至关重要。

  • 基于锚框:YOLOv5 和原始的 RetinaNet 这样的模型依赖于手动配置或聚类算法(如 k-means 聚类)来确定数据集的最佳锚框尺寸。这提供了稳定性,但如果物体形状变化巨大,可能会显得过于僵化。
  • 无锚框: 现代架构(包括 YOLO26)通常完全移除了锚框阶段。它们直接从特征图像素预测物体中心和尺寸,从而降低了计算开销并简化了超参数搜索。这种“端到端”方法在处理多样化数据时通常更快且更易于训练。

Link to this section实际应用#

在许多传统的和专门的生产系统中,如果物体形状是可预测且一致的,基于锚框的逻辑依然具有相关性。

  • 交通监控: 在智能交通系统中,摄像头检测车辆以管理车流或识别违规行为。由于汽车和卡车具有标准化的尺寸,基于锚框的模型可以通过特定的先验信息进行调整,以最大化精确率和召回率
  • 零售自动化: 自动结账系统使用计算机视觉来识别产品。由于谷物盒等包装商品保持固定的纵横比,锚框为网络提供了强大的先验信息,帮助其在杂乱的场景中区分外观相似的物品。

Link to this section实现示例#

虽然最新的 YOLO26 模型利用无锚框头部以获得卓越性能,但运行检测的接口保持一致。Ultralytics 平台 和 Python API 抽象了模型是使用锚框还是中心点的复杂性,让用户能够专注于结果本身。

以下是如何加载模型并运行推理来检测物体的方法,该工作流适用于任何底层的锚框架构:

from ultralytics import YOLO

# Load the YOLO26 model (optimized for speed and accuracy)
model = YOLO("yolo26n.pt")

# Run inference on an image source
# The model handles internal logic (anchor-based or anchor-free) automatically
results = model.predict("https://ultralytics.com/images/bus.jpg")

# Display the first result with bounding boxes
results[0].show()

Link to this section延伸阅读#

为了加深对检测机制的理解,请探索引入区域提议网络 (RPN) 的 Faster R-CNN 基础研究,或阅读关于为速度优化基于锚框检测的 单阶段多框检测器 (SSD) 的内容。为了更广阔地了解该领域,COCO 数据集 是评估基于锚框和无锚框模型的标准基准。此外,Coursera 上的高级课程通常涵盖边界框回归和锚框匹配的数学细节。

Explore solutions

Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。

了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。

了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。

了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。

了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。

了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。

了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。

了解更多
Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。

了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。

了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。

了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。

了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。

了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。

了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。

了解更多
Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。

了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。

了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。

了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。

了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。

了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。

了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。

了解更多

让我们一起构建 AI 的未来!

开启你的机器学习未来之旅