One-Stage Object Detectors
探索用于高速实时 AI 的单阶段目标检测器。学习 Ultralytics YOLO26 如何为边缘 AI 和部署提供卓越的准确性和效率。
单阶段目标检测器是一类强大的深度学习架构,旨在以极高的速度和效率执行目标检测任务。与将检测过程分为区域建议和后续分类等独立步骤的传统两阶段目标检测器不同,单阶段模型会在单次通过中分析整个图像。通过将检测构建为直接回归问题,这些网络能直接根据输入像素同时预测边界框坐标和类别概率。这种精简的方法显著降低了计算开销,使得单阶段检测器成为需要实时推理以及在资源受限的边缘AI设备上部署的应用程序的首选。
Link to this section核心工作原理#
单阶段检测器的架构通常围绕一个卷积神经网络 (CNN) 构建,该网络充当骨干网络以进行特征提取。当图像通过网络时,模型会生成一个编码空间和语义信息的特征图网格。
早期的实现方案,例如单次多框检测器 (SSD),依赖于各种比例的预定义锚框来定位物体。然而,像Ultralytics YOLO11和最先进的YOLO26等现代进展已在很大程度上转向了无锚框设计。这些较新的架构直接预测物体中心和大小,消除了与锚框相关的复杂超参数调整需求。最终输出由用于定位的坐标向量和代表模型对检测到的物体确定性的置信度分数组成。
Link to this section单阶段与两阶段检测器对比#
区分这两大类模型有助于为特定任务选择合适的工具:
- 单阶段目标检测器:像Ultralytics YOLO系列这样的模型优先考虑较低的推理延迟。它们针对速度进行了优化,非常适合视频流和移动应用程序。最近的迭代版本显著缩小了精度差距,通常在保持实时性能的同时,匹配甚至超过了较慢模型的精度。
- 两阶段目标检测器:诸如R-CNN家族之类的架构首先生成区域建议,然后进行分类。尽管在历史上对于小目标或遮挡目标能提供更高的精度,但它们会产生更高的计算成本,且速度通常较慢,从而限制了它们在时间敏感场景中的使用。
Link to this section实际应用#
单阶段检测器的高效性推动了它们在各行各业的广泛应用,这些行业对即时响应性有着严苛要求:
- 自动驾驶汽车:自动驾驶汽车需要即时处理视频馈送,以识别行人、交通标志和其他车辆。该领域的领导者依赖高速视觉系统在复杂的环境中安全导航,并通常结合目标追踪与检测技术。
- 智能制造:在高速流水线上,这些模型通过实时检测缺陷或验证组件放置来执行自动质量控制。这确保了生产效率且不会产生瓶颈,通常通过Ultralytics Platform集成以实现轻松部署。
- 边缘AI与物联网:其轻量化的特性使得单阶段检测器非常适合诸如Raspberry Pi或NVIDIA Jetson等物联网设备,从而无需持续的云连接即可将先进的智能能力带给远程摄像头和无人机。
Link to this section使用Python进行技术实现#
Implementing a one-stage detector is straightforward using modern high-level APIs. To ensure accurate results, models often predict multiple potential boxes, which are then filtered using techniques like Non-Maximum Suppression (NMS) based on Intersection over Union (IoU) thresholds, though newer end-to-end models like YOLO26 handle this natively.
以下Python示例展示了如何加载最先进的YOLO26模型并在图像上执行推理:
from ultralytics import YOLO
# Load the YOLO26 model, the latest natively end-to-end one-stage detector
model = YOLO("yolo26n.pt")
# Run inference on an image URL to detect objects
results = model("https://ultralytics.com/images/bus.jpg")
# Display the first result with bounding boxes and labels
results[0].show()Link to this section现代单阶段架构的优势#
单阶段检测器的演进专注于克服“精度与速度”之间的权衡。例如,引入了焦点损失 (Focal Loss)来解决训练期间的类别不平衡问题,确保模型专注于难以分类的样本,而不是数量众多的背景。此外,特征金字塔网络 (FPN)的集成使得这些模型能够有效地检测不同比例的物体。
如今,研究人员和开发人员可以使用像Ultralytics Platform这样的工具轻松地在自定义数据集上训练这些高级架构,该平台简化了从数据标注到模型部署的工作流程。无论是用于农业还是医疗保健,单阶段检测器的易用性正在使强大的计算机视觉能力大众化。






