敬请关注 YOLO Vision 2025!
2025年9月25日
英国夏令时 10:00 - 18:00
混合活动
Yolo Vision 2024
词汇表

单阶段目标检测器

了解像 YOLO 这样的单阶段目标检测器的速度和效率,它是机器人技术和监控等实时应用的理想选择。

单阶段目标检测器是一类为提高计算机视觉的速度和效率而设计的深度学习模型。它们通过神经网络的单次统一传递来执行目标定位和分类。这与更复杂的双阶段目标检测器形成对比,后者将任务分解为两个不同的步骤。通过将目标检测视为一个直接的回归问题,单阶段模型直接从图像特征预测边界框和类别概率,使其速度极快,适合需要实时推理的应用。

单阶段检测器的工作原理

单阶段检测器通过单个卷积神经网络 (CNN)一次性处理整个图像。该网络的架构旨在同时执行多项任务。首先,网络的主干网络执行特征提取,创建输入图像在各种尺度上的丰富表示。然后,这些特征被馈送到专门的检测头中。

此 head 负责预测一组边界框,每个框的置信度分数(指示对象是否存在),以及每个对象属于特定类别的概率。整个过程在一次前向传递中完成,这是它们速度快的关键。然后使用诸如非极大值抑制 (NMS)之类的技术来滤除冗余和重叠的检测,以生成最终输出。这些模型使用专门的损失函数进行训练,该函数结合了定位损失(边界框的准确程度)和分类损失(类别预测的准确程度)。

与双阶段目标检测器的比较

主要区别在于方法。单阶段检测器专为速度和简单性而构建,而两阶段检测器则优先考虑准确性,尽管随着新型号的出现,这种区别正变得越来越不明显。

  • 单阶段检测器: 这些模型,例如 YOLO (You Only Look Once) 系列,以单个步骤执行检测。它们通常更快,并且具有更简单的架构,使其成为边缘设备和实时应用的理想选择。无锚框检测器的开发进一步提高了它们的性能和简易性。
  • 两阶段目标检测器: 像R-CNN系列及其更快的变体这样的模型首先生成一组稀疏的区域提议,这些区域可能是对象所在的位置。在第二阶段,一个单独的网络对这些提议进行分类并细化边界框坐标。这种两步过程通常会产生更高的精度,特别是对于小对象,但代价是推理速度明显较慢。Mask R-CNN 是一个众所周知的例子,它将这种方法扩展到实例分割

关键架构与模型

已经开发了几种有影响力的单阶段架构,每种架构都有其独特的贡献:

  • YOLO (You Only Look Once): YOLO 在一篇 具有开创性的 2015 年论文 中被引入,它将目标检测定义为一个单一的回归问题。随后的版本,包括 YOLOv8 和最先进的 Ultralytics YOLO11,不断改进速度和准确性之间的平衡。
  • 单次检测器 (SSD)SSD 架构是另一个开创性的一阶段模型,它使用多尺度特征图来检测各种大小的对象,从而提高了原始 YOLO 的准确性。
  • RetinaNet:该模型引入了 Focal Loss,这是一种新颖的损失函数,旨在解决密集检测器训练期间遇到的极端类别不平衡问题,使其能够超越当时许多两阶段检测器的准确性。
  • EfficientDet:由 Google Research 开发的一系列模型,通过使用复合缩放方法和新颖的 BiFPN 特征网络,专注于可扩展性和效率。您可以了解它与其他模型(如 YOLO11 与 EfficientDet)的比较。

实际应用

单阶段检测器的速度和效率使其在众多 AI 驱动的应用程序中不可或缺:

  1. 自动驾驶汽车:在用于自动驾驶汽车的 AI 中,单阶段检测器对于实时感知环境至关重要。它们可以立即识别和跟踪行人、骑自行车的人、其他车辆和交通标志,从而使车辆的导航系统能够在瞬间做出关键决策。像 Tesla 这样的公司在其 Autopilot 系统中也采用了类似的原理。
  2. 智能安全和监控: 单阶段模型通过分析视频源以检测未经授权的进入或可疑活动等威胁来为现代安全系统提供支持。例如,可以训练一个系统来计算队列中的人数以进行队列管理,或者识别机场中遗弃的行李,所有这些都是实时的。

优势与局限性

单阶段检测器的主要优点是其惊人的速度,这使得在各种硬件上实现实时对象检测成为可能,包括低功耗边缘 AI 设备,如 NVIDIA JetsonRaspberry Pi。它们更简单的端到端架构也使它们更容易使用 PyTorchTensorFlow 等框架进行训练和部署。

从历史上看,主要的限制是与两阶段检测器相比,精度较低,尤其是在处理非常小或严重遮挡的物体时。然而,正如在 YOLO11 等模型中所见,模型架构和训练技术的最新进展已显着缩小了这种性能差距,为各种 计算机视觉任务 提供了速度和高精度的强大组合。诸如 Ultralytics HUB 之类的平台进一步简化了针对特定需求训练自定义模型的过程。

加入 Ultralytics 社区

加入人工智能的未来。与全球创新者联系、协作和共同成长

立即加入
链接已复制到剪贴板