了解YOLO 等单级物体检测器的速度和效率,它们是机器人和监控等实时应用的理想之选。
单级物体检测器是一类 深度学习(DL)模型,在计算机视觉(CV)任务中优化了速度和效率。 在计算机视觉(CV)任务中的速度和效率进行了优化。与 两阶段物体检测器 两阶段物体检测器将检测过程分为区域建议和分类阶段,与之不同的是,单阶段架构在单次评估过程中执行物体检测。 对象检测。通过 这些模型将任务作为一个直接回归问题,同时预测边界框和类概率。 边框和类别概率。 同时预测输入图像的边界框和类概率。这种简化方法大大加快了处理速度,使它们成为 应用的首选。 实时推理。
单级检测器的核心是一个 卷积神经网络(CNN) 的核心是卷积神经网络(CNN 特征提取的支柱。该网络 一次处理整个图像--因此被称为 "只看一次"--创建一个网格特征图。早期的 早期的架构,如单枪多箱检测器(SSD),依赖于预定义的锚点箱来处理不同的图像特征。 依靠预定义的锚点框来处理各种尺度的物体。 不同尺度的对象。然而,现代的迭代产品,如 Ultralytics YOLO11在很大程度上采用了 无锚设计,以降低复杂性和 提高通用性。输出结果通常包括定位坐标和 置信度分数,表示物体存在的可能性。 物体存在的可能性。
单级模型和两级模型的主要区别在于速度和精度之间的权衡。 两阶段架构,如R-CNN 系列,通常能为小型或隐蔽物体提供更高的精度,但由于其多步骤处理过程,会产生更高的计算成本。 但由于其多步骤处理过程,计算成本较高。 相反,单级检测器优先考虑低 推理延迟,从而可以在 资源有限的硬件上部署。最近的进步包括 YOLOv1演进到即将推出的 YOLO26(目标于 2025 年底推出),利用端到端训练和先进的损失函数 和先进的损耗函数来缩小精度差距 差距,通常可达到或超过两阶段模型。
单级检测器的高效率推动了众多领域的创新,在这些领域中,即时响应能力至关重要。 至关重要:
为确保结果准确,这些模型通常会对单个物体的多个潜在方框进行预测。后处理 技术,如 非最大值抑制(NMS)等后处理技术 这些冗余预测基于 交集大于联合 (IoU) 阈值过滤这些冗余预测。使用现代库(如 PyTorch和 Ultralytics Python 软件包。
下面的示例演示了如何使用预训练的YOLO11 模型运行推理:
from ultralytics import YOLO
# Load the YOLO11 model, a state-of-the-art one-stage detector
model = YOLO("yolo11n.pt")
# Run inference on a local image or URL
results = model("https://ultralytics.com/images/bus.jpg")
# Display the detected objects with bounding boxes
results[0].show()