深圳Yolo 视觉
深圳
立即加入
词汇表

两阶段目标检测器

探索两阶段目标detect器的机制,重点关注区域提议和分类。了解为何像Ultralytics YOLO26这样的现代模型如今处于领先地位。

两阶段目标检测器是计算机视觉中用于识别和定位图像中物体的一类复杂的深度学习 (DL)架构。与执行单次检测的单阶段对应物不同,这些模型将任务分为两个不同的阶段:区域提议和目标分类。这种分阶段方法旨在优先考虑高定位精度,使这些检测器在人工智能 (AI)的发展中具有历史意义。通过将“位置”与“内容”分离,两阶段检测器通常能实现卓越的精度,尤其是在小型或被遮挡的物体上,尽管这通常以增加计算资源和更长的推理延迟为代价。

两阶段过程

两阶段检测器的架构依赖于一种顺序工作流程,模仿人类仔细审视场景的方式。

  1. 区域提议:在第一阶段,模型扫描输入图像以识别可能存在物体的潜在区域。一个被称为区域提议网络 (RPN)的组件会生成一组稀疏的候选框,这些候选框通常被称为感兴趣区域 (RoIs)。此阶段会过滤掉大部分背景,使网络能够将处理能力集中在相关区域。
  2. 分类与细化:在第二阶段,模型使用卷积神经网络(CNN)从这些候选区域中提取特征。然后为每个区域分配一个特定的类别标签(例如,“人”、“车辆”),并细化边界框的坐标以紧密包围对象。

这种架构的显著例子包括R-CNN系列,具体来说是 Faster R-CNNMask R-CNN,它们在多年来为学术基准设定了标准。

与单阶段检测器的比较

区分两阶段模型与一阶段目标检测器(如单次多框检测器(SSD)和Ultralytics YOLO系列)有助于理解。两阶段模型通过单独处理区域来优先考虑准确性,而一阶段模型则将检测视为一个单一的回归问题,将图像像素直接映射到边界框坐标和类别概率。

历史上,这造成了一种权衡:两阶段模型精度更高但速度较慢,而单阶段模型速度更快但精度较低。然而,现代技术进步已经模糊了这一界限。像 YOLO26 这样的最先进模型现在采用端到端架构,其精度可与两阶段检测器媲美,同时保持了 实时推理 所需的速度。

实际应用

由于它们对精度召回率的重视,两阶段检测器通常在安全性与细节比原始处理速度更重要的场景中受到青睐。

  • 医学诊断成像:医疗AI领域,漏诊可能带来严重后果。两阶段架构常用于 医学图像分析,以detectX光片或MRI扫描中的异常,例如肿瘤。这种多步骤过程有助于确保在复杂的组织背景下不会遗漏微小病变,为放射科医生提供高置信度的自动化辅助。
  • 高精度工业检测:智能制造中,自动化视觉检测系统使用这些模型来识别装配线上的微小缺陷。例如,detect 涡轮叶片上的发丝裂纹需要两阶段 detect 器提供的高 IoU 精度,确保只有无缺陷的组件才能进入下一生产阶段。

实施现代 detect

虽然两阶段检测器为高精度视觉奠定了基础,但现代开发者通常会利用先进的单阶段模型,这些模型提供了可比拟的性能,同时部署流程显著简化。Ultralytics Platform 简化了这些模型的训练和部署,高效管理数据集和计算资源。

以下Python示例演示了如何使用现代目标检测工作流加载并运行推理。 ultralytics,实现了与传统两阶段方法相似的高精度结果,但效率更高:

from ultralytics import YOLO

# Load the YOLO26 model, a modern high-accuracy detector
model = YOLO("yolo26n.pt")

# Run inference on an image to detect objects
results = model("https://ultralytics.com/images/bus.jpg")

# Process results (bounding boxes, classes, and confidence scores)
for result in results:
    result.show()  # Display the detection outcomes
    print(result.boxes.conf)  # Print confidence scores

让我们一起共建AI的未来!

开启您的机器学习未来之旅