两阶段目标检测器
探索两阶段目标检测器的强大功能——专注于精度的解决方案,可在复杂的计算机视觉任务中实现精确的目标检测。
两阶段物体检测器是一类复杂的
深度学习模型,旨在高精度地识别和
高精度地识别和定位图像中的物体。与速度更快的同类产品不同的是,这些架构将物体检测任务分为两个不同的阶段。
物体检测任务分为两个不同的阶段:
识别可能存在物体的潜在区域,然后对这些区域进行分类,同时完善其
坐标。这种分割过程的方法使两阶段检测器成为对精度要求极高的任务的黄金标准。
准确性至关重要,但往往会牺牲速度和计算资源。
计算资源。
两阶段工作流程
两级探测器的结构就像一个漏斗,将数据从广阔的图像缩小到具体的分类对象、
分类对象。这一过程通常包括
骨干网络(如 ResNet)来提取特征、
然后是两个关键阶段:
-
区域建议:第一阶段采用的组件通常称为区域建议网络(RPN)。
该网络扫描主干网生成的特征图,以识别 "感兴趣区域"(RoIs)。
骨干网,以识别 "感兴趣区域"(RoIs)。此时,模型并不对物体进行分类。
它本质上是一个背景过滤器,标记出可能包含某些内容的区域和空区域。
空的区域。这一概念在开创性的
更快的 R-CNN 研究论文中得到了巩固。
-
分类和细化:在第二阶段,提议的区域被集中到一个固定大小的
大小,并输入特定的检测头。这个
头同时执行两项任务:为物体指定一个特定的类别标签(如 "人"、"车辆 "等
"车辆"),并使用
边界框回归调整坐标、
确保边界框与物体紧密贴合。
两阶段检测器 vs. 单阶段检测器
了解双级和单级物体探测器的区别
是为应用选择正确型号的基础。
是为应用选择正确型号的基础。
-
两级检测器(如快速 R-CNN、掩码 R-CNN):这些模型优先考虑精度。通过
通过将提议和分类分开,它们能很好地处理有重叠物体或小细节的复杂场景。
好。不过,这种双重检查机制会带来更高的
推理延迟,因此很难
在需要即时响应的环境中部署。
-
单级探测器(如YOLO、SSD):等架构。
Ultralytics YOLO系列等架构将检测视为单一回归
问题。它们将图像像素直接映射为边界框坐标和类别概率,一次完成。虽然
在历史上不如两阶段模型准确,但现代迭代模型如
YOLO11等现代迭代模型有效地缩小了精度差距,同时
实时推理速度。
历史上的关键架构
有几种结构确定了两阶段检测的演变:
实际应用
由于两级探测器在定位小物体和减少误报方面表现出色
因此,它们在特定行业中仍然非常重要。
-
医学图像分析:
在放射学中,识别 CT 扫描中的小结节或肿瘤需要尽可能高的灵敏度。两阶段
模型,以最大限度地降低漏诊的风险。
人工智能在医疗保健领域的应用研究中都有详细介绍。
-
自动质量检测:
在制造过程中,识别电路板或机加工部件上的微小缺陷需要高分辨率的
分析。两级检测器的精确定位能力有助于检测可能会被更快、粒度更小的模型所遗漏的缺陷。
的缺陷。
实施高精度检测
虽然Ultralytics 专注于最先进的单级型号,但像YOLO11 这样的现代型号也能提供通常与双级探测器相关的高精度,而且速度更快。
高精度,但模型训练和推理速度明显更快。
模型训练和推理。
下面介绍如何使用 ultralytics 软件包,以实现
高精度检测结果:
from ultralytics import YOLO
# Load a high-accuracy pre-trained YOLO11 model (Large variant)
# 'yolo11l.pt' offers a balance of high accuracy comparable to older two-stage models
model = YOLO("yolo11l.pt")
# Run inference on a local image
results = model("path/to/image.jpg")
# Display the results with bounding boxes
results[0].show()
相关概念
-
锚点框预定义方框形状
许多两阶段检测器在提议阶段都会使用锚点框来估计物体的大小和长宽比。
-
非最大抑制(NMS):
一种后处理技术,用于单级和两级探测器,以消除多余的重叠方框、
确保只保留最可靠的检测结果。
-
联合交集 (IoU):
用于衡量预测框与地面实况之间重叠程度的指标,对训练 RPN
和细化头至关重要。