术语表

探测头

了解检测头在物体检测中的关键作用,完善特征图,精确定位物体位置和类别。

检测头是物体检测架构中的一个关键组件,负责对图像或视频中物体的存在、位置和类别进行最终预测。它位于神经网络的末端,接收由模型的骨干和颈部生成的经过处理的特征图,并将其转化为有形的输出。具体来说,检测头主要执行两项任务:将潜在物体划分为预定义的类别(如 "汽车"、"人"、"狗"),并进行回归以预测包围每个检测到的物体的边界框的确切坐标。

探测头的工作原理

在用于物体检测的典型卷积神经网络(CNN)中,输入图像会经过一系列层。初始层(骨干层)提取边缘和纹理等低级特征,而更深的层则捕捉更复杂的模式。检测头是合成这些高级特征的最后阶段,以产生所需的输出。

检测头的设计是区分各种物体检测模型的关键因素。有些检测头的设计追求速度,因此适合在边缘设备上进行实时推理,而另一些检测头则为实现最高精度而进行了优化。检测模型的性能(通常用平均精度(mAP)等指标来衡量)在很大程度上受到检测头有效性的影响。您可以探索模型比较,了解不同架构的性能表现。

现代架构中的探测头

现代深度学习在检测头设计方面取得了重大发展。基于锚的 检测头和无锚检测头之间的区别尤为重要。

  • 基于锚点的云台:这些传统的云台使用一组不同大小和长宽比的预定义框(锚点)。云台会预测如何移动和缩放这些锚点,以匹配图像中的地面实况对象。
  • 无锚头:包括Ultralytics YOLO11 在内的最新模型通常使用无锚头。这些头直接预测物体位置,例如通过识别物体中心等关键点。这种方法可以简化模型设计,提高具有特殊形状的物体的灵活性,本博客将详细介绍YOLO11 无锚头的优势

这些组件的开发依赖于PyTorchTensorFlow 等强大的框架,它们提供了构建和训练自定义模型的工具。Ultralytics HUB等平台进一步简化了这一过程。

实际应用

检测头的有效性直接影响着众多基于物体检测的人工智能应用的性能。

  1. 自动驾驶汽车在自动驾驶汽车中,探测头对于实时识别和定位行人、其他车辆和交通标志至关重要。这些预测的速度和准确性对于安全导航至关重要,Waymo 等公司大量采用了这一技术。这就要求检测头具有强大的功能,能够处理各种动态环境。
  2. 安全与监控探测头通过识别未经授权的个人、被遗弃的物体或视频信号中的特定事件,为自动监控系统提供动力。这一功能是Ultralytics 安全警报系统指南等应用的基础。
  3. 医学图像分析检测头可帮助放射科医生精确定位医学扫描中的肿瘤或骨折等异常现象,有助于更快、更准确地进行诊断。您可以阅读 "使用 YOLO11 进行肿瘤检测",了解有关此应用的更多信息。
  4. 制造业:在工厂中,检测头可在装配线上发现产品缺陷,从而实现自动化生产质量控制
  5. 零售分析:这些组件用于库存管理和分析顾客流量模式等应用。

YOLOv8等模型中的复杂检测头是在COCO等大型基准数据集上训练出来的,以确保在各种任务和场景中都能发挥高性能。最终输出结果通常会使用非最大抑制 (NMS)等技术进行改进,以过滤掉多余的检测结果。要想获得更深入的知识,CourseraDeepLearning.AI等提供商的在线课程可提供全面的学习途径。

加入 Ultralytics 社区

加入人工智能的未来。与全球创新者联系、合作和成长

立即加入
链接复制到剪贴板