敬请关注 YOLO Vision 2025!
2025年9月25日
英国夏令时 10:00 - 18:00
混合活动
Yolo Vision 2024
词汇表

检测头

了解检测头在目标检测中的关键作用,它能够优化特征图,从而精确地确定目标位置和类别。

检测头是目标检测架构中的一个关键组件,负责对图像或视频中目标的存在、位置和类别做出最终预测。它位于神经网络的末端,获取由模型的骨干网络和颈部生成的经过处理的特征图,并将它们转换为有形的输出。具体来说,检测头执行两个主要任务:它将潜在目标分类为预定义的类别(例如,“汽车”、“人”、“狗”),并执行回归以预测包围每个检测到的目标的边界框的确切坐标。

检测头的工作原理

在用于目标检测的典型卷积神经网络 (CNN)中,输入图像通过一系列层。初始层(主干)提取低级特征,如边缘和纹理,而更深层捕获更复杂的模式。检测头是合成这些高级特征以产生所需输出的最后阶段。

检测头的设计是各种目标检测模型之间的关键区别。有些检测头专为速度而设计,使其适用于 边缘设备 上的 实时推理,而另一些检测头则针对最大 准确率 进行了优化。检测模型的性能(通常通过诸如 平均精度均值 (mAP) 之类的指标来衡量)在很大程度上受到其检测头有效性的影响。您可以浏览 模型比较,以了解不同架构的性能。

现代架构中的检测头

现代深度学习在检测头设计方面取得了显著进展。 基于Anchor无Anchor检测器之间的区别尤为重要。

  • 基于 Anchor 的 Head: 这些传统 head 使用一组预定义的、具有各种尺寸和纵横比的框(anchor)。 该 head 预测如何移动和缩放这些 anchor,以匹配图像中的 ground-truth 对象。
  • 无锚框检测头(Anchor-Free Heads): 包括 Ultralytics YOLO11 在内,现在更多模型倾向于使用无锚框检测头。这类检测头直接预测目标位置,例如通过识别目标中心点等关键点。这种方法可以简化模型设计,并提高对不规则形状物体的灵活性,更多细节请参考这篇关于 YOLO11 无锚框优势 的博客。

这些组件的开发依赖于强大的框架,如 PyTorchTensorFlow,它们提供了构建和训练自定义模型的工具。Ultralytics HUB 等平台进一步简化了这一过程。

实际应用

检测头的有效性直接影响构建在目标检测之上的众多 AI 应用程序的性能。

  1. 自动驾驶汽车: 在自动驾驶汽车中,检测头对于实时识别和定位行人、其他车辆和交通标志至关重要。这些预测的速度和准确性对于安全导航至关重要,这是像 Waymo 这样的公司大量使用的技术。这需要强大的检测头,可以处理多样化和动态的环境。
  2. 安全和监控: 检测头通过识别视频源中的未经授权的个人、被遗弃的物体或特定事件来为自动化监控系统提供支持。此功能是Ultralytics 安全警报系统指南等应用程序的基础。
  3. 医学图像分析: 检测头通过精确定位医学扫描中的肿瘤或骨折等异常情况来协助放射科医生,从而有助于更快、更准确的诊断。您可以通过阅读有关使用 YOLO11 进行肿瘤检测来了解有关此应用的更多信息。
  4. 制造业: 在工厂中,检测头通过发现装配线上产品的缺陷来实现自动化的制造质量控制
  5. 零售分析: 这些组件用于诸如库存管理和分析客户客流量模式之类的应用。

诸如YOLOv8等模型中复杂的检测头在大型基准数据集(如COCO)上进行训练,以确保在各种任务和场景中实现高性能。通常使用非极大值抑制 (NMS)等技术来优化最终输出,以滤除冗余检测。要获得更深入的知识,CourseraDeepLearning.AI等提供商的在线课程提供了全面的学习路径。

加入 Ultralytics 社区

加入人工智能的未来。与全球创新者联系、协作和共同成长

立即加入
链接已复制到剪贴板