深圳Yolo 视觉
深圳
立即加入
词汇表

检测头

了解检测头在目标检测中的关键作用,它能够优化特征图,从而精确地确定目标位置和类别。

检测头是物体检测模型的最后也可能是最关键的组成部分,它是 决策层,将编码图像特征转化为可操作的预测结果。它位于深度学习神经网络的 深度学习神经网络的末端,特别是在 检测头位于深度学习神经网络的最末端,特别是在骨干和颈部之后。 特征图,以产生最终输出:物体的类别 对象的类别及其在图像中的精确位置。网络的前几层侧重于特征提取 检测头则负责解释这些数据,以回答 "这是什么? "它是什么?"和 "它在哪里?"

功能和结构

检测头的主要职责是同时执行两项不同的任务:分类和回归。 回归。在现代 物体检测架构中 这些任务通常由头内的独立分支处理,这种设计选择允许模型 专门从事不同方面的预测。

  • 分类处:该子组件为各种类别(如 "人"、"自行车"、"交通灯")分配概率分值、 人"、"自行车"、"红绿灯")。它利用 损失函数(如 Cross-Entropy Loss)来学习类别之间的差异。 类之间的差异。
  • 回归分支:头部的这一部分会预测物体周围边界框的空间坐标。 包围物体的边界框。它将 框的尺寸(x、y、宽、高),使其与地面实况保持一致,通常会最大限度地减少 交集大于联合(IoU)损失。

检测头的输出通常是一组密集的候选检测结果。为了最终确定结果、 后处理步骤,如 非最大抑制(NMS)等后处理步骤 等后处理步骤,以过滤掉重叠的方框,只保留最有把握的预测结果。

探测头类型

探测头的设计决定了模型如何处理物体定位问题。

  • 锚固式云台:传统的 单级物体检测器,如早期的 YOLO 版本依赖于预定义的锚点盒。云台 云台从这些固定的参考盒预测偏移量。这种方法虽然有效,但需要仔细调整 锚超参数。
  • 免锚式云台:最先进的型号,包括 Ultralytics YOLO11采用 无锚探测器。这些探测头 直接从特征图像素预测物体中心和尺寸,而无需依赖预设框。这大大 这大大简化了模型结构,提高了对不同物体形状的通用性。

实际应用

检测头的效率和准确性对于在复杂环境中部署人工智能(AI)至关重要。 人工智能 (AI) 环境中部署人工智能(AI)至关重要。

  1. 医疗诊断:医学图像分析中,检测头 经过训练,可在 X 射线和核磁共振成像扫描中精确定位肿瘤或骨折等异常情况。举例来说、 医疗保健领域的人工智能依靠高精度探测头 以减少假阴性,协助放射科医生进行早期疾病检测。
  2. 零售分析:智能商店利用计算机视觉来track 库存和监控顾客行为。 行为。零售应用中的 零售应用中的人工智能检测头可以识别货架上的特定 货架上的特定产品,或detect 可疑行为以防止损失,实时处理视频馈送。

检测头部与脊柱和颈部

将检测头与卷积神经网络(CNN)的其他主要组件区分开来很有帮助。 卷积神经网络(CNN)的其他主要组件:

  • 主干网: 主干网(如 ResNet 或 CSPDarknet)负责从输入图像中提取原始视觉特征。
  • 颈部颈部 特征金字塔网络 (FPN) 和细化这些特征,以聚合不同尺度的上下文。
  • 检测头检测头利用这些细化的特征生成最终的类别和坐标预测。 预测。

实施实例

下面的Python 代码片段演示了如何使用 的 ultralytics 软件包。这有助于用户了解负责推理的最终层的结构。 推理。

from ultralytics import YOLO

# Load a pre-trained YOLO11 model
model = YOLO("yolo11n.pt")

# Inspect the final detection head layer
# This typically reveals the number of classes (nc) and anchors/outputs
print(model.model.model[-1])

# Run inference to see the head's output in action
results = model("https://ultralytics.com/images/bus.jpg")

了解检测头对于任何希望优化模型性能或执行高级任务的人来说都是至关重要的。 模型性能或执行高级任务 在这种情况下,通常需要更换探测头,以便在新的自定义数据集上训练模型。 自定义数据集上训练模型。研究人员不断尝试 新颖的探测头设计,以提高 平均精度 (mAP)等指标,推动计算机视觉技术的发展。 计算机视觉所能达到的极限。

加入Ultralytics 社区

加入人工智能的未来。与全球创新者联系、协作和共同成长

立即加入