敬请关注 YOLO Vision 2025!
2025年9月25日
英国夏令时 10:00 - 18:00
混合活动
Yolo Vision 2024
词汇表

特征图

了解特征图如何驱动 Ultralytics YOLO 模型,从而实现精确的对象检测和自动驾驶等高级 AI 应用。

特征图是卷积滤波器(也称为内核)应用于卷积神经网络 (CNN)中输入层后的输出。本质上,它是对在图像特定区域中检测到的学习特征(如边缘、纹理或复杂形状)的表示。 卷积层中的每个滤波器都旨在检测单个特定特征。生成的特征图突出显示了该特定特征在输入数据中出现的位置,从而构成了各种计算机视觉 (CV)任务的基本构建块。

特征图如何工作

当CNN将一个滤波器(一个小的可学习权重矩阵)应用于输入图像或前一层的特征图时,特征图的生成就开始了。这个滤波器在输入上滑动,并在每个位置执行卷积操作。这个滑动操作的输出创建一个新的2D数组,这就是特征图。地图中的激活值表示在每个位置检测到的特征的强度。例如,一个训练用于检测垂直边缘的滤波器将在特征图中对应于垂直边缘的位置产生高激活值。现代深度学习框架,如PyTorchTensorFlow,会自动处理这些操作。

分层特征表示

卷积神经网络 (CNN) 最强大的特性之一是其构建特征层级结构的能力。

  • 早期层: 网络骨干网络初始层中的特征图捕获简单、基本的特征,如边缘、角和颜色梯度。这些骨干网络通常是强大的预训练网络本身,如 ResNet
  • 中层: 随着数据在网络中传播,后续层将这些简单特征组合成更复杂的模式,例如纹理、对象的部分(如轮子或眼睛)或简单形状。
  • 深层: 较深层中的特征图表示高度抽象和复杂的概念,例如整个对象。这种分层过程允许像 Ultralytics YOLO 这样的模型执行复杂的任务,例如目标检测图像分割图像分类

特征图与相关概念

区分特征图与密切相关的术语很有帮助:

  • 特征提取: 这是从原始数据中识别和提取有意义模式的过程。特征图是 CNN 层中发生的特征提取的输出或有形结果。虽然 特征提取 是一个广泛的概念,但特征图是特定的数据结构,以空间组织的方式保存这些学习到的特征。
  • 嵌入: 特征图通常是多维数组,保留有关特征出现位置的空间信息。相比之下,嵌入通常是密集的、一维的向量,表示压缩的语义空间中的整个图像或对象。它们通常通过展平和处理网络的最终特征图来创建,以捕获高级含义,用于语义搜索或分类等任务,牺牲空间细节以在向量数据库中使用。

实际应用

特征图是无数人工智能 (AI)机器学习 (ML)应用不可或缺的一部分:

  1. 自动驾驶在自动驾驶汽车中,CNN 处理摄像头和传感器数据以导航世界。在不同层生成的特征图有助于识别行人、其他车辆、车道线和交通标志。早期层检测边缘和纹理,而更深层将这些结合起来以识别复杂对象。这对于安全导航至关重要,Waymo等公司在他们的自动驾驶汽车人工智能中大量依赖此类技术。
  2. 医学图像分析: 卷积神经网络(CNN)分析医学扫描图像(X射线、CT、MRI)以辅助诊断。特征图突出显示潜在的异常。例如,当使用像脑肿瘤数据集这样的数据集来检测肿瘤时,早期的特征图可能会识别出不寻常的纹理或边缘。更深层的图则学习识别肿瘤特有的特定形状和结构,从而协助放射科医生进行工作。这项研究通常发表在像放射学:人工智能这样的领先期刊上。

可视化和解释

可视化特征图可以深入了解 CNN 学习的内容以及它如何做出决策。通过检查图像的哪些部分强烈激活特定特征图,开发人员可以了解模型是否专注于相关信息。此过程是可解释 AI (XAI)的关键组成部分,有助于提高整体模型可解释性。可以使用 TensorBoard 或其他高级可视化技术来完成。了解特征图有助于调试模型,提高其准确性和可靠性,并通过 Ultralytics HUB 等平台管理整个生命周期。

加入 Ultralytics 社区

加入人工智能的未来。与全球创新者联系、协作和共同成长

立即加入
链接已复制到剪贴板