深圳Yolo 视觉
深圳
立即加入
词汇表

特征图

探索特征图如何充当 CNN 的“眼睛”。了解 Ultralytics YOLO26 如何利用这些内部表示来 detect 模式并赋能计算机视觉。

特征图是当卷积核处理输入图像或神经网络中前一层时产生的基本输出。在计算机视觉 (CV)领域,这些图作为数据的内部表示,突出显示模型已学会识别的特定模式,例如边缘、纹理或复杂的几何形状。本质上,特征图充当卷积神经网络 (CNN)的“眼睛”,将原始像素值转换为有意义的抽象,从而促进物体detect和分类等任务。

特征图背后的机制

特征图的创建由称为 卷积 的数学运算驱动。在此过程中,一个由可学习参数组成的小矩阵,称为核或滤波器,在输入数据上滑动。在每个位置,核执行逐元素乘法和求和,从而在输出网格中产生一个单一值。

  • 模式激活:每个滤波器都经过训练以寻找特定特征。当滤波器在输入中遇到该特征时,特征图中的结果值会很高,表明存在强激活。
  • 空间层次结构:在深度学习 (DL)架构中,特征图是分层排列的。早期层生成detect低级细节(如边缘detect线条和曲线)的图。更深层结合这些简单的图,形成复杂对象(如人脸或车辆)的高级表示。
  • 维度变化:随着数据在网络中传播,池化层等操作通常会减少特征图的空间维度(高度和宽度),同时增加深度(通道数)。这个过程通常被称为降维,有助于模型关注特征的存在,而不是其精确的像素位置。

实际应用

特征图是现代 AI 应用的引擎室,使系统能够以类人理解方式解释视觉数据。

  • 医疗诊断:在医学图像分析中,模型利用特征图来处理X射线或MRI扫描。早期特征图可能突出骨骼轮廓,而更深层的特征图则识别肿瘤或骨折等异常,从而在医疗AI场景中辅助医生。
  • 自动导航:自动驾驶汽车严重依赖视觉传感器生成的特征图。这些地图使车辆的板载计算机能够实时区分车道、行人和交通标志,这对于自动驾驶车辆的安全运行至关重要。

在 Python 中使用特征图

尽管特征图是内部结构,但了解它们的维度在设计架构时至关重要。以下 PyTorch 示例演示了单个卷积层如何将输入图像转换为特征图。

import torch
import torch.nn as nn

# Define a convolution layer: 1 input channel, 1 output filter, 3x3 kernel
conv_layer = nn.Conv2d(in_channels=1, out_channels=1, kernel_size=3, bias=False)

# Create a random dummy image (Batch Size=1, Channels=1, Height=5, Width=5)
input_image = torch.randn(1, 1, 5, 5)

# Pass the image through the layer to generate the feature map
feature_map = conv_layer(input_image)

print(f"Input shape: {input_image.shape}")
# The output shape will be smaller (3x3) due to the kernel size and no padding
print(f"Feature Map shape: {feature_map.shape}")

区分相关概念

区分特征图与相似术语有助于避免在 模型训练 期间产生混淆:

  • 特征图 vs. 滤波器:滤波器(或卷积核)是用于扫描图像的工具;它包含模型权重。特征图是该扫描的结果。你可以将滤波器视为“镜头”,将特征图视为通过该镜头捕获的“图像”。
  • 特征图 vs. 嵌入:尽管两者都表示数据,但特征图通常保留适合语义分割的空间结构(高度和宽度)。相比之下,嵌入通常是扁平化的1D向量,它们捕获语义信息但丢弃空间布局,常用于相似性搜索任务。
  • 特征图 vs. 激活激活函数(如ReLU)被应用特征图中的值上,以引入非线性。该特征图在数学运算之前和之后都存在。

与 Ultralytics 模型的关联性

YOLO26 等高级架构中,特征图在模型的“骨干网络”和“头部”中发挥着关键作用。骨干网络提取不同尺度的特征(特征金字塔),确保模型能够有效 detect 小型和大型目标。利用 Ultralytics Platform 进行训练的用户可以可视化这些模型的表现,通过 accuracy 和召回率等指标间接观察底层特征图的有效性。优化这些特征图涉及在标注数据集上进行大量训练,通常利用 feature extraction 等技术将预训练模型的知识迁移到新任务中。

让我们一起共建AI的未来!

开启您的机器学习未来之旅