深圳Yolo 视觉
深圳
立即加入
词汇表

特征图

了解特征图如何为Ultralytics YOLO 模型提供支持,从而实现精确的目标检测和高级人工智能应用(如自动驾驶)。

特征图是卷积滤波器对输入图像或 卷积滤波器作用于输入图像或 另一个特征图时产生的基本输出。 卷积神经网络 (CNN)。在计算机视觉(CV)中,这些图谱就像神经网络的 "眼睛 "一样。 图就像神经网络的 "眼睛 "一样,能突出显示所学特征的存在和位置,如边缘、纹理、褶皱、弧度、褶皱、弧度、弧度、弧度、弧度、弧度等。 特征的存在和位置,如边缘、纹理、角落或复杂的几何形状。通过将原始像素数据转化为 通过将原始像素数据转化为有意义的抽象概念,特征图使复杂的模型能够执行从图像分类到实时图像处理的各种任务。 图像分类到实时 物体检测等任务。

如何创建地物地图

特征图的生成涉及一个数学过程,称为 卷积。一个专门的 称为内核或滤波器的可学习权重矩阵,在输入数据上滑动 在输入数据上滑动。在每个位置,内核都会执行一次元素乘法和求和,在输出矩阵中产生一个单一值。 输出矩阵中的单个值。

  • 激活:生成的值通常会通过 激活函数,如 ReLU。 引入非线性,使网络能够学习复杂的模式。
  • 空间保留:与完全连接的图层不同,特征地图保留了空间关系、 这意味着特定坐标上的高值对应于原始图像中同一相对位置上的检测特征。 原始图像中同一相对位置的检测特征。
  • 深度单个卷积层通常使用多个滤波器,将产生的二维 阵列,形成三维卷积特征图,通常可视化为 深度学习(DL)架构图。

分层特征学习

现代架构,如 许多系统中使用的ResNet 主干网、 利用特征图的层次性。随着数据在网络中的传输,抽象层 提高:

  1. 浅层:初始特征图捕捉低层次细节,如垂直线、颜色渐变或简单曲线。 梯度或简单的曲线。这些构成了 视觉感知的基础。
  2. 深层:在网络的更深层,这些基本元素被结合在一起。由此产生的图谱代表了 高级语义概念,如汽车轮毂的形状或狗的脸。这种层次结构对于 等最先进模型的性能至关重要。 YOLO11, 使它们能够高精度地区分相似的类别。 准确性

网络智能可视化

开发人员通常会将特征图可视化,以解释模型所学到的知识,这是可解释人工智能(XAI)的一个重要实践。 可解释的人工智能 (XAI) 的关键实践。像 TensorBoard等工具允许工程师检查这些 内部状态。如果用于detect 汽车的特征图在背景树上被激活,则表明模型 可能与噪声过度拟合。这种检查对于调试和提高 模型的鲁棒性至关重要。

下面的Python 代码演示了如何使用 ultralytics 库 在卷积层上注册一个钩子。

from ultralytics import YOLO

# Load the YOLO11 model (nano version)
model = YOLO("yolo11n.pt")


# Define a hook to print the shape of the feature map from the first layer
def hook_fn(module, input, output):
    print(f"Feature Map Output Shape: {output.shape}")


# Register the hook to the first convolutional layer of the model
model.model.model[0].register_forward_hook(hook_fn)

# Run inference on a dummy image to trigger the hook
model("https://ultralytics.com/images/bus.jpg")

实际应用

地物图是许多变革性技术背后的引擎:

  • 自动驾驶汽车:在 自动驾驶系统中,例如 自动驾驶汽车:在自动驾驶系统中,例如Waymo 开发的自动驾驶系统,特征地图会处理摄像头馈送的信息,以识别车道标记、行人和交通标志、 行人和交通标志。这些地图的空间保真度确保车辆不仅知道 道路上有什么,还能准确地知道它相对于汽车的位置
  • 医疗诊断:在 医学图像分析中,深度学习 模型分析核磁共振成像或 CT 扫描。这些网络中的特征图经过训练可突出显示肿瘤或骨折等异常情况。 骨折等异常现象。发表在《自然-医学》等期刊上的研究展示了 这些特定激活如何通过高精度标记感兴趣的区域来帮助放射科医生。

区分相关概念

要充分理解神经网络架构,将特征图与相关术语区分开来很有帮助:

  • 特征地图与特征提取: 特征提取 从原始输入中提取信息数据的过程。特征图是 数据结构
  • 特征图与嵌入:特征图保留了空间维度(高度和宽度)、 嵌入通常是扁平化的低维 向量。嵌入代表了整个图像或对象的语义本质,通常用于 相似性搜索 矢量数据库中的相似性搜索,而特征图则用于 则用于需要空间定位的任务,如 图像分割

加入Ultralytics 社区

加入人工智能的未来。与全球创新者联系、协作和共同成长

立即加入