遇见 YOLO26: 下一代视觉 AI。
Ultralytics
返回 Ultralytics 词汇表

Feature Pyramid Network (FPN)

探索特征金字塔网络 (FPN) 如何增强多尺度目标检测。了解 Ultralytics YOLO26 如何使用先进的 FPN 检测大小物体。

特征金字塔网络 (FPN) 是一种用于现代 计算机视觉 (CV) 系统的专业架构组件,旨在提升对各种尺度物体的检测能力。它有效地解决了图像分析中一个长期存在的挑战:在同一图像中识别大型显著结构和微小远距离细节。通过生成输入的尺度多级表示(概念上类似于金字塔),FPN 使神经网络能够在每个分辨率级别提取丰富的语义信息。该架构通常位于负责提取原始特征的 骨干网络 (backbone) 与负责预测物体类别和边界框的 检测头 (detection head) 之间。

Link to this section特征金字塔网络的工作原理#

FPN 的核心创新在于它处理信息的方式。传统的 卷积神经网络 (CNNs) 会自然地创建一个特征层级,即输入图像被逐渐下采样。虽然这加深了语义理解(知道图像中是什么),但往往会降低空间分辨率(知道它确切在哪里),导致小物体消失。

FPN 通过一个三步流程解决了这个问题:

  1. 自底向上路径 (Bottom-Up Pathway):这是网络的标准前向传播过程,例如 残差网络 (ResNet)。随着网络处理图像,它会创建尺寸减小但语义价值增加的 特征图 (feature maps)

  2. 自顶向下路径 (Top-Down Pathway):网络通过对来自深层的语义丰富的特征进行上采样来构建高分辨率金字塔。这一步将强上下文信息“幻象”回更大的空间特征图中。

  3. 横向连接 (Lateral Connections):为了恢复下采样过程中丢失的清晰细节,FPN 通过横向连接将上采样特征与来自自底向上路径的原始高分辨率特征图进行融合。

这种结合产生了一个金字塔,其中每一层都既具备强大的语义信息,又具备良好的定位能力,从而显著提升了所有物体尺寸下的 精确率 (precision)召回率 (recall)

Link to this section在物体检测架构中的重要性#

FPN 是现代 物体检测架构 (object detection architectures) 的基石。在引入 FPN 之前,模型必须在速度(仅使用最终层)和准确性(处理图像金字塔,速度非常慢)之间进行取舍。FPN 提供了一种两全其美的解决方案,能够在不牺牲小物体检测能力的前提下实现 实时推理 (real-time inference)

这种效率对于像 YOLO26 这样的高级模型至关重要,它利用受 FPN 原理启发(如 PANet)的复杂聚合网络来实现顶尖性能。该架构确保模型无论是在边缘设备上部署,还是通过 Ultralytics Platform 在强大服务器上部署,都能在多样化的数据集上保持高准确性。

Link to this section实际应用#

FPN 的多尺度能力使其在安全和精度至关重要的行业中不可或缺。

  • 自动驾驶中的 AI (AI in Automotive):自动驾驶汽车必须同时跟踪附近的大型卡车和远处的微小交通灯或行人。FPN 允许感知堆栈在单次传递中处理这些不同的尺度,从而确保及时决策。像 nuScenes 这样的数据集通常被用于评估这些能力。
  • 医学图像分析 (Medical Image Analysis):在诊断成像中,检测病理需要发现大小差异巨大的异常情况。配备 FPN 的模型可以识别 MRI 扫描 (MRI scans) 中的大型器官结构和微小的早期肿瘤,辅助放射科医生做出准确诊断。
  • 农业中的 AI (AI in Agriculture):精准农业依赖于通过无人机影像检测农作物和害虫。由于无人机飞行高度可能变化,图像中植物的大小也会随之改变。FPN 帮助模型实现良好的泛化,无论相机高度如何,都能准确执行 物体计数 (object counting)

Link to this sectionFPN 与其他特征聚合器的比较#

区分标准 FPN 与其在较新架构中演进出的变体是有帮助的。

  • FPN 与 PANet:虽然 FPN 添加了一条自顶向下的路径来丰富特征,但 路径聚合网络 (PANet) 在 FPN 之上额外添加了一条自底向上的路径。这缩短了低层特征的信息路径,进一步改善了定位,这种技术常被应用于 YOLO 模型中。
  • FPN 与 BiFPN:在 EfficientDet 中使用的 双向特征金字塔网络 (BiFPN) 为不同特征引入了可学习权重,并移除了仅有一个输入的节点,从而优化了网络的效率。

Link to this section实践示例#

ultralytics 这样的高级库在内部处理了 FPN 构建的复杂性。当你加载像 YOLO26 这样的模型时,该架构会自动包含这些特征聚合层以实现性能最大化。

from ultralytics import YOLO

# Load the YOLO26 model, which uses advanced feature pyramid principles internally
# The 'n' suffix indicates the nano version, optimized for speed
model = YOLO("yolo26n.pt")

# Perform inference on an image containing objects of various sizes
# The model's neck (FPN-based) aggregates features to detect small and large items
results = model("https://ultralytics.com/images/bus.jpg")

# Display results to see bounding boxes around buses (large) and people (small)
results[0].show()

Explore solutions

Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。
了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。
了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。
了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。
了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。
了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。
了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。
了解更多
Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。
了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。
了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。
了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。
了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。
了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。
了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。
了解更多
Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。
了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。
了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。
了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。
了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。
了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。
了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。
了解更多

让我们一起构建 AI 的未来!

开启你的机器学习未来之旅