了解特征金字塔网络 (FPN) 如何在YOLO11 和现代 CV 系统中实现多尺度物体检测,提高大小物体的检测精度。
特征金字塔网络(FPN)是一种用于计算机视觉(CV)的专用架构。 计算机视觉(CV)领域 用于提升 不同尺度下物体的检测效果。作为现代物体检测架构中的关键组件, 物体检测架构,旨在突破传统检测器难以识别微小物体的局限。通过从单分辨率输入图像生成 多尺度特征金字塔,FPN使模型能够detect 高精度detect 大型结构 与微小细节。该架构通常位于 骨干网络 (负责特征提取)与 检测头 (负责预测 类别与边界框)之间,有效增强传递至最终层的语义信息。
全局特征网络(FPN)的主要目标是利用卷积神经网络(CNN)固有的多尺度金字塔式层级结构 卷积神经网络(CNN)的固有多尺度金字塔式层级结构 同时降低分别处理多个图像尺度所产生的计算成本。该架构包含三条处理视觉数据的主路径:
在FPN出现之前,目标检测器通常只能在两种方案中择一:要么仅使用最顶层(适用于大型目标,但对小型目标效果不佳),要么处理图像金字塔(速度慢且计算成本高)。FPN提供了"两全其美"的解决方案。这种能力对于 实时推理,使 YOLO26 和 YOLO11 在保持高帧率的同时 精准识别仅占据屏幕几个像素的物体。
处理多尺度数据的能力使 FPN 成为各行各业不可或缺的工具,这些行业依赖于 人工智能(AI).
虽然全局特征网络(FPN)彻底革新了特征提取领域,但新一代架构已对这一概念进行了进一步优化。
深度学习库和Ultralytics 在内部处理了特征金字塔网络的复杂性。以下示例演示了如何加载一个利用特征金字塔结构进行detect 模型。
from ultralytics import YOLO
# Load the YOLO26 model, which utilizes an advanced feature pyramid architecture
# The 'n' suffix stands for nano, a lightweight version of the model
model = YOLO("yolo26n.pt")
# Run inference on an image to detect objects ranging from small to large
# The model internally uses its FPN neck to aggregate features at multiple scales
results = model.predict("https://ultralytics.com/images/bus.jpg")
# Display the resulting bounding boxes and class labels
results[0].show()
.webp)
