探索特征金字塔网络 (FPN) 如何增强多尺度目标 detect。了解 Ultralytics YOLO26 如何使用先进的 FPN 来 detect 小型和大型目标。
特征金字塔网络 (FPN) 是现代计算机视觉 (CV)系统中用于改进对不同尺度目标detect的专门架构组件。它有效解决了图像分析中长期存在的挑战:在同一图像中识别大型突出结构和微小远距离细节。通过生成输入的(概念上类似于金字塔的)多尺度表示,FPN允许神经网络在每个分辨率级别提取丰富的语义信息。这种架构通常位于提取原始特征的骨干网络和预测目标类别及边界框的detect头之间。
FPN 的核心创新在于其信息处理方式。传统的卷积神经网络 (CNNs) 自然地创建了一个特征层级结构,其中输入图像被逐步下采样。尽管这加深了语义理解(知道图像中有什么),但它通常会降低空间分辨率(精确知道在哪里),导致小目标消失。
FPN 通过三步过程解决此问题:
这种组合形成了一个金字塔,其中每个级别都具有强大的语义和良好的定位能力,显著提升了所有目标尺寸的precision和recall。
FPN 是现代目标 detect 架构的基石。在其引入之前,模型必须在速度(仅使用最终层)或准确性(处理图像金字塔,这非常慢)之间做出选择。FPN 提供了一种两全其美的解决方案,实现了实时推理,同时不牺牲小目标 detect 能力。
这种效率对于像YOLO26这样的先进模型至关重要,它利用受 FPN 原理(如 PANet)启发的复杂聚合网络,以实现最先进的性能。该架构确保无论模型是通过Ultralytics Platform部署在边缘设备还是强大服务器上,它都能在各种数据集中保持高准确性。
FPN 的多尺度能力使其在安全和精度至关重要的行业中不可或缺。
区分标准 FPN 与在新架构中发现的其演进变体是有益的。
先进的库,例如 ultralytics 内部处理 FPN 构建的复杂性。当您加载像 YOLO26 这样的模型时,该架构会自动包含这些特征聚合层以最大限度地提高性能。
from ultralytics import YOLO
# Load the YOLO26 model, which uses advanced feature pyramid principles internally
# The 'n' suffix indicates the nano version, optimized for speed
model = YOLO("yolo26n.pt")
# Perform inference on an image containing objects of various sizes
# The model's neck (FPN-based) aggregates features to detect small and large items
results = model("https://ultralytics.com/images/bus.jpg")
# Display results to see bounding boxes around buses (large) and people (small)
results[0].show()

开启您的机器学习未来之旅