特徴ピラミッドネットワーク(FPN)がマルチスケール物体検出をどのように強化するかを探求します。Ultralytics 高度なFPNを活用してdetect 物体をdetect 仕組みを学びます。
特徴ピラミッドネットワーク(FPN)は、現代のコンピュータビジョン(CV)で使用される特殊なアーキテクチャ構成要素である。 コンピュータビジョン(CV)システムにおいて、様々なスケールでの物体検出を改善するために用いられる特殊なアーキテクチャ構成要素である。これは画像解析における長 システムにおいて、 様々なスケールでの物体検出を改善するために用いられる。画像解析における長年の課題、すなわち 同一画像内の大きく目立つ構造と小さく遠方の細部の両方を認識することを効果的に解決する。入力の マルチスケール表現(概念的にはピラミッドに類似)を生成することで、FPNはニューラルネットワークが あらゆる解像度レベルで豊富な意味的情報を抽出することを可能にする。このアーキテクチャは通常、 バックボーン(生特徴を抽出する)と 検出ヘッド(物体クラスと境界ボックスを予測する)の間に位置する。
FPNの中核となる革新性は、情報の処理方法にある。従来の 畳み込みニューラルネットワーク(CNN)は は入力画像を段階的にダウンサンプリングする特徴階層を自然に形成する。これにより意味的理解(画像内の内容の認識)は深まるが、空間分解能(正確な位置の認識)が低下し、小さな物体が消失する傾向がある。
FPNは3段階のプロセスを通じてこの問題を解決します:
この組み合わせにより、各レベルが強力な意味論と優れたローカライゼーションを備えたピラミッド構造が形成され、 精度が大幅に向上します。 精度 および 再現率 を大幅に高める。
FPNは現代の 物体検出アーキテクチャの基盤である。FPN導入前は、モデルは速度(最終層のみを使用)と精度(処理が非常に遅い画像ピラミッドを処理)のどちらかを選択する必要があった。FPNは両方の長所を兼ね備えた解決策を提供し、 リアルタイム推論を可能にしながら を実現しつつ 微小物体検出能力を損なわない。
この効率性は、YOLO26のような高度なモデルにとって極めて重要です。 YOLO26のような高度なモデルにとって極めて重要です。このモデルは、FPNの原理に着想を得た高度な集約ネットワーク(PANetなど)を活用し、 最先端の性能を達成しています。このアーキテクチャにより、モデルがエッジデバイスにデプロイされる場合でも、 Ultralytics Platformを介して高性能サーバーにデプロイされる場合でも、 Ultralytics を介して強力なサーバーにデプロイされる場合でも、多様なデータセット全体で高い精度を維持します。
FPNのマルチスケール能力は、安全性と精度が最優先される産業において不可欠な存在である。
標準FPNと、新しいアーキテクチャに見られるその進化した変種とを区別することは有益である。
高度なライブラリのような ultralytics FPN構築の複雑性を内部で処理します。YOLO26のようなモデルを読み込むと、アーキテクチャは自動的にこれらの特徴量集約層を含み、性能を最大化します。
from ultralytics import YOLO
# Load the YOLO26 model, which uses advanced feature pyramid principles internally
# The 'n' suffix indicates the nano version, optimized for speed
model = YOLO("yolo26n.pt")
# Perform inference on an image containing objects of various sizes
# The model's neck (FPN-based) aggregates features to detect small and large items
results = model("https://ultralytics.com/images/bus.jpg")
# Display results to see bounding boxes around buses (large) and people (small)
results[0].show()