Yolo 深圳
深セン
今すぐ参加
用語集

フィーチャーピラミッドネットワーク(FPN)

特徴ピラミッドネットワーク(FPN)がマルチスケール物体検出をどのように強化するかを探求します。Ultralytics 高度なFPNを活用してdetect 物体をdetect 仕組みを学びます。

特徴ピラミッドネットワーク(FPN)は、現代のコンピュータビジョン(CV)で使用される特殊なアーキテクチャ構成要素である。 コンピュータビジョン(CV)システムにおいて、様々なスケールでの物体検出を改善するために用いられる特殊なアーキテクチャ構成要素である。これは画像解析における長 システムにおいて、 様々なスケールでの物体検出を改善するために用いられる。画像解析における長年の課題、すなわち 同一画像内の大きく目立つ構造と小さく遠方の細部の両方を認識することを効果的に解決する。入力の マルチスケール表現(概念的にはピラミッドに類似)を生成することで、FPNはニューラルネットワークが あらゆる解像度レベルで豊富な意味的情報を抽出することを可能にする。このアーキテクチャは通常、 バックボーン(生特徴を抽出する)と 検出ヘッド(物体クラスと境界ボックスを予測する)の間に位置する。

特徴量ピラミッドネットワークの仕組み

FPNの中核となる革新性は、情報の処理方法にある。従来の 畳み込みニューラルネットワーク(CNN)は は入力画像を段階的にダウンサンプリングする特徴階層を自然に形成する。これにより意味的理解(画像内の内容の認識)は深まるが、空間分解能(正確な位置の認識)が低下し、小さな物体が消失する傾向がある。

FPNは3段階のプロセスを通じてこの問題を解決します:

  1. ボトムアップ経路: これはネットワークの標準的なフィードフォワードパスであり、例えば 残差ネットワーク(ResNet)。ネットワークが画像を処理する過程で、 特徴マップを生成します を生成する。 そのサイズは縮小するが、意味的価値は高まる。
  2. トップダウン経路:ネットワークは深層から意味的に豊かな特徴量をアップサンプリングすることで、高解像度のピラミッド構造を構築する。このステップにより、より大きな空間マップへ強力な文脈情報が「幻視」される。
  3. 側方接続:ダウンサンプリング中に失われた鮮明な詳細を回復するため、FPNはアップサンプリングされた特徴量を、ボトムアップ経路からの元の高解像度マップと側方接続を介して融合する。

この組み合わせにより、各レベルが強力な意味論優れたローカライゼーションを備えたピラミッド構造が形成され、 精度が大幅に向上します。 精度 および 再現率 を大幅に高める。

物体検出アーキテクチャにおける重要性

FPNは現代の 物体検出アーキテクチャの基盤である。FPN導入前は、モデルは速度(最終層のみを使用)と精度(処理が非常に遅い画像ピラミッドを処理)のどちらかを選択する必要があった。FPNは両方の長所を兼ね備えた解決策を提供し、 リアルタイム推論を可能にしながら を実現しつつ 微小物体検出能力を損なわない。

この効率性は、YOLO26のような高度なモデルにとって極めて重要です。 YOLO26のような高度なモデルにとって極めて重要です。このモデルは、FPNの原理に着想を得た高度な集約ネットワーク(PANetなど)を活用し、 最先端の性能を達成しています。このアーキテクチャにより、モデルがエッジデバイスにデプロイされる場合でも、 Ultralytics Platformを介して高性能サーバーにデプロイされる場合でも、 Ultralytics を介して強力なサーバーにデプロイされる場合でも、多様なデータセット全体で高い精度を維持します。

実際のアプリケーション

FPNのマルチスケール能力は、安全性と精度が最優先される産業において不可欠な存在である。

  • 自動車におけるAI: 自動運転車は、近くのtrack トラックと遠くの小さな信号機や歩行track 同時にtrack しなければならない。FPNは知覚スタックがこれらの異なるスケールを単一パスで処理することを可能にし、タイムリーな意思決定を保証する。 nuScenes などのデータセットが これらの能力を評価するために頻繁に用いられる。
  • 医療画像解析: 診断画像において病変を検出するには、大きさが大きく異なる異常を発見する必要がある。 FPNを搭載したモデルは、大きな臓器構造と微小な初期段階の腫瘍の両方を MRI画像において、大きな臓器構造と微小な初期段階の腫瘍の両方を識別でき、放射線科医の正確な診断を支援する。
  • 農業におけるAI精密農業は、ドローン画像から作物や害虫を検出することに依存している。ドローンの高度は変動するため、 画像内の植物の大きさは変化する。FPNはモデルの汎化性能を高め、正確な カメラの高さに依存せず を実現する。

FPN対その他の特徴量アグリゲーター

標準FPNと、新しいアーキテクチャに見られるその進化した変種とを区別することは有益である。

  • FPN対PANet:FPNが特徴を豊かにするためにトップダウン経路を追加するのに対し、 Path Aggregation Network (PANet) はFPNの上に追加の ボトムアップ経路を追加します。これにより低レベル特徴の情報経路が短縮され、 局所化精度がさらに向上します。この手法YOLO で頻繁に採用されています。
  • FPN対BiFPN:EfficientDetに採用されている 双方向特徴ピラミッドネットワーク(BiFPN) は、異なる特徴量に学習可能な重みを導入し、単一の入力しか持たないノードを除去することで、ネットワークの効率性を最適化する。

実例

高度なライブラリのような ultralytics FPN構築の複雑性を内部で処理します。YOLO26のようなモデルを読み込むと、アーキテクチャは自動的にこれらの特徴量集約層を含み、性能を最大化します。

from ultralytics import YOLO

# Load the YOLO26 model, which uses advanced feature pyramid principles internally
# The 'n' suffix indicates the nano version, optimized for speed
model = YOLO("yolo26n.pt")

# Perform inference on an image containing objects of various sizes
# The model's neck (FPN-based) aggregates features to detect small and large items
results = model("https://ultralytics.com/images/bus.jpg")

# Display results to see bounding boxes around buses (large) and people (small)
results[0].show()

Ultralytics コミュニティに参加する

AIの未来を共に切り開きましょう。グローバルなイノベーターと繋がり、協力し、成長を。

今すぐ参加