Yolo 深圳
深セン
今すぐ参加
用語集

フィーチャーピラミッドネットワーク(FPN)

特徴ピラミッドネットワーク(FPN)が、YOLO11 最新のCVシステムにおいて、どのようにマルチスケールの物体検出を可能にし、小さな物体から大きな物体までの検出精度を高めているかをご紹介します。

特徴ピラミッドネットワーク(FPN)は、 コンピュータビジョン(CV)において 異なるスケールにおける物体検出を改善するために用いられる特殊なアーキテクチャである。これは多くの現代的な 物体検出アーキテクチャにおいて重要な構成要素でありにおいて重要な構成要素として機能し、小さな物体の認識に苦労する従来の検出器の限界を克服するよう設計されています。単一解像度の入力画像から マルチスケールの特徴ピラミッドを生成することで、FPNはモデルが大きな構造物と 微細なdetect 高精度でdetect することを可能にします。このアーキテクチャは通常、 バックボーン (特徴抽出を行う)と 検出ヘッド 検出ヘッド (クラスとバウンディングボックスを予測)の間に配置され、最終層に渡される意味情報を効果的に強化する。

FPNアーキテクチャの理解

FPNの主な目的は、深層畳み込みニューラルネットワーク(CNN)に内在するマルチスケール・ピラミッド型階層構造を活用することである。 畳み込みニューラルネットワーク(CNN)の固有のマルチスケール・ピラミッド型階層構造を活用することである。これにより、複数の画像スケールを個別に処理する際の計算コストを削減しつつ、 を処理する際の計算コストを削減することです。このアーキテクチャは視覚データを処理する3つの主要経路で構成されます:

  1. ボトムアップ経路: これはバックボーンネットワーク(例: 残差ネットワーク(ResNet)。画像が層を通過するにつれて、空間解像度は低下(画像が縮小)する一方で、 意味的価値(画像内の内容の文脈)は増加します。
  2. トップダウン経路:この段階では、空間的には粗いが意味的には強い特徴マップをアップサンプリングすることで、より高解像度の特徴を幻視する。 特徴マップをアップサンプリングすることで、より高解像度の特徴を幻視する。 より高いピラミッドレベルから より粗いが意味的に強い特徴マップを アップサンプリングすることで、 より高解像度の特徴を幻視する。 これにより、ボトムアップ処理中に失われた空間的詳細が回復される。
  3. 横方向接続:これらの接続は、トップダウン経路から得られたアップサンプリングされた特徴マップを ボトムアップ経路からの対応する特徴マップと融合させる。この融合により高次レベルのセマンティックコンテキストと 低次レベルのテクスチャ・エッジ情報が統合され、精度が大幅に向上する 精度を大幅に向上させるを大幅に高める。オリジナルの FPN研究論文 は、この手法が標準ベンチマークで最先端の結果を達成する方法を実証している。

現代人工知能における重要性

FPNが登場する以前、物体検出器は通常、最上位層のみを使用する(大きな物体には有効だが小さな物体には不向き)か、画像ピラミッドを処理する(遅く計算コストが高い)かの選択を迫られていた。FPNは「両方の長所を兼ね備えた」解決策を提供する。この機能は リアルタイム推論において極めて重要であり、 YOLO26YOLO11 が、画面上でわずか数ピクセルしか占めない物体を正確に識別しながら、高いフレームレートを維持できるようにします。

実際のアプリケーション

マルチスケールデータを処理する能力により、FPNは、以下のような様々な業界で不可欠なものとなっている。 人工知能 (AI).

  • 自動運転車両: 自動運転システムは、近くのtrack 車両と遠くの信号機や歩行者を同時にtrack しなければならない。 FPN(フル接続ニューラルネットワーク)により、知覚スタックはこれらの要素を同一の推論パス内で処理でき、安全判断が瞬時に行われることを保証する。 Waymo Open Dataset は、こうしたマルチスケールの能力を訓練するためによく使用される。
  • 医療画像解析: 診断画像において、異常を特定するにはあらゆるスケールでの精度が求められる。腫瘍は大きな塊である場合もあれば、 微小な初期段階の結節である場合もある。偽陽性率(FPN)は 画像セグメンテーション モデルを強化し、 放射線医学で使用されるX線やMRIスキャンにおける様々なサイズのdetect 臨床医がdetect 支援します。これは 放射線学AIジャーナルで頻繁に議論されている 放射線医学AIジャーナルで頻繁に議論されているように、放射線学のAIジャーナルで頻繁に議論されているように。

FPN対BiFPNおよびPANet

FPNが特徴抽出に革命をもたらした一方で、より新しいアーキテクチャがこの概念を洗練させてきた。

  • BiFPN(双方向特徴ピラミッドネットワーク): EfficientDetで使用され、学習可能な重みを導入して異なる入力特徴の重要性を学習し、 既存のトップダウン経路にボトムアップ経路を追加する。
  • PANet(パス集約ネットワーク):YOLO 頻繁に使用されるPANetは、FPN構造に追加のボトムアップパスを追加し、低レベル特徴の情報伝達経路を短縮することで、位置特定精度をさらに向上させる。
  • Ultralytics YOLO : YOLO26のような現代的な反復では、速度と 平均精度(mAP)のトレードオフを最大化する。

実施例

Ultralytics 、FPNの複雑性を内部で処理します。以下の例は、detect モデルの読み込み方法を示しています。

from ultralytics import YOLO

# Load the YOLO26 model, which utilizes an advanced feature pyramid architecture
# The 'n' suffix stands for nano, a lightweight version of the model
model = YOLO("yolo26n.pt")

# Run inference on an image to detect objects ranging from small to large
# The model internally uses its FPN neck to aggregate features at multiple scales
results = model.predict("https://ultralytics.com/images/bus.jpg")

# Display the resulting bounding boxes and class labels
results[0].show()

Ultralytics コミュニティに参加する

AIの未来を共に切り開きましょう。グローバルなイノベーターと繋がり、協力し、成長を。

今すぐ参加