用語集

フィーチャーピラミッドネットワーク（FPN）

特徴ピラミッドネットワーク(FPN)が、YOLO11 最新のCVシステムにおいて、どのようにマルチスケールの物体検出を可能にし、小さな物体から大きな物体までの検出精度を高めているかをご紹介します。

フィーチャピラミッドネットワーク（FPN）は、現代における基本的なアーキテクチャである。 コンピュータビジョン設計されたにおける基本的なアーキテクチャである。従来の ディープラーニングモデルはしばしば従来のディープラーニング（DL）モデルは、空間解像度が失われる深い層に依存しているため、小さな物体を認識するのに苦労していた。FPNはこれに対処する。のピラミッド型構造を構築することで、この問題を解決した。 特徴マップピラミッド構造低解像度で意味的に強い特徴と、高解像度で空間的に詳細な特徴とを組み合わせた特徴マップのピラミッド構造を構築する。この設計はこの設計は、多くの 物体検出アーキテクチャとして知られる最初の特徴抽出器をつなぐ。 バックボーン-最終的な予測層、つまり 検出ヘッド.異なるレベル間で効率的に情報を共有することで、FPNは以下のようなモデルを可能にする。 YOLO11のようなモデルは、1つの画像内の小さなを正確に識別することができる。

アーキテクチャーを理解する

フィーチャー・ピラミッド・ネットワークの革新性の核心は、3つの明確な段階を通して視覚情報をどのように処理するかにある。段階に分けて処理することにある。この構造により、ネットワークは膨大な計算コストをかけることなく、複数の解像度に渡って画像の豊かな表現を維持することができる。膨大な計算コストをかけることなく。

ボトムアップ・パスウェイ：この段階は、標準的なパスのフォワードパスに相当する。 畳み込みニューラルネットワーク(CNN)例えば ResNet.画像がネットワークを通過するにつれて、空間的な次元は減少し、意味的な値（文脈理解）は増加する。の理解）は増加する。
トップダウン経路：失われた空間的ディテールを回復するために、ネットワークはより深い層から、空間的には粗いが意味的に豊かな特徴マップをアップサンプリングする。をアップサンプリングする。このプロセスにより、強い文脈を含むより高解像度のマップを再構築する。
横のつながり：重要なステップは、トップダウン経路からアップサンプリングされたマップを、ボトムアップ経路の対応するマップと統合することである。をボトムアップ経路の対応するマップと統合する。これらの横方向の接続は、高レベルの意味的文脈と、それ以前の層に見られる低レベルのテクスチャやエッジを融合させる。この横方向の接続は、高レベルの意味的コンテキストと、それ以前の層で見つかった低レベルのテクスチャやエッジを融合し、マルチスケールの特徴ピラミッドを作成する。元のオリジナル FPNの研究論文では、この融合がのようなベンチマークデータセットのパフォーマンスを大幅に向上させた。 COCO.

マルチスケール検出が重要な理由

現実の世界では、カメラからの距離によって物体の大きさが大きく異なる。A 標準的な分類器では、フレームを埋め尽くす車は簡単に検出できても、背景にいる歩行者はdetect できないかもしれません。FPN は、予測タスクをピラミッドの異なるレベルに割り当てることでこれを解決します。大きな物体は一方、小さな物体は高解像度の融合特徴マップ上で検出されます。この機能を達成するために不可欠である。 高精度そして リコール多様な環境で FPN搭載モデルと旧式のシングルスケール検出器を区別。

実際のアプリケーション

マルチスケールデータを処理する能力により、FPNは、以下のような様々な業界で不可欠なものとなっている。 人工知能 (AI).

自律走行車： 自動運転システムは、近くの車両と遠くの信号機を同時にtrack しなければならない。FPNによりパーセプション・スタックは、これらの要素を同じ推論パス内で処理し、重要な安全判断をリアルタイムで行えるようにします。リアルタイムで行うことができます。以下のような組織による先進的な研究が行われています。 ウェイモなどの先進的な研究は、このようなマルチスケールナビゲーションの重要性を強調している。
医療画像解析：画像診断において画像診断において、異常の特定にはスケールを超えた精度が要求される。腫瘍は大きな塊かもしれないし、小さなものかもしれない、初期の結節かもしれない。FPNは 画像セグメンテーションモデルで説明されているように、X線やMRIスキャンでさまざまな大きさの病変をdetect のに役立つ。 Radiology AI ジャーナル.

FPNとBiFPNの比較

FPNが特徴抽出に革命をもたらした一方で、新しいアーキテクチャはそのコンセプトを洗練させてきた。注目すべき進化はによって導入されたBi-directional Feature Pyramid Network（BiFPN）である。 Google EfficientDetアーキテクチャに導入された。一方通行（トップダウン）の標準的なFPNとは異なり一方通行（トップダウン）の標準的なFPNとは異なり、BiFPNはボトムアップの経路を追加し、各接続の特定の重みを学習する。より重要な機能を優先する。しかし、標準的なFPN設計とその変形は、以下のような高性能モデルの基盤であり続けている。のような高性能モデルの基盤であり続けている。 YOLO11のような高性能モデルの基盤であり続けている。 リアルタイム推論 タスクに最適です。

実施例

最近のライブラリーはFPNの複雑さを内部で処理している。次の例は Ultralytics YOLOパッケージを使用しています。高度な特徴ピラミッド構造により、あらゆるサイズの物体をシームレスにdetect します。

from ultralytics import YOLO

# Load the YOLO11 model, which utilizes a feature pyramid architecture for multi-scale detection
model = YOLO("yolo11n.pt")

# Run inference on an image to detect objects ranging from small to large
results = model.predict("path/to/street_scene.jpg")

# Display the resulting bounding boxes and class labels
results[0].show()

フィーチャーピラミッドネットワーク（FPN）

Ultralytics YOLO モデルをトレーニングし、業種を問わずワークフローを効率化する

お客様のイノベーションを強化する柔軟なエンタープライズライセンスソリューション

Ultralytics YOLOAIモデルを数秒でトレーニング

アーキテクチャーを理解する

マルチスケール検出が重要な理由

実際のアプリケーション

FPNとBiFPNの比較

実施例

このカテゴリの関連記事

自己教師付き学習によるノイズ除去：段階的な分解

未来の物体検出トレンド：注目すべき7つのポイント

Ultralytics YOLO モデルによる車両再識別の強化

Ultralytics コミュニティに参加する