用語集

検出ヘッド

物体検出における検出ヘッドの重要な役割を発見し、フィーチャーマップを改良して物体の位置とクラスを正確に特定します。

検出ヘッドは物体検出アーキテクチャにおいて重要なコンポーネントであり、画像やビデオ内の物体の存在、位置、クラスに関する最終的な予測を行う。ニューラルネットワークの末端に配置され、モデルのバックボーンとネックによって生成された特徴マップを処理し、具体的な出力に変換します。具体的には、検出ヘッドは2つの主要なタスクを実行します:潜在的な物体を事前に定義されたカテゴリ(例えば、「車」、「人」、「犬」)に分類し、検出された各物体を囲むバウンディングボックスの正確な座標を予測するために回帰を実行します。

検出ヘッドの仕組み

物体検出に使われる典型的な畳み込みニューラルネットワーク(CNN)では、入力画像は一連の層を通過する。最初の層(バックボーン)はエッジやテクスチャのような低レベルの特徴を抽出し、より深い層はより複雑なパターンを捉える。検出ヘッドは、これらの高レベルの特徴を合成して目的の出力を生成する最終段階である。

検出ヘッドの設計は、様々な物体検出モデル間の重要な差別化要因である。エッジデバイスでの リアルタイムの推論に適したスピード重視のヘッドもあれば、最大精度に最適化されたヘッドもあります。平均平均精度(mAP)などのメトリクスで測定されることが多い検出モデルの性能は、検出ヘッドの有効性に大きく影響されます。異なるアーキテクチャの性能を確認するために、モデルの比較を調べることができます。

最新のアーキテクチャにおける検出ヘッド

現代のディープラーニングでは、検出ヘッドの設計が大きく進化している。特に、アンカーベースと アンカーフリーの検出器の区別は重要だ。

  • アンカーベースのヘッド:従来のヘッドは、様々なサイズと縦横比の定義済みボックス(アンカー)のセットを使用する。ヘッドがこれらのアンカーをどのように移動・拡大縮小させれば、画像内の真実のオブジェクトと一致するかを予測する。
  • アンカーなしヘッドUltralytics YOLO11を含む、より最近のモデルは、アンカーなしヘッドを使用することが多い。これらのヘッドは、例えばオブジェクトの中心などのキーポイントを特定することで、オブジェクトの位置を直接予測します。このアプローチは、YOLO11がアンカーフリーであることの利点についてこのブログで詳しく説明しているように、モデル設計を簡素化し、特殊な形状のオブジェクトに対する柔軟性を向上させることができます。

これらのコンポーネントの開発は、PyTorchや TensorFlowのような強力なフレームワークに依存しており、カスタムモデルを構築して訓練するためのツールを提供している。Ultralytics HUBのようなプラットフォームは、このプロセスをさらに効率化します。

実世界での応用

検出ヘッドの有効性は、物体検出で構築された数多くのAIアプリケーションの性能に直接影響する。

  1. 自律走行車自動運転車では、歩行者、他の車両、交通標識をリアルタイムで識別し、位置を特定するために検出ヘッドが不可欠です。こうした予測の速度と精度は、安全なナビゲーションに不可欠であり、Waymoのような企業が大いに活用している技術です。そのためには、多様で動的な環境に対応できる堅牢な検出ヘッドが必要です。
  2. セキュリティと監視検出ヘッドは、無許可の個人、放置された物体、またはビデオフィード内の特定のイベントを識別することにより、自動監視システムを強化します。この機能は、Ultralyticsセキュリティアラームシステムガイドのようなアプリケーションの基本です。
  3. 医療画像解析検出ヘッドは、医療用スキャンの腫瘍や骨折のような異常を正確に検出することで、放射線科医を支援し、より迅速で正確な診断に貢献します。このアプリケーションの詳細については、YOLO11を使った腫瘍検出をご覧ください。
  4. 製造業工場では、検出ヘッドが組立ラインで製品の欠陥を検出することにより、製造における自動品質管理を可能にする。
  5. リテール・アナリティクス:これらのコンポーネントは、在庫管理や顧客の来店パターンの分析などのアプリケーションに使用される。

YOLOv8のようなモデルの洗練された検出ヘッドは、COCOのような大規模なベンチマークデータセットでトレーニングされ、幅広いタスクやシナリオにわたって高いパフォーマンスを保証します。最終的な出力は、冗長な検出をフィルタリングするために非最大抑制(NMS)のようなテクニックを使用して改良されることがよくあります。より詳細な知識については、Courseraや DeepLearning.AIなどのプロバイダーが提供するオンラインコースが包括的な学習パスを提供しています。

Ultralyticsコミュニティに参加する

AIの未来に参加しませんか。世界のイノベーターとつながり、協力し、成長する

今すぐ参加する
クリップボードにコピーされたリンク