YOLO Vision 2025にご期待ください!
2025年9月25日
10:00 — 18:00(英国夏時間)
ハイブリッドイベント
Yolo Vision 2024
用語集

検出ヘッド

物体検出における検出ヘッドの重要な役割をご覧ください。特徴マップを洗練して、物体の位置とクラスを正確に特定します。

検出ヘッドは、画像またはビデオ内のオブジェクトの存在、場所、およびクラスに関する最終的な予測を行う役割を担う物体検出アーキテクチャの重要なコンポーネントです。ニューラルネットワークの最後に配置され、モデルのバックボーンとネックによって生成された処理済みの特徴マップを取得し、それらを具体的な出力に変換します。具体的には、検出ヘッドは2つの主要なタスクを実行します。潜在的なオブジェクトを事前定義されたカテゴリ(例:「車」、「人」、「犬」)に分類し、各検出されたオブジェクトを囲むバウンディングボックスの正確な座標を予測するために回帰を実行します。

Detection Head(検出ヘッド)の仕組み

物体検出に使用される典型的な畳み込みニューラルネットワーク(CNN)では、入力画像は一連の層を通過します。初期の層(バックボーン)は、エッジやテクスチャのような低レベルの特徴を抽出し、より深い層はより複雑なパターンを捉えます。検出ヘッドは、これらの高レベルの特徴を統合して、目的の出力を生成する最終段階です。

検出ヘッドの設計は、さまざまな物体検出モデル間の重要な差別化要因です。一部のヘッドは速度を重視して設計されており、エッジデバイスでのリアルタイム推論に適しています。一方、他のヘッドは最大の精度のために最適化されています。平均適合率 (mAP)などの指標で測定されることが多い検出モデルのパフォーマンスは、検出ヘッドの有効性に大きく影響されます。さまざまなアーキテクチャのパフォーマンスを確認するには、モデルの比較をご覧ください。

最新アーキテクチャにおけるDetection Heads

現代の深層学習では、検出ヘッドの設計に大きな進化が見られます。アンカーベースアンカーフリー検出器の区別は特に重要です。

  • アンカーベースのヘッド: これらの従来のヘッドは、さまざまなサイズとアスペクト比の事前定義されたボックス(アンカー)のセットを使用します。ヘッドは、これらのアンカーをシフトおよびスケールして、画像内のグラウンドトゥルースオブジェクトと一致させる方法を予測します。
  • アンカーフリーヘッド: Ultralytics YOLO11を含むより最近のモデルは、アンカーフリーヘッドを使用することがよくあります。これらのヘッドは、オブジェクトの中心のようなキーポイントを識別するなどして、オブジェクトの場所を直接予測します。このアプローチは、モデルの設計を簡素化し、珍しい形状のオブジェクトに対する柔軟性を向上させることができます。YOLO11がアンカーフリーであることの利点に関するこのブログで詳しく説明されています。

これらのコンポーネントの開発は、PyTorchTensorFlowのような強力なフレームワークに依存しており、カスタムモデルを構築およびトレーニングするためのツールを提供します。Ultralytics HUBのようなプラットフォームは、このプロセスをさらに効率化します。

実際のアプリケーション

検出ヘッドの有効性は、物体検出に基づいて構築された多数のAIアプリケーションのパフォーマンスに直接影響します。

  1. 自動運転車: 自動運転車では、検出ヘッドは、歩行者、他の車両、および交通標識をリアルタイムで識別して特定するために不可欠です。これらの予測の速度と精度は、安全なナビゲーションに不可欠であり、Waymoのような企業が多用している技術です。これには、多様で動的な環境に対応できる堅牢な検出ヘッドが必要です。
  2. セキュリティと監視: 検出ヘッドは、ビデオフィード内の不正な人物、放置されたオブジェクト、または特定のイベントを識別することにより、自動監視システムを強化します。この機能は、Ultralyticsセキュリティアラームシステムガイドなどのアプリケーションの基本です。
  3. 医用画像解析: 検出ヘッドは、医療スキャンで腫瘍や骨折のような異常を正確に特定することにより、放射線科医を支援し、より迅速かつ正確な診断に貢献します。腫瘍検出にYOLO11を使用するについて読むことで、このアプリケーションについて詳しく学ぶことができます。
  4. 製造業:工場では、検出ヘッドにより、組立ライン上の製品の欠陥を特定することで、自動化された製造業における品質管理が可能になります。
  5. Retail Analytics: これらのコンポーネントは、在庫管理や顧客の来店パターン分析などのアプリケーションに使用されます。

YOLOv8のようなモデルの高度な検出ヘッドは、幅広いタスクとシナリオで高いパフォーマンスを保証するために、COCOなどの大規模なベンチマークデータセットでトレーニングされています。最終的な出力は、冗長な検出を除外するために、Non-Maximum Suppression(NMS)などの手法を使用して洗練されることがよくあります。より詳細な知識については、CourseraDeepLearning.AIなどのプロバイダーが提供するオンラインコースで、包括的な学習パスを利用できます。

Ultralyticsコミュニティに参加しませんか?

AIの未来を共に切り開きましょう。グローバルなイノベーターと繋がり、協力し、成長を。

今すぐ参加
クリップボードにコピーしました