物体検出における検出ヘッドの重要な役割をご覧ください。特徴マップを洗練して、物体の位置とクラスを正確に特定します。
検出ヘッドは物体検出モデルの最後の、そしておそらく最も重要なコンポーネントであり、符号化された画像の特徴を実用的な予測に変換する意思決定層として機能する。 エンコードされた画像の特徴を実用的な予測に変換する意思決定層として機能する。ディープラーニング・ニューラルネットワークの ディープラーニング・ニューラルネットワークの一番最後、特に 検出ヘッドは高レベルの特徴マップを処理し、最終的な出力を生成する。 特徴マップを処理して最終的な出力を生成する。 オブジェクトのクラスと画像内の正確な位置である。ネットワークの初期レイヤーは特徴抽出に重点を置く。 検出ヘッドはこのデータを解釈し、「それは何か? "それは何か?""どこにあるのか?"
検出ヘッドの主な役割は、分類と回帰という2つの異なるが同時のタスクを実行することである。 回帰である。最新の オブジェクト検出アーキテクチャでは ヘッド内の別々のブランチで処理されることが多い。 これは、モデルが予測の異なる側面に特化できるようにするための設計上の選択です。
検出ヘッドからの出力は通常、検出候補の密な集合である。結果を確定するために のような後処理ステップ ノンマキシマムサプレッション(NMS) のような後処理ステップが適用されます。
検出ヘッドの設計は、モデルがどのように物体の定位問題にアプローチするかを決定する。
検出ヘッドの効率と精度は、複雑な人工知能(AI)の導入に不可欠である。 人工知能(AI)を複雑な 不可欠である。
検出ヘッドをCNNの他の主要コンポーネントと区別することは有益である。 畳み込みニューラルネットワーク(CNN):
以下のPython コード・スニペットは、事前にトレーニングされたYOLO11 モデルの検出ヘッドを検査する方法を示している。
その ultralytics パッケージに含まれている。これは、推論を担当する最終レイヤーの構造を理解するのに役立つ。
の構造を理解するのに役立つ。
from ultralytics import YOLO
# Load a pre-trained YOLO11 model
model = YOLO("yolo11n.pt")
# Inspect the final detection head layer
# This typically reveals the number of classes (nc) and anchors/outputs
print(model.model.model[-1])
# Run inference to see the head's output in action
results = model("https://ultralytics.com/images/bus.jpg")
検出ヘッドを理解することは、モデルの性能を最適化したり、高度なタスクを実行したりするために不可欠である。 モデル性能の最適化や高度なタスクの実行 新しいカスタムデータセットでモデルをトレーニングするためにヘッドを交換することが多い。 のような高度なタスクを実行するために不可欠です。研究者は常に のようなメトリクスを改善するために、研究者は常に新しいヘッド設計を試しています。 平均平均精度 コンピュータ・ビジョンが達成できる限界を押し広げています。


