物体検出における検出ヘッドの重要な役割をご覧ください。特徴マップを洗練して、物体の位置とクラスを正確に特定します。
検出ヘッドは、物体検出ニューラルネットワークアーキテクチャにおける最終的な意思決定層として機能します。 モデルの初期層が画像内の形状、テクスチャ、特徴を理解する役割を担う一方、検出ヘッドはこれらの情報を解釈し、 存在する物体とその位置を正確に予測する特定の構成要素です。 特徴抽出器が生成する抽象的で高次元のデータを実用的な結果に変換し、 通常は識別されたオブジェクトを囲む一連の境界ボックスと、 対応するクラスラベルおよび信頼度スコアを出力します。
検出ヘッドの機能を完全に理解するには、現代の検出器が3つの主要な段階で構成されていると視覚化すると役立つ。各段階はコンピュータビジョン(CV)パイプラインにおいて明確な目的を果たしている:
検出ヘッドの設計は、速度と精度を向上させるために大きく進化しており、特に従来の方法から現代のリアルタイム推論モデルへの移行に伴い顕著である。
検出ヘッドの精度は、安全上重要な産業環境における人工知能(AI)の導入において極めて重要です。Ultralytics 、データを容易にアノテーションし、これらの専用ヘッドをトレーニングできます。
次の例は、読み込む方法を示しています。
YOLO26 モデルを実行し、その検出ヘッドの出力を検査する。
推論が実行されると、ヘッドは画像を処理し、最終的な結果を返す。 boxes 座標と
クラスIDを含む。
from ultralytics import YOLO
# Load the YOLO26n model (nano version)
model = YOLO("yolo26n.pt")
# Run inference on an image to utilize the detection head
results = model("https://ultralytics.com/images/bus.jpg")
# The detection head outputs are stored in results[0].boxes
for box in results[0].boxes:
# Print the bounding box coordinates and the predicted class
print(f"Class: {int(box.cls)}, Coordinates: {box.xywh.numpy()}")
この相互作用は、検出ヘッドが複雑なニューラルネットワークの活性化を、開発者が物体追跡や計数といった下流タスクに活用できる読み取り可能なデータに変換する方法を浮き彫りにしている。