用語集

検出ヘッド

検出ヘッドがリアルタイム物体検出を可能にする仕組みを学びましょう。Ultralytics におけるその役割を探り、高い精度でバウンディングボックスとラベルを予測する方法を理解しましょう。

検出ヘッドは、物体検出ニューラルネットワークアーキテクチャにおける最終的な意思決定層として機能します。モデルの初期層が画像内の形状、テクスチャ、特徴を理解する役割を担う一方、検出ヘッドはこれらの情報を解釈し、存在する物体とその位置を正確に予測する特定の構成要素です。特徴抽出器が生成する抽象的で高次元のデータを実用的な結果に変換し、通常は識別されたオブジェクトを囲む一連の境界ボックスと、対応するクラスラベルおよび信頼度スコアを出力します。

頭部と脊柱・頸部を区別する

検出ヘッドの機能を完全に理解するには、現代の検出器が3つの主要な段階で構成されていると視覚化すると役立つ。各段階はコンピュータビジョン（CV）パイプラインにおいて明確な目的を果たしている：

バックボーン:これはネットワークの初期部分であり、多くの場合 ResNetやCSPNetのような畳み込みニューラルネットワーク（CNN）です。生入力画像を処理して、視覚パターンを表す特徴マップを生成します。
首：背骨と頭部の間に位置し、首は異なるスケールの特徴を洗練させ統合する。特徴ピラミッドネットワーク（FPN）のようなアーキテクチャは、文脈を集約することでモデルが様々なサイズのdetect 。
ヘッド：首から精製された特徴量を消費する最終コンポーネント。実際の分類（それは何か？）と回帰（それはどこにあるか？）のタスクを実行する。

進化：アンカーベース対アンカーフリー

検出ヘッドの設計は、速度と精度を向上させるために大きく進化しており、特に従来の方法から現代のリアルタイム推論モデルへの移行に伴い顕著である。

アンカーベースのヘッド：従来の単段階物体検出器は、事前定義されたアンカーボックス（様々なサイズの固定参照形状）に依存していた。ヘッドは、物体に合わせるためにこれらのアンカーをどれだけ引き伸ばすか、またはシフトするかを予測した。この手法は、Faster R-CNNに関する基礎研究で詳細に説明されている。
アンカーフリーヘッド： 最新のYOLO26を含む最先端モデルは、アンカーフリー検出器を採用している。これらのヘッドは特徴マップのピクセルから直接物体の中心位置と寸法を予測するため、手動によるアンカー調整が不要となる。これによりアーキテクチャが簡素化され、新規物体形状への汎化能力が向上する。この手法はしばしば完全畳み込み型ワンステージ物体検出（FCOS）と関連付けられることが多い技術である。

実際のアプリケーション

検出ヘッドの精度は、安全上重要な産業環境における人工知能（AI）の導入において極めて重要です。Ultralytics 、データを容易にアノテーションし、これらの専用ヘッドをトレーニングできます。

自動運転： 自動車向けAIにおいて、検知ヘッドは歩行者、信号機、その他の車両をリアルタイムで識別する役割を担う。高度に最適化されたヘッドは推論遅延を十分に低く保ち、車両が瞬時に反応できるようにする。
医療診断： 医療画像解析において、検出ヘッドはMRIスキャン内の腫瘍などの異常を特定するために微調整される。回帰分岐は病変の正確な境界線を輪郭化するために極めて正確でなければならず、医療ソリューションにおいて医師を支援する。

コード例

次の例は、読み込む方法を示しています。 YOLO26 モデルを実行し、その検出ヘッドの出力を検査する。推論が実行されると、ヘッドは画像を処理し、最終的な結果を返す。 boxes 座標とクラスIDを含む。

from ultralytics import YOLO

# Load the YOLO26n model (nano version)
model = YOLO("yolo26n.pt")

# Run inference on an image to utilize the detection head
results = model("https://ultralytics.com/images/bus.jpg")

# The detection head outputs are stored in results[0].boxes
for box in results[0].boxes:
    # Print the bounding box coordinates and the predicted class
    print(f"Class: {int(box.cls)}, Coordinates: {box.xywh.numpy()}")

この相互作用は、検出ヘッドが複雑なニューラルネットワークの活性化を、開発者が物体追跡や計数といった下流タスクに活用できる読み取り可能なデータに変換する方法を浮き彫りにしている。

検出ヘッド

Ultralytics YOLO モデルをトレーニングし、業種を問わずワークフローを効率化する

お客様のイノベーションを強化する柔軟なエンタープライズライセンスソリューション

Ultralytics YOLOAIモデルを数秒でトレーニング

頭部と脊柱・頸部を区別する

進化：アンカーベース対アンカーフリー

実際のアプリケーション

コード例

このカテゴリの関連記事

コンピュータービジョンを活用した12の航空写真活用事例

単眼深度推定とは何か？概要

Ultralytics YOLO を用いたAI脅威検知の活用事例

Ultralytics コミュニティに参加する

検出ヘッド

Ultralytics YOLO モデルをトレーニングし、業種を問わずワークフローを効率化する

お客様のイノベーションを強化する柔軟なエンタープライズライセンスソリューション

Ultralytics YOLOAIモデルを数秒でトレーニング

頭部と脊柱・頸部を区別する

進化：アンカーベース対アンカーフリー

実際のアプリケーション

コード例

このカテゴリの関連記事

コンピュータービジョンを活用した12の航空写真活用事例

単眼深度推定とは何か？ 概要

Ultralytics YOLO を用いたAI脅威検知の活用事例

Ultralytics コミュニティに参加する

単眼深度推定とは何か？概要