用語集

One-Stage Object Detectors

ロボットや監視などのリアルタイム・アプリケーションに理想的な、YOLOような1段式物体検出器のスピードと効率をご覧ください。

一段階物体検出器はディープラーニング（DL）モデルの一種である。最適化されたディープラーニング（DL）モデルのカテゴリである。とは異なり 2段階の物体検出器とは異なり検出プロセスを領域提案フェーズと分類フェーズに分ける2ステージの物体検出器とは異なり、1ステージのアーキテクチャは1回の評価パスで物体検出を行うオブジェクト検出を1回の評価パスで実行します。これによりタスクを直接回帰問題としてフレームワークすることで，これらのモデルはバウンディングボックスとクラス確率を同時に予測するを予測します。この合理化されたアプローチにより、大幅な高速処理が可能になり、次のような用途に適しています。リアルタイム推論を必要とするリアルタイム推論を必要とするアプリケーションに最適です。

動作原理

一段検出器の中核をなすのは、畳み込みニューラルネットワーク（CNN）である。畳み込みニューラルネットワーク（CNN）である。である。このネットワークは画像全体を一度に処理する。このネットワークは画像全体を一度に処理するため、「You Only Look Once（一度しか見ない）」と呼ばれ、格子状の特徴マップを作成する。初期のシングルショット・マルチボックス検出器（SSD）のような初期のアーキテクチャは、あらかじめ定義されたアンカーボックスに依存していた。様々なスケールのオブジェクトを処理するために、定義済みのアンカーボックス様々なスケールの物体を処理するために、あらかじめ定義されたアンカーボックスに頼っていた。しかし Ultralytics YOLO11のような最新のアンカーフリー設計を採用し、複雑さを軽減し汎化性を向上させている。出力には通常、ローカライゼーションのための座標と信頼度スコアが含まれる。が含まれる。

二段階モデルとの比較

1段モデルと2段モデルの主な違いは、速度と精度のトレードオフにある。 R-CNNファミリーのような2ステージ・アーキテクチャは、一般に、小さな物体や隠れた物体に対してより高い精度を提供する。のような2ステージ・アーキテクチャは一般に、小さい物体やオクルージョン物体に対してより高い精度を提供しますが、多段階処理のため計算コストが高くなります。逆に、1段検出器は推論待ち時間の少なさを優先する。リソースに制約のあるハードウェリソースに制約のあるハードウェアへの展開を可能にします。最近の進歩としては YOLOv1から次期 YOLO26（2025年後半を目標）を含む最近の進歩は、エンド・ツー・エンド・トレーニングと高度な損失関数を利用しと高度な損失関数を利用し、精度の差を縮める。精度のギャップを縮め、多くの場合、2段階モデルに匹敵するか、それを上回ります。

実際のアプリケーション

ワンステージ検出器の効率性は、即応性が重要視される様々な分野での技術革新の原動力となっています。革新の原動力となっています：

自律走行車:自動運転システムは、歩行者、車両、交通標識を識別するためにビデオフィードを瞬時に処理する必要があります。 Waymoのような業界のリーダーは、乗客の安全とスムーズなナビゲーションを確保するために、高速検出に依存している。とスムーズなナビゲーションを確保する。
スマート・マニュファクチャリング:これらのモデルは、高速組立ラインでの自動品質保証を容易にし、生産速度を落とすことなくリアルタイムで欠陥を検出したり、部品の配置を確認したりすることができます。部品の配置をリアルタイムで検証することができます。
エッジAI:軽量なアーキテクチャのため、ワンステージ検出器は、以下のようなコンパクトなデバイスで実行するのに理想的です。ラズベリーパイややNVIDIA Jetsonのような小型デバイスで動作させるのに理想的で、遠隔地のカメラやドローンにインテリジェンスをもたらす。カメラやドローンにインテリジェンスをもたらします。

テクニカル・インプリメンテーション

正確な結果を保証するために、これらのモデルはしばしば、1つの物体に対して複数の潜在的な箱を予測する。後処理のようなテクニック非最大抑制（NMS）フィルターに基づいて、これらの冗長な予測をフィルタリングします。インターセクション・オーバー・ユニオン（IoU の閾値に基づいて冗長予測をフィルタリングする。1段検出器の実装は、以下のような最新のライブラリを使えば簡単です。 PyTorchや Ultralytics Python パッケージのような最新のライブラリを使えば簡単です。

次の例は、事前に訓練されたYOLO11 モデルを使った推論の実行方法を示している：

from ultralytics import YOLO

# Load the YOLO11 model, a state-of-the-art one-stage detector
model = YOLO("yolo11n.pt")

# Run inference on a local image or URL
results = model("https://ultralytics.com/images/bus.jpg")

# Display the detected objects with bounding boxes
results[0].show()

One-Stage Object Detectors

Ultralytics YOLO モデルをトレーニングし、業種を問わずワークフローを効率化する

お客様のイノベーションを強化する柔軟なエンタープライズライセンスソリューション

Ultralytics YOLOAIモデルを数秒でトレーニング

動作原理

二段階モデルとの比較

実際のアプリケーション

テクニカル・インプリメンテーション

このカテゴリの関連記事

人間が関与するループ内アノテーションが重要な理由を理解する

データセット蒸留とは何か？簡単な概要

オークリーメタAIグラスは、ビジョンAIでアイウェアの概念を再定義する

Ultralytics コミュニティに参加する

One-Stage Object Detectors

Ultralytics YOLO モデルをトレーニングし、業種を問わずワークフローを効率化する

お客様のイノベーションを強化する柔軟なエンタープライズライセンスソリューション

Ultralytics YOLOAIモデルを数秒でトレーニング

動作原理

二段階モデルとの比較

実際のアプリケーション

テクニカル・インプリメンテーション

このカテゴリの関連記事

人間が関与するループ内アノテーションが重要な理由を理解する

データセット蒸留とは何か？ 簡単な概要

オークリー メタAIグラスは、ビジョンAIでアイウェアの概念を再定義する

Ultralytics コミュニティに参加する

データセット蒸留とは何か？簡単な概要

オークリーメタAIグラスは、ビジョンAIでアイウェアの概念を再定義する