Yolo 深圳
深セン
今すぐ参加
用語集

One-Stage Object Detectors

ロボットや監視などのリアルタイム・アプリケーションに理想的な、YOLOような1段式物体検出器のスピードと効率をご覧ください。

一段階物体検出器は ディープラーニング(DL)モデルの一種である。 最適化されたディープラーニング(DL)モデルのカテゴリである。とは異なり 2段階の物体検出器とは異なり 検出プロセスを領域提案フェーズと分類フェーズに分ける2ステージの物体検出器とは異なり、1ステージのアーキテクチャは1回の評価パスで物体検出を行う オブジェクト検出を1回の評価パスで実行します。これにより タスクを直接回帰問題としてフレームワークすることで,これらのモデルは バウンディングボックスとクラス確率を同時に予測する を予測します。この合理化されたアプローチにより、大幅な高速処理が可能になり、次のような用途に適しています。 リアルタイム推論を必要とする リアルタイム推論を必要とするアプリケーションに最適です。

動作原理

一段検出器の中核をなすのは、畳み込みニューラルネットワーク(CNN)である。 畳み込みニューラルネットワーク(CNN) ある。 ある。このネットワークは画像全体を一度に処理する。 このネットワークは画像全体を一度に処理するため、「You Only Look Once(一度しか見ない)」と呼ばれ、格子状の特徴マップを作成する。初期の シングルショット・マルチボックス検出器(SSD)のような初期のアーキテクチャは、あらかじめ定義されたアンカーボックスに依存していた。 様々なスケールのオブジェクトを処理するために、定義済みのアンカーボックス 様々なスケールの物体を処理するために、あらかじめ定義されたアンカーボックスに頼っていた。しかし Ultralytics YOLO11のような最新の アンカーフリー設計を採用し、複雑さを軽減し 汎化性を向上させている。出力には通常、ローカライゼーションのための座標と 信頼度スコアが含まれる。 が含まれる。

二段階モデルとの比較

1段モデルと2段モデルの主な違いは、速度と精度のトレードオフにある。 R-CNNファミリーのような2ステージ・アーキテクチャは、一般に、小さな物体や隠れた物体に対してより高い精度を提供する。 のような2ステージ・アーキテクチャは一般に、小さい物体やオクルージョン物体に対してより高い精度を提供しますが、多段階処理のため計算コストが高くなります。 逆に、1段検出器は推論待ち時間の少なさを優先する。 リソースに制約のあるハードウェ リソースに制約のあるハードウェアへの展開を可能にします。最近の進歩としては YOLOv1から次期 YOLO26(2025年後半を目標)を含む最近の進歩は、エンド・ツー・エンド・トレーニングと高度な損失関数を利用し と高度な損失関数を利用し、精度の差を縮める。 精度のギャップを縮め、多くの場合、2段階モデルに匹敵するか、それを上回ります。

実際のアプリケーション

ワンステージ検出器の効率性は、即応性が重要視される様々な分野での技術革新の原動力となっています。 革新の原動力となっています:

  1. 自律走行車:自動運転システムは、歩行者、車両、交通標識を識別するためにビデオフィードを瞬時に処理する必要があります。 Waymoのような業界のリーダーは、乗客の安全とスムーズなナビゲーションを確保するために、高速検出に依存している。 とスムーズなナビゲーションを確保する。
  2. スマート・マニュファクチャリング:これらのモデルは、高速組立ラインでの自動品質保証を容易にし、生産速度を落とすことなくリアルタイムで欠陥を検出したり、部品の配置を確認したりすることができます。 部品の配置をリアルタイムで検証することができます。
  3. エッジAI:軽量なアーキテクチャのため、ワンステージ検出器は、以下のようなコンパクトなデバイスで実行するのに理想的です。 ラズベリーパイや やNVIDIA Jetsonのような小型デバイスで動作させるのに理想的で、遠隔地のカメラやドローンにインテリジェンスをもたらす。 カメラやドローンにインテリジェンスをもたらします。

テクニカル・インプリメンテーション

正確な結果を保証するために、これらのモデルはしばしば、1つの物体に対して複数の潜在的な箱を予測する。後処理 のようなテクニック 非最大抑制(NMS)フィルター に基づいて、これらの冗長な予測をフィルタリングします。 インターセクション・オーバー・ユニオン(IoU の閾値に基づいて冗長予測をフィルタリングする。1段検出器の実装は、以下のような最新のライブラリを使えば簡単です。 PyTorchUltralytics Python パッケージのような最新のライブラリを使えば簡単です。

次の例は、事前に訓練されたYOLO11 モデルを使った推論の実行方法を示している:

from ultralytics import YOLO

# Load the YOLO11 model, a state-of-the-art one-stage detector
model = YOLO("yolo11n.pt")

# Run inference on a local image or URL
results = model("https://ultralytics.com/images/bus.jpg")

# Display the detected objects with bounding boxes
results[0].show()

Ultralytics コミュニティに参加する

AIの未来を共に切り開きましょう。グローバルなイノベーターと繋がり、協力し、成長を。

今すぐ参加