Yolo 深圳
深セン
今すぐ参加
用語集

Two-Stage物体検出器

2段階オブジェクト検出器のパワーをご覧ください。複雑なコンピュータビジョンタスクにおいて、正確なオブジェクト検出を実現するための、精度に重点を置いたソリューションです。

二段階物体検出器は、高度なディープラーニング・モデルの一種である。 ディープ・ラーニング・モデルの一種で 画像内のオブジェクトを高精度で特定するために設計された、洗練されたディープラーニングモデルのクラスである。より高速なものと異なり、これらのアーキテクチャは、物体検出タスクを2つの異なるフェーズに分割する。 物体検出タスクは、2つの異なるフェーズに分けられる: 物体が存在する可能性のある領域を特定し、次にそれらの領域を分類しながら、その座標を絞り込む。 座標を絞り込む。このスプリット・プロセス・アプローチにより、これまで2段階検出器は、精度が最優先されるタスクのゴールド・スタンダードとなってきた。 精度が最重要視されるタスクでは、多くの場合、速度と計算資源を犠牲にして を犠牲にしてきた。

二段階のワークフロー

2段階検出器の構造は漏斗のように機能し、広い画像から特定の対象物にデータを絞り込む、 分類します。このプロセスには通常 ResNetのような基幹ネットワークで特徴を抽出する、 その後、2つの重要なステージが続きます:

  1. 領域提案:最初の段階では、しばしば領域提案ネットワーク(RPN)と呼ばれるコンポーネントを用いる。 このネットワークは、バックボーンによって生成された特徴マップをスキャンして このネットワークは、バックボーンによって生成された特徴マップを走査し、「関心領域」(ROI)を特定する。この時点では、モデルは対象を分類しない。 基本的には背景フィルターとして機能し、何かを含む可能性の高い領域と、何もない領域とにフラグを立てる。 基本的には背景フィルターとして機能し、何かを含みそうな領域と何もない領域にフラグを立てる。このコンセプトは Faster R-CNNの研究論文で固められた。
  2. 分類と絞り込み:第二段階では、提案された領域は一定のサイズにプールされ、特定の検出ヘッドに供給される。 サイズにプールされ、特定の検出ヘッドに供給される。この このヘッドは2つのタスクを同時に実行する。 例えば "人"、"車両")を割り当て 座標を調整するためにバウンディングボックス回帰を使用する、 ボックスが物体にしっかりとフィットするようにする。

Two-Stage検出器 vs. One-Stage検出器

2段式と1段式の違いを理解する 1段式物体検出器の違いを理解することは アプリケーションに適したモデルを選択するための基本です。

  • 2段検出器(例:Faster R-CNN、Mask R-CNN):これらのモデルは精度を優先する。提案と分類を分離することで 提案と分類を分離することで、オブジェクトが重なり合う複雑なシーンや、小さなディテールを非常にうまく扱うことができる。 よく処理する。しかし、このダブルチェックメカニズムは、より高い推論レイテンシをもたらす。 推論の待ち時間が長くなるため 即座の応答が要求される環境での導入は困難である。
  • 1段検出器(YOLO、SSDなど):のようなアーキテクチャ Ultralytics YOLOシリーズのようなアーキテクチャは、検出を単一の回帰 として扱う。それらは、画像ピクセルを直接バウンディングボックス座標とクラス確率に1パスでマッピングします。しかし 歴史的には2段階モデルよりも精度が低いが YOLO11のような最新のモデルは、リアルタイムの推論速度を維持しながら リアルタイム推論速度を維持している。

歴史上の主要建築

いくつかのアーキテクチャが2段階検出の進化を定義してきた:

実際のアプリケーション

2段式検出器は、小さな物体の位置特定に優れ、誤検出を最小限に抑えることができるため、特定の業界では依然として不可欠です。 誤検出を最小限に抑えることができるため、特定の業界では不可欠な存在となっています。

  • 医療画像解析 放射線学では、CTスキャンで小さな結節や腫瘍を識別するには、可能な限り高い感度が要求されます。二段階 モデルは、重要な診断を見逃すリスクを最小化するためにしばしば使用される。 ヘルスケアにおけるAI
  • 自動品質検査 製造業では、回路基板や機械加工部品の微細な欠陥を特定するために、高解像度の分析が必要です。 分析が必要です。2ステージ検出器の正確な位置特定機能は、より高速で粒度の粗いモデルでは見逃される可能性のある欠陥を検出するのに役立ちます。 検出することができます。

高精度検出の実装

Ultralytics 最先端の1段式モデルを専門としていますが、YOLO11 ような最新バージョンは、通常2段式検出器に関連する高精度を提供しながら、より高速な検出が可能です。 のような最新バージョンは、一般的に2ステージ検出器と関連する高い精度を提供するが、モデルの学習と推論が大幅に高速化されている。 モデルの学習と推論を大幅に高速化します。

以下は、事前に訓練されたYOLO11 モデルの実装方法である。 ultralytics パッケージ 高精度の検出結果を得る:

from ultralytics import YOLO

# Load a high-accuracy pre-trained YOLO11 model (Large variant)
# 'yolo11l.pt' offers a balance of high accuracy comparable to older two-stage models
model = YOLO("yolo11l.pt")

# Run inference on a local image
results = model("path/to/image.jpg")

# Display the results with bounding boxes
results[0].show()

関連概念

  • アンカーボックスあらかじめ定義されたボックス形状 多くの2段階検出器で、提案段階でオブジェクトのサイズとアスペクト比を推定するために使用される。
  • ノンマキシマムサプレッション(NMS) 冗長なオーバーラップボックスを除去するために1段検出器と2段検出器の両方で使用される後処理技術、 最も確実な検出だけが残るようにする。
  • Intersection over Union(IoU) 予測されたボックスとグランドトゥルースの重なりを測定するために使用されるメトリックで、RPN と精密化ヘッドの学習に不可欠です。

Ultralytics コミュニティに参加する

AIの未来を共に切り開きましょう。グローバルなイノベーターと繋がり、協力し、成長を。

今すぐ参加