Yolo 深圳
深セン
今すぐ参加
用語集

アンカーボックス

アンカーボックスがどのようにアンカーベースの物体検出、分類、回帰、NMSための事前分布を可能にし、自律走行や小売業に応用されているかを学ぶ。

アンカーボックスは、多くの物体検出モデルのアーキテクチャの基礎となる概念である。 アンカーボックスは、多くの物体検出モデルのアーキテクチャの基礎となる概念である。 として機能する。画像をスキャンして任意の大きさの物体を探すのではなく このモデルは、ゼロから任意の寸法の物体をスキャンするのではなく、特定の高さと幅で定義されたこれらの固定された形状を出発点として使用します、 またはプリオールとして使用する。このアプローチは、絶対座標予測という困難な課題を、より扱いやすい回帰に変換することによって、学習プロセスを単純化する。 絶対座標予測という困難なタスクを、より管理しやすい回帰問題に変換することで、学習プロセスを単純化する。 テンプレートは、グラウンド・トゥルース・オブジェクトに適合するように調整する、つまり「オフセット」することを学習する。この のような一般的なアーキテクチャの成功には、この技術が極めて重要であった。 より高速なR-CNNファミリや初期のシングルステージ検出器のような一般的なアーキテクチャの成功において、この技術は極めて重要です。

アンカーボックスの機能

アンカーボックスの仕組みは、入力画像を高密度のグリッドの中心でタイリングする。各グリッドセルには アスペクト比とスケールが異なる複数のアンカーボックスが生成される。 各グリッドセルでは、背の高い歩行者や幅の広い車両など、さまざまな形状のオブジェクトに対応するため、縦横比やスケールの異なる複数のアンカーボックスが生成される。モデルの学習段階では モデルの学習段階では、システムはこれらのアンカーを と呼ばれるメトリックを使用して実際のオブジェクトと照合する。 Intersection over Union (IoU)と呼ばれる指標を使用する。アンカー がターゲット・オブジェクトと有意に重なるものは、ポジティブ・サンプルとしてラベル付けされる。

検出器のバックボーンは画像から特徴を抽出する、 検出ヘッドはこの特徴を用いて を並行して実行する:

  • 分類:モデルは、アンカーが特定のオブジェクト・クラスを含む確率を予測する。 クラスが含まれる確率を予測し、信頼スコアを割り当てる。
  • ボックス回帰:ネットワークは、アンカーをしっかりと囲む最終的なバウンディング・ボックスに形を変えるために必要な正確な座標オフセットを計算する。 をしっかりと囲む最終的なバウンディングボックスに再形成するために必要な、正確な座標オフセットを計算する。 オブジェクトをしっかりと囲む。

同じオブジェクトの重複予測を処理するために、次のような後処理ステップがあります。 非最大抑制(NMS)として知られる後処理ステップ と呼ばれる後処理ステップで、冗長なボックスをフィルタリングし、最も信頼度の高いボックスのみを保持する。次のようなフレームワーク PyTorchTensorFlowは、これらの複雑な操作を効率的に実行するために必要な計算ツールを提供する。 を提供する。

アンカーと関連概念

アンカーボックスを理解するには、コンピュータ・ビジョン(CV)の類似用語と区別する必要がある。 コンピュータビジョン(CV)の類似用語と区別する必要があります。

  • アンカーボックスとバウンディングボックスの比較:アンカーボックスとは、処理中に仮説として使用される理論上の固定テンプレートである。 処理中に仮説として使用される。バウンディングボックスとは 検出されたオブジェクトの座標を含む最終的な洗練された出力。
  • アンカーベースとアンカーフリー:従来のアンカーベース検出器 アンカー・ベースのディテクターは YOLOv5のような従来のアンカー・ベース検出器は、このような手動プリセットに依存している。対照的に、最新の のようなアンカーを使わない検出器では Ultralytics YOLO11のような最新のアンカーレス検出器では、オブジェクトの中心やキーポイント を直接予測する。このシフトは、アンカー次元に関連するハイパーパラメータのチューニングの必要性を排除することで、モデル設計を単純化する。 次元に関連するハイパーパラメータのチューニングが不要になり、モデル設計が簡素化される。 COCO.

実際のアプリケーション

アンカーボックスの構造的な性質は、オブジェクトの形状が一貫している環境で特に効果的である。 特に効果的です。

  1. 自律走行:自律走行 自律走行車のために開発されたシステムは 自律走行車用に開発されたシステムは、自動車、トラック、交通標識のような標準的な物体の検出に依存している。これらの物体はアスペクト比が比較的固定されているため、アンカーボックスを調整することで、物体を効率的に捉えることができる、 アンカーボックスは、それらを効率的にキャプチャするように調整することができる。ウェイモのような企業は ウェイモのような企業は、複雑な交通シナリオにおける安全性を確保するために、高度な検出パイプラインを使用している。 交通シナリオ
  2. 小売在庫管理:小売分析では 小売分析では、ビジョンシステムが棚を監視して在庫レベルを検出します。 在庫レベルをdetect します。包装された商品は一般的に均一な形状をしているため、アンカーベースのモデルで商品を正確にカウントし、在庫切れの商品を特定することができます。 品物をカウントし、在庫切れの商品を特定します。この自動化は AI主導の在庫管理をサポートし、手作業を減らします。

コード例

YOLO11 ような最新のモデルはアンカーを使用しないが、YOLOv5 ような初期のモデルはアンカーボックスを使用する。そのため ultralytics パッケージはこの複雑さを抽象化し、ユーザーが手動でアンカーを設定しなくても推論を実行できるようにする。 アンカーを手動で設定することなく推論を実行できる。次の例では、オブジェクトをdetect するために事前にトレーニングされたモデルをロードしている:

from ultralytics import YOLO

# Load a pretrained YOLOv5 model (anchor-based architecture)
model = YOLO("yolov5su.pt")

# Run inference on a static image from the web
results = model("https://ultralytics.com/images/bus.jpg")

# Display the detected bounding boxes
results[0].show()

このようなシステムの数学的基礎に興味がある人には、次のような教育プラットフォームがある。 Coursera(コーセラ)や DeepLearning.AIは、畳み込みニューラルネットワークと物体検出に関する詳細なコースを提供している。 を提供している。

Ultralytics コミュニティに参加する

AIの未来を共に切り開きましょう。グローバルなイノベーターと繋がり、協力し、成長を。

今すぐ参加