Yolo 深圳
深セン
今すぐ参加
用語集

バウンディングボックス

バウンディングボックスが、物体検出、AI、機械学習システムをどのように実現するかを学びます。コンピュータビジョンアプリケーションにおけるバウンディングボックスの役割を探求しましょう。

バウンディングボックス(bounding box)とは、座標によって定義される矩形領域のことで、画像やビデオフレーム内の特定の特徴やオブジェクトを分離する。 画像やビデオフレーム内の特定の特徴や物体を分離する座標で定義された矩形領域です。コンピュータビジョンの領域では コンピュータビジョンの領域では、この注釈は 人工知能(AI)システムが 人工知能(AI)システムは 人工知能(AI)システムは、単にシーンに存在すると認識するだけでなく、アイテムがどこにあるかを「見る」ことができます。主に オブジェクト検出タスクで主に使用されるバウンディングボックスは バウンディングボックスは、車、人、製品などのターゲットの空間的な範囲を概説し、通常、クラスラベルとモデルの確信度を示す信頼度スコアに関連付けられます。 通常、クラスラベルとモデルの確実性を示す信頼スコアが関連付けられます。

座標系とフォーマット

機械学習(ML)モデルが視覚データを数学的に処理できるように 視覚データを数学的に処理するために、バウンディングボックスは特定の座標系を使って表現される。どの 形式の選択は、多くの場合、学習に使用されるデータセットまたは検出アーキテクチャの特定の要件に依存する。 検出アーキテクチャの特定の要件に依存する。

  • XYXY(コーナー座標):このフォーマットでは、左上隅 ($x1、 y1$)と右下隅($x2, y2$)の絶対ピクセル値を使います。非常に直感的で、次のような可視化ライブラリでよく使われます。 のような Matplotlibのような可視化ライブラリでよく使われます。
  • XYWH(センターサイズ):COCOデータセットによって普及した。 COCO データセットでよく使われる。 オブジェクトの中心点($x_center, y_center$)とボックスの幅と高さを指定する。この形式は モデル学習時に損失関数を計算するのに重要である。 計算するのに重要である。
  • 正規化された座標:正規化座標 異なる画像解像度でスケーラビリティを確保するため、 座標は多くの場合、画像の寸法に対して0から1の範囲に正規化されます。これによりモデルは をより一般化することができます。

バウンディングボックスの種類

標準的な長方形のボックスは多くのシナリオに適合するが、複雑な実世界環境では、より特殊な形状が必要になることもある。 特殊な形状が必要になることがあります。

  • Axis-Aligned Bounding Box(AABB):画像軸(縦軸と横軸)に平行な辺を持つ標準的なボックス。 エッジが画像軸(垂直および水平)に平行な標準的なボックスです。計算効率が高く、以下のような高速モデルのデフォルト出力です。 モデルのデフォルト出力です。 YOLO11.
  • OBB(Oriented Bounding Box):オブジェクトが回転していたり、薄かったり、密着していたりする場合(港の船や文書のテキストなど)。 標準のボックスでは背景ノイズが多すぎる場合があります。OBB Oriented Bounding Boxには、角度パラメータが追加されています、 これにより、矩形が回転してオブジェクトにぴったりとフィットします。これは 衛星画像の解析

実際のアプリケーション

バウンディング・ボックスは、さまざまな業界における高度な意思決定システムの構成要素として機能している。

  1. 自律走行車:自動運転技術は、空間認識を維持するためにバウンディングボックスに大きく依存している。 空間認識を維持するために歩行者や信号 歩行者、信号機、他の車の周囲にボックスを描くことで、システムは距離と軌道を推定し、衝突を防ぐ。 衝突を防ぐ。これについては 自動車のAI
  2. 小売業と在庫管理:スマートな店舗では、バウンディングボックスを使用して棚の商品をtrack います。 システムは在庫切れの商品を特定したり、カート内の商品をローカライズすることでチェックアウトプロセスを自動化することができます。これにより は効率を向上させ、最新の小売ソリューションの重要な要素です。 重要な要素です。

バウンディングボックスとセグメンテーション

バウンディングボックスと画像セグメンテーションを区別することは重要である。 画像セグメンテーションと区別することが重要である。 バウンディングボックスを画像セグメンテーションと区別することは重要である。

  • バウンディングボックス:粗い位置特定を行う。ボックスで囲むことで、オブジェクトのおおまかな位置を示す。 ボックスで囲む。アノテーションが速く、リアルタイム推論では計算量が少ない。 リアルタイム推論
  • インスタンス分割:オブジェクトの正確な形状の輪郭を描く、ピクセルパーフェクトなマスクを作成する。 セグメンテーションはより正確ですが、計算量が多くなります。例えば 医療画像解析のような、腫瘍の正確な セグメンテーションは、単純なバウンディングボックスよりも好まれることが多い。

Python実践例

次のスニペットは ultralytics ライブラリを使ってバウンディングボックスを生成する。私たちは 事前に訓練された YOLO11 検出されたオブジェクトの座標データを印刷する。 検出されたオブジェクトの座標データを印刷します。

from ultralytics import YOLO

# Load a pre-trained YOLO11 model
model = YOLO("yolo11n.pt")

# Run inference on an online image
results = model("https://ultralytics.com/images/bus.jpg")

# Access the bounding box coordinates (xyxy format) for the first detection
box = results[0].boxes[0]
print(f"Object Class: {box.cls}")
print(f"Coordinates: {box.xyxy}")

これらの予測の精度は、一般的に次のような指標で評価される。 とIoUれる指標で評価される。 この指標は、予測されたボックスと、人間のラベラーによって提供されたグランドトゥルース注釈との重なりを測定する。 IoUは、予測されたボックスと、人間のラベラーによって提供された真実の注釈との重なりを測定します。高いIoU スコアが高ければ、モデルが正しくオブジェクトをローカライズしていることを示します。

Ultralytics コミュニティに参加する

AIの未来を共に切り開きましょう。グローバルなイノベーターと繋がり、協力し、成長を。

今すぐ参加