バウンディングボックス
バウンディングボックスが、物体検出、AI、機械学習システムをどのように実現するかを学びます。コンピュータビジョンアプリケーションにおけるバウンディングボックスの役割を探求しましょう。
バウンディングボックスは、コンピュータビジョンで使用される長方形のアノテーションで、画像またはビデオフレーム内のオブジェクトの位置を示します。これは物体検出の基本的な構成要素として機能し、オブジェクトの位置とスケールを定義するシンプルながら効果的な方法を提供します。機械学習では、モデルはラベル付けされたバウンディングボックスを持つ画像の大きなデータセットでトレーニングされ、オブジェクトを独自に識別してローカライズする方法を学習します。これらのモデルの出力には、ボックスの座標、クラスラベル(例:「車」、「人」)、およびモデルの予測に対する確信度を示す信頼スコアが含まれます。
バウンディングボックスの仕組み
通常、バウンディングボックスは、その位置とサイズを指定する一連の座標で定義されます。最も一般的な表現は次のとおりです。
- 左上隅の座標(x, y)と幅と高さ(w, h): この形式では、左上隅のx座標とy座標、およびボックスの幅と高さが指定されます。
- コーナーポイント(x_min, y_min, x_max, y_max): この形式は、長方形の左上と右下のコーナーの座標を定義します。
これらの座標は、深層学習モデルをトレーニングするために使用され、新しい、見えない画像に対してこれらの値を予測することを学習します。予測されたバウンディングボックスの精度は、多くの場合、Intersection over Union(IoU)と呼ばれるメトリックを使用して評価されます。これは、予測されたボックスとグラウンドトゥルースボックスの間の重複を測定します。 Ultralytics YOLO11などの最新の物体検出モデルは、リアルタイムで正確なバウンディングボックスを生成するように高度に最適化されています。
バウンディングボックスの種類
バウンディングボックスには、主に2つのタイプがあります。
- 軸に沿ったバウンディングボックス:これは最も一般的なタイプで、長方形の辺が画像の水平軸と垂直軸に沿っています。表現と処理は簡単ですが、回転しているオブジェクトや不規則な形状のオブジェクトには非効率的になる可能性があり、ボックスにかなりの背景領域が含まれる場合があります。
- Oriented Bounding Box (OBB): このタイプのボックスには、回転のための追加パラメータが含まれており、傾いたオブジェクトの周りによりぴったりとフィットさせることができます。OBBは、オブジェクトがさまざまな角度から見られることが多い衛星画像解析やドローンからの航空画像のような特殊なアプリケーションで特に役立ちます。YOLO11のようなモデルは、これらのシナリオをより効果的に処理するために傾斜した物体検出をサポートしています。
他の概念との関係
バウンディングボックスは、他のコンピュータビジョンタスクと密接に関連していますが、明確な目的を果たします。
- 物体検出 vs. 画像セグメンテーション: 物体検出はバウンディングボックスを使用してオブジェクトの位置を特定しますが、画像セグメンテーションはオブジェクトの形状をより詳細に把握できます。例えば、インスタンスセグメンテーションは、オブジェクトの周囲に長方形を描画するだけでなく、個々のオブジェクトの正確なピクセルレベルの境界を概説することで、さらに一歩進んでいます。これは、正確な形状情報を必要とするアプリケーションに役立ちます。詳細については、インスタンスセグメンテーションのガイドをご覧ください。
- バウンディングボックス vs. アンカーボックス: アンカーベースの検出器として知られる一部の物体検出モデルでは、「アンカーボックス」と呼ばれる事前定義されたボックスが、モデルが最終的なバウンディングボックスを予測するのに役立つ参照として使用されます。対照的に、アンカーフリーの検出器は、これらのプリセットなしでバウンディングボックスを直接予測することができ、多くの場合、モデルアーキテクチャが簡素化されます。
実世界のシナリオにおける応用
バウンディングボックスは、数多くの実用的なAIアプリケーションに不可欠です。
- 自動運転車:自動運転車は、深層学習モデルを通じて歩行者、他の車両、信号機を識別し、バウンディングボックスを使用して位置を特定するために、物体検出に大きく依存しています。この空間認識は、安全なナビゲーションに不可欠です。Waymoのような企業は、この技術を広範囲に紹介しています。Ultralyticsは、自動運転車におけるAIに関する洞察を提供しています。
- Retail Analytics: 小売業では、バウンディングボックスは、棚にある製品の検出、在庫レベルの監視、および来店者数パターンによる顧客行動の分析(オブジェクトのカウント)を通じて、AIを活用した在庫管理に役立ちます。
- セキュリティと監視: バウンディングボックスを使用すると、自動監視システムは、リアルタイムで個人またはオブジェクトを検出および追跡し、疑わしいアクティビティのアラートをトリガーできます。これは、セキュリティアラームシステムのようなアプリケーションを構築するための基礎となります。
- 医用画像解析:医療現場では、バウンディングボックスは、スキャン内の腫瘍のような潜在的な異常を強調表示することで、臨床医を支援し、より迅速な診断を可能にします。この例は、Radiology: Artificial Intelligence researchや、当社の医用画像解析ページでご覧いただけます。
- 農業: バウンディングボックスは、精密農業において、収穫のための果物の識別、作物の健康状態の監視、害虫の検出などのタスクに使用されます。詳細については、農業におけるコンピュータビジョンに関するブログをご覧ください。