用語集

バウンディングボックス

コンピュータービジョンにおけるバウンディングボックスの役割：物体の位置定義方法を学ぶ。座標形式、実世界での応用例、Ultralytics YOLO26の活用方法を探る。

バウンディングボックスとは、画像や動画フレーム内の特定オブジェクトを囲む座標セットで定義される矩形領域である。コンピュータビジョン（CV）分野では、これらのボックスが人工知能（AI）システムに個別のアイテムの位置特定と認識方法を教えるための基本注釈として機能する。単に画像全体を「自動車を含む」と分類するのではなく、バウンディングボックスによりモデルは自動車の正確な位置と空間的範囲を特定し、背景や他の物体から分離できます。この位置特定能力は、複数の物体を同時に高精度で識別することを目的とする物体検出タスクにおいて不可欠です。

中核概念と座標

視覚データを効果的に処理するため、機械学習（ML）モデルは特定の座標系に依存し、バウンディングボックスを数学的に表現する。選択された形式は、モデル訓練のためのデータ準備方法や、モデルが予測を出力する方法を決定することが多い。

XYXY座標:この形式は、左上隅と右下隅の絶対ピクセル値を用いてボックスを定義します。これは OpenCV や Matplotlib などの可視化ツールが画像上に直接矩形を描画する際には直感的です。
XYWH 形式: 以下のようなデータセットで一般的に見られる COCOなどで一般的なこの手法では、オブジェクトの中心点を指定した後、ボックスの幅と高さを続けます。この表現は学習プロセス中の損失関数の計算において極めて重要です。
正規化座標: 異なる解像度の画像間でスケーラビリティを確保するため、座標はしばしば0から1の範囲にスケーリングされる。これにより、モデルは異なる次元の入力を分析する際の汎化性能が向上する。

実際のアプリケーション

バウンディングボックスは、多様な産業における無数のAIソリューションの基盤となる要素です。正確な位置特定を可能にすることで、システムが物理世界と知的に相互作用することを実現します。

自動運転車： 自動運転車はバウンディングボックスを用いて、track 、他の車両、交通標識、障害物をリアルタイムでtrack 。この空間認識能力は、ナビゲーションや安全システムが瞬時の判断を下す上で極めて重要である。
小売分析：スマートストアでは、バウンディングボックスが棚の在庫監視やtrack 商品とのインタラクションtrack 支援します。このデータにより手動カウントなしで在庫補充の自動化が可能となり、買い物客の行動に関する洞察が得られます。