Yolo 深圳
深セン
今すぐ参加
用語集

バウンディングボックス

バウンディングボックスが、物体検出、AI、機械学習システムをどのように実現するかを学びます。コンピュータビジョンアプリケーションにおけるバウンディングボックスの役割を探求しましょう。

バウンディングボックスとは、画像や動画フレーム内の特定オブジェクトを囲む座標セットで定義される矩形領域である。コンピュータビジョン(CV)分野では、これらのボックスが人工知能(AI)システムに個別のアイテムの位置特定と認識方法を教えるための基本注釈として機能する。 単に画像全体を「自動車を含む」と分類するのではなく、 バウンディングボックスによりモデルは自動車の正確な位置と空間的範囲を特定し、 背景や他の物体から分離できます。この位置特定能力は、 複数の物体を同時に高精度で識別することを目的とする 物体検出タスクにおいて不可欠です。

中核概念と座標

視覚データを効果的に処理するため、 機械学習(ML)モデルは特定の座標系に依存し、 バウンディングボックスを数学的に表現する。 選択された形式は、モデル訓練のためのデータ準備方法や、 モデルが予測を出力する方法を決定することが多い。

  • XYXY座標:この形式は、左上隅と右下隅の絶対ピクセル値を用いてボックスを定義します。これは OpenCVMatplotlib などの可視化ツールが画像上に直接矩形を描画する際には直感的です。
  • XYWH 形式: 以下のようなデータセットで一般的に見られる COCOなどで一般的なこの手法では、 オブジェクトの中心点を指定した後、ボックスの幅と高さを続けます。この表現は学習プロセス中の損失関数の計算において極めて重要です。
  • 正規化座標: 異なる解像度の画像間でスケーラビリティを確保するため、 座標はしばしば0から1の範囲にスケーリングされる。 これにより、モデルは異なる次元の入力を分析する際の汎化性能が向上する。

実際のアプリケーション

バウンディングボックスは、多様な産業における無数のAIソリューションの基盤となる要素です。 正確な位置特定を可能にすることで、システムが物理世界と知的に相互作用することを実現します。

  • 自動運転車 自動運転車はバウンディングボックスを用いて、track 、他の車両、交通標識、障害物をリアルタイムでtrack 。 この空間認識能力は、ナビゲーションや安全システムが瞬時の判断を下す上で極めて重要である。
  • 小売分析スマートストアでは、 バウンディングボックスが棚の在庫監視やtrack 商品とのインタラクションtrack 支援します。このデータにより 手動カウントなしで在庫補充の自動化が可能となり、買い物客の行動に関する洞察が得られます。

バウンディングボックスの実践

現代的なアーキテクチャを使用する場合、 YOLO26モデルは 境界ボックスとともにクラスラベルと 信頼度以下の例は、画像に対して推論を実行し、バウンディングボックス座標にアクセスする方法を示しています。 ultralytics パッケージで提供される。

from ultralytics import YOLO

# Load the YOLO26 model
model = YOLO("yolo26n.pt")

# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")

# Access bounding box coordinates (xyxy format) for the first detected object
boxes = results[0].boxes
print(boxes.xyxy[0])  # Output: tensor([x1, y1, x2, y2, ...])

関連用語と区別

バウンディングボックスは一般的な検出では標準的ですが、より詳細なタスクで使用される他のアノテーションタイプとは異なります。

  • インスタンスセグメンテーション: 矩形の境界ボックスとは異なり、セグメンテーションはオブジェクトの正確な輪郭をトレースするピクセル単位のマスクを生成します。 これは、大まかな位置よりも正確な形状が重要な場合に有用です。
  • 方向付きバウンディングボックス(OBB)標準的なバウンディングボックスは軸に平行(直方体)です。OBBは回転可能で、衛星画像内の船舶やコンベアベルト上の荷物など角度のある物体に適合します。これによりより密接なフィットが実現され、背景ノイズが低減されます。
  • キーポイントオブジェクトを囲む代わりに、キーポイントは特定のランドマーク(例えば姿勢推定のための人体の関節)を特定する。

注釈と管理のためのツール

高品質なバウンディングボックス注釈の作成は、機械学習パイプラインにおける重要なステップです。 Ultralytics データ注釈とデータセット管理のためのツールを提供することで、このプロセスを簡素化します。適切な注釈により、モデルは物体を正確に識別することを学習し、過学習や背景の混同などのエラーを最小限に抑えます。 推論時には ノン・マキシマム・サプレッション(NMS)などの 高度な技術を用いて 予測を精緻化します。これにより重複するバウンディングボックスを除去し、 各オブジェクトに対して最も正確な検出結果のみを残します。

Ultralytics コミュニティに参加する

AIの未来を共に切り開きましょう。グローバルなイノベーターと繋がり、協力し、成長を。

今すぐ参加