OBB（Oriented bounding box）検出とは何ですか？|Ultralytics

オブジェクトがどのように配置されていようと、どの方向を向いていようと、それを認識することは、人間にとっては自然なことです。交差点にある車や港にあるボートなど、私たちはそれが何であるか、どちらの方向を向いているかを容易に判断できます。しかし、人工知能（AI）システムにとっては、そう簡単ではありません。

例えば、画像や動画の理解に焦点を当てたAIの一分野であるコンピュータビジョンは、物体検出などのタスクを可能にし、機械がシーン内の物体を識別して特定するのに役立ちます。従来の物体検出は、軸に沿ったバウンディングボックスを使用して物体の周りにボックスを描画します。これらのボックスは、直線的な側面と固定された直角を持っています。このアプローチは、物体が直立しており、互いに近すぎない場合にうまく機能します。

しかし、オブジェクトが傾いたり、回転したり、互いに接近している場合、従来の物体検出では正確に捉えるのが難しいことがよくあります。これらのより複雑な状況に対処するために、Oriented Bounding Box（OBB）検出などの手法が導入されました。標準のバウンディングボックスとは異なり、OBBは回転してオブジェクトの角度と形状に合わせることができ、よりタイトで正確なフィットを可能にします。

のようなコンピュータビジョンモデル Ultralytics YOLO11OBB検出をサポートするUltralytics YOLO11のようなコンピュータビジョンモデルは、特に空中監視のような物体の向きが重要なシナリオにおいて、様々なリアルタイムアプリケーションを可能にする。それ以外にも、OBB検出はヘルスケア、農業、文書分析などでも使用されている。

この記事では、OBB検出とは何か、その仕組み、そして実際のシナリオでどこに適用されているかについて解説します。それでは、始めましょう！

__wf_reserved_inherit — 図1.ボートのOBB検知にYOLO11 使用したデモ例。

‍

傾斜バウンディングボックスとは？

指向性バウンディングボックスは、コンピュータビジョンで画像内の検出されたオブジェクトを表すために使用される長方形のボックスの一種です。標準のバウンディングボックスは画像の水平軸と垂直軸に沿って配置されますが、OBBはオブジェクトの実際の角度に合わせて回転できます。

この回転する能力は、いくつかの利点をもたらします。OBBは、オブジェクトの向きにより近い位置に揃えることができるため、ボックスをオブジェクトの形状と方向にぴったりと合わせることができます。その結果、検出がより正確かつ精密になります。

OBBは、航空映像に映るカーブした道路を曲がる車、机の上の傾いた本、医療スキャンで回転した腫瘍など、物体が完全に直立していない場合に特に役立ちます。物体の角度をより正確に一致させることで、OBBは検出性能を向上させ、背景の干渉を減らし、物体の位置と同じくらいにその向きが重要なアプリケーションに特に適しています。

‍

OBB検出と物体検出

OBB検出と従来の物体検出は、最初は似ているように見えるかもしれませんが、異なる方法で、異なる状況で使用されます。例を挙げて、それらがどのように比較されるかを詳しく見てみましょう。

YOLO11ようなコンピュータ・ビジョン・モデルは、工業検査など様々な実世界のアプリケーションにおいて、物体をdetect ・classify するために学習させることができる。ベルトコンベア上をさまざまな機械部品が移動する工場の組立ラインを考えてみよう。いくつかの部品はきれいに配置されているかもしれないが、他の部品はわずかに回転していたり、傾いていたり、振動や速度のために重なっているかもしれない。

従来の物体検出では、画像の水平方向および垂直方向のエッジに沿った、直立した長方形のボックスを使用します。そのため、部品が回転すると、ボックスが適切にフィットしない可能性があり、オブジェクトの一部が除外されたり、背景が多すぎたりする可能性があります。これにより、検出の精度が低下し、システムが部品を確実に識別することが難しくなる可能性があります。

OBB検出を使用しているとしましょう。この場合、モデルは各パーツの正確な角度に合わせて回転するボックスを描画できます。傾いたギアまたは角度の付いたコンポーネントは、その形状と方向に合わせてボックスでしっかりと囲まれます。これは、特に自動品質管理やロボットによる仕分けなどのユースケースに関して、精度が向上し、エラーが減り、より信頼性の高い結果が得られることを意味します。

一般的なOBB検出モデル

OBB検出がどのようなものかをより深く理解したところで、それをサポートする最も広く使用されているVision AIモデルのいくつかを見てみましょう。

回転したり傾いたりした物体を検出するために特別に開発された高度なコンピュータビジョンモデルがいくつかあります。その中でもUltralytics YOLO モデルは、信頼性が高く効率的なOBB検出能力で特に有名です。

以前のバージョン Ultralytics YOLOv5のような初期のバージョンは、標準的なオブジェクト検出用に設計されていた。その後の Ultralytics YOLOv8や最近のYOLO1111は、OBB検出のネイティブ・サポートを導入した。特にYOLO1111は、速度を犠牲にすることなく最先端の精度を提供し、リアルタイム・アプリケーションにとってインパクトのある選択肢となっている。

YOLO11obb-obbのような事前訓練されたYOLO11 OBBモデルは、DOTAv1のようなデータセットで訓練される。DOTAv1は、飛行機、船、テニスコートなど、様々な角度や向きに現れる様々なオブジェクトクラスが注釈された航空画像で構成されている。

また、これらのモデルは、異なる性能ニーズに合わせて、ナノ（n-obb）から特大（obb-obb）まで、5つの異なるサイズが用意されている。このような汎用性により、都市インフラの監視や機械の検査、スキャン文書の斜め文字の読み取りなど、さまざまな業界で応用することができる。

バウンディングボックス検出のためのカスタムトレーニングYOLO11

実世界の多くの状況では、detect 必要があるオブジェクトは、標準的なトレーニングデータセットのものとはまったく異なる場合があります。例えば、生産ライン上の工具、製品パッケージ、回路基板上の部品などのオブジェクトは、回転していたり、不規則に配置されていたり、形状が異なっていたりする可能性があります。

このようなカスタムオブジェクトを正確にdetect するには、特に向きが重要な場合は、独自の画像とラベルを使用してYOLO11 ようなモデルを訓練することが重要です。このプロセスはカスタム・トレーニングと呼ばれる。

ここでは、YOLO11 OBB検出トレーニングのステップ・バイ・ステップを詳しく見ていこう：

画像収集：さまざまな角度、位置、および実際の環境から、ターゲットオブジェクトを示す画像を集めます。
‍
オブジェクトアノテーション：OBBをサポートするアノテーションツールを使用して、回転されたバウンディングボックス（OBB）を使用して各オブジェクトにラベルを付け、位置と向きの両方をキャプチャします。
‍
データセットの準備：画像とラベルをYOLO ディレクトリ構造に整理し、クラス名とデータセットのパスを記述したYAML設定ファイルを作成する。
‍
モデルのトレーニング：ニーズに合ったYOLO11 モデルのバージョンを選択し、ラベル付けされた画像からモデルが学習できるように、トレーニングプロセスを実行します。
‍。
評価とデプロイメント：トレーニング済みのモデルを新しい画像でテストし、その精度を評価し、製造、航空監視、ドキュメント分析などの実用的なアプリケーションにデプロイします。

OBB検出によって可能になる応用

中心から外れたり、傾いたりしている物体は、実際のシナリオではごく一般的です。OBB検出がこれらの物体を正確に検出することで、実際に違いを生み出すいくつかの例を見ていきましょう。

OBB検出を用いたX線画像解析

OBB検出は、精度を向上させることで、医用画像解析をさらに一歩進めることができます。医用画像には、腫瘍、臓器、骨などの解剖学的構造が含まれていることがよくあります。これらの構造は、不規則な形状とさまざまな方向で現れることがよくあります。OBBはオブジェクトの角度に合わせて回転できるため、より正確なローカリゼーションと測定が可能になり、診断と治療計画に不可欠です。

このアプローチは、骨の骨折のX線画像を分析する場合に特に効果的です。骨の位置と整列が重要な要素となるからです。たとえば、OBB検出は、小児肘のX線写真の分析に使用されています。骨の向きに合わせて調整することで、検出精度が向上しました。

‍

OBB検出による航空監視

航空監視は、公共安全、環境監視、都市計画などの分野で不可欠なツールである。ドローンや人工衛星によって撮影された画像は、船舶、車両、建物などの物体を識別するのに役立つ。しかし、これらの画像では、物体が小さく、異常な角度で写ることが多く、物体を正確にdetect することが難しくなっている。

OBB検出は、各オブジェクトの角度に合わせてバウンディングボックスを傾けることで、これを解決します。これにより、オブジェクトのサイズと方向の測定がより正確になり、都市計画、防衛、災害対応、環境モニタリングなどの分野でより適切な意思決定をサポートします。

OBB検出の興味深い例は、海上監視における船舶追跡です。衛星画像では、天候、照明、または動きにより、船舶がさまざまな角度やサイズで捉えられることがよくあります。OBBはこれらの変化に適応できるため、特に小型または部分的に隠れた船舶の検出が向上します。

‍

農業におけるOBB検出の利用

収穫後の作物の選別は、包装されて市場に出荷される前の品質を確保するための重要なステップである。リンゴやオレンジのような丸い果物には多くのシステムが有効だが、ニンジンやジザニアの新芽のような細長い作物は扱いが難しい。形が様々で、角度が異なることも多いため、正確なdetect 選別が難しいのだ。

この問題に取り組むため、研究者たちは、これらの作物をより正確に識別し、等級付けするために、方向バウンディングボックス（OBB）検出を使用するシステムを開発した。このシステムは、1枚の画像から複数の作物をdetect 、それらが傾いていたり重なっていたりしても、その品質と位置をリアルタイムで評価することができる。

OBB検出のメリットとデメリット

OBB検出を使用する利点をいくつかご紹介します。

ダウンストリームタスクへの入力の改善：インスタンスセグメンテーションや物体追跡などのコンピュータビジョンタスクは、より正確な物体検出が与えられた場合、より良いパフォーマンスを発揮できます。
空間認識の強化: OBBは、向きの角度を捉えることで、オブジェクトの整列と方向を理解することを可能にします。
混雑したシーンでの重複の削減: OBBは、混雑したシーンでもオブジェクトをより正確にフィットさせることで、曖昧さを軽減します。

複雑なシーンでの検出精度向上に役立つにもかかわらず、OBB検出には考慮すべきいくつかの制限事項があります。

ノイズに対する高い感受性： 角度予測の小さな誤差は、特に密集したオブジェクトや細長いオブジェクトの場合、検出精度に大きな影響を与える可能性があります。
‍
特殊なツールが必要： すべてのラベリングおよびトレーニングプラットフォームがOBBをネイティブにサポートしているわけではないため、それらを使用するには、追加のツールまたはセットアップが必要になる場合があります。
データセットの入手可能性の制限：標準的な物体検出と比較して、OBBアノテーションが付いた公開されているデータセットは現在少ないため、開始や結果の比較がやや難しくなる可能性があります。

主なポイント

傾斜バウンディングボックス検出により、コンピュータビジョンソリューションは、完全に真っ直ぐまたは整列していないオブジェクトをより簡単に認識できます。オブジェクトの位置と向きの両方をキャプチャすることにより、OBB検出は、医療画像の走査、農地の監視、または衛星写真の分析などの実際のユースケース全体で精度を高めます。

YOLO11 ようなモデルがOBB検出をより身近なものにしたことで、OBB検出は多くの業界にとって実用的な選択肢になりつつある。傾いていたり、重なっていたり、奇妙な形をしていたりする物体を扱う場合でも、OBB検出は、標準的な方法では見逃しがちな精度をさらに高めてくれます。

AIにご興味がありますか？当社のGitHubリポジトリを探索し、コミュニティと繋がり、ライセンスオプションを確認して、コンピュータビジョンプロジェクトを始めましょう。ソリューションページで、小売業におけるAIや物流業界におけるコンピュータビジョンなどのイノベーションについて詳しくご覧ください。

Oriented Bounding Box（OBB）検出とは何ですか？

傾斜バウンディングボックスとは？

OBB検出と物体検出

一般的なOBB検出モデル

バウンディングボックス検出のためのカスタムトレーニングYOLO11