OBBオブジェクト検出のためのUltralytics YOLO11の使い方

アビラミ・ヴィナ

5分で読める

2024年10月8日

Ultralytics YOLO11がオリエンテッドバウンディングボックス(OBB)を使ってどのようにオブジェクト検出を強化するのか、またこのコンピュータビジョンタスクがどのようなアプリケーションに最適なのかを理解しましょう。

Ultralyticsが毎年開催しているハイブリッドイベントYOLO Vision 2024(YV24)」は、AIとコンピュータービジョンの最新のブレークスルーについて議論することに焦点を当てたイベントでした。これは、当社の最新モデルであるUltralytics YOLO11を紹介する絶好の機会でした。このモデルは、Ultralytics YOLOv8と同じコンピュータビジョンタスクをサポートし、ユーザーにとって新モデルへの移行を容易にします。

YOLOv8を、様々な角度からオブジェクトを検出するオリエンテッド・バウンディング・ボックス(OBB)オブジェクト検出に使っていたとしよう。コードを少し変更するだけで、YOLO11に切り替えることができ、精度や効率の向上から処理速度まで、YOLO11の改良の恩恵を受けることができる。YOLO11のようなモデルをまだ使ったことがない方のために説明すると、OBB検出は、YOLO11が様々な業界でどのように応用できるかを示す好例であり、実際にインパクトを与える実用的なソリューションを提供します。

この記事では、OBBオブジェクト検出とは何か、OBB検出を適用できる場所、OBB検出のためのYOLO11の使い方について見ていく。また、YOLO11の新機能がこれらのプロセスをどのように改善するのか、そして、OBB検出機能を最大限に活用するために、推論を実行し、カスタムモデルを訓練する方法についても説明する。

次世代YOLO11の機能には、OBBオブジェクト検出などのタスクが含まれる

OBBオブジェクト検出は、異なる角度のオブジェクトを検出することで、従来のオブジェクト検出をさらに一歩進めます。通常のバウンディングボックスは画像の軸に沿ったままですが、OBBはオブジェクトの向きに合わせて回転します。OBBオブジェクト検出は、オブジェクトが常にまっすぐでない航空画像や衛星画像の分析に使用できます。都市計画、エネルギー、輸送などの業界では、建物、車両、インフラストラクチャのような角度のある物体を正確に検出する能力は、具体的な利点を持つコンピュータビジョンアプリケーションの基礎を形成することができます。 

__wf_reserved_inherit
図1.通常のバウンディングボックスとオリエンテッドバウンディングボックスの比較。

YOLO11はOBB検出をサポートし、DOTA v1.0データセットで学習され、飛行機、船、貯蔵タンクなどのオブジェクトをさまざまな視点から検出します。YOLO11には、YOLO11n-obb (Nano)、YOLO11s-obb (Small)、YOLO11m-obb (Medium)、YOLO11l-obb (Large)、YOLO11x-obb (Extra Large)など、さまざまなニーズに合わせたモデルバリエーションがあります。各モデルは、異なるサイズを提供し、速度、精度、計算能力のレベルが異なります。ユーザーは、アプリケーションに適した速度と精度のバランスを提供するモデルを選ぶことができます。 

YOLO11のユースケースは、検出に新たな角度を導入している

YOLO11のオブジェクト検出機能、特にオリエンテッド・バウンディング・ボックスのサポートは、様々な業界に高い精度をもたらす。次に、YOLO11とOBB検出が、さまざまな分野で、より効率的で正確なプロセスを実現し、管理を容易にするために、実際の場面でどのように使われるのか、いくつかの例を見てみよう。

YOLO11による都市計画とインフラモニタリング

都市のデザインやレイアウトに感心したことがあるとしたら、それは都市計画とインフラモニタリングの詳細な作業のおかげである。インフラモニタリングの多くの側面の1つは、貯蔵タンク、パイプライン、工業用地などの重要な構造物を特定し、管理することです。YOLO11は、都市計画担当者が航空画像を分析し、これらの重要な構成要素を迅速かつ正確に検出するのに役立ちます。 

バウンディングボックスによるオブジェクト検出は、さまざまな角度から見たオブジェクトの検出を可能にするため、特に有用である(航空画像ではよくあるケース)。工業地帯を追跡し、環境への影響を管理し、インフラが適切に維持されていることを確認するためには、精度が不可欠です。OBBは検出プロセスをより信頼性の高いものにし、プランナーが都市の成長、安全性持続可能性について情報に基づいた決定を下すのに役立つ。YOLO11を使用することで、プランナーは都市を円滑に運営するためのインフラを監視・管理することができます。

__wf_reserved_inherit
図2.YOLO11を使って空撮映像から貯蔵タンクを検出する。

ドローン、YOLO11、エッジAIによるソーラーパネルの検査

再生可能エネルギーや太陽光発電所のような技術革新が普及するにつれ、定期点検の重要性が高まっている。ソーラーパネルが効率的に動作しているかどうかをチェックする必要があります。時間が経つにつれて、ひび割れ、汚れの蓄積、ずれのようなものが性能を低下させます。定期的な点検は、こうした問題を早期に発見し、メンテナンスを行うことでスムーズな稼働を維持するのに役立ちます。

例えば、エッジAIとYOLO11を統合したドローンを使って、ソーラーパネルの損傷検査を行うことができる。エッジで画像を分析することで、検査プロセスの精度と効率が高まる。ドローンの動きや視点により、監視カメラの映像は様々な角度からソーラーパネルを捉えることが多い。このような場合、YOLO11のOBB検出は、ドローンがソーラーパネルを正確に識別するのに役立つ。 

YOLO11はフリート管理のための洞察を提供できる

港や港湾では毎週数百隻の船舶を扱っており、このような大規模な船団を管理することは困難である。さらに、航空写真で船舶を分析する場合、船舶の角度が異なることが多いため、困難な要素が伴います。そこで、YOLO11のOBB検出サポートが役に立ちます。 

OBB検出により、標準的な長方形の箱よりも様々な角度の船舶をより正確に検出することができます。YOLO11とOBBを使用することで、海運会社は船隊の位置と状態をより簡単に特定し、船隊の動きやサプライチェーン・ロジスティクスなどの重要な詳細を追跡することができます。このようなビジョン対応ソリューションは、航路を最適化し、遅延を減らし、航路全体の船隊管理を改善するのに役立ちます。

__wf_reserved_inherit
図3.YOLO11を使用して船舶と港湾を斜めから探知する。

AI開発者のためのYOLO11:バウンディングボックスの検出

もしあなたがYOLO11をOBB検出に使おうとしているAI開発者なら、簡単に始められる2つの選択肢がある。コードの扱いに慣れているなら、Ultralytics Pythonパッケージが最適です。クラウドトレーニング機能を備えた、ユーザーフレンドリーでコード不要のソリューションをお望みなら、Ultralytics HUBは、そのために設計された社内プラットフォームです。詳細については、UltralyticsHUBを使用したUltralytics YOLO11のトレーニングとデプロイに関するガイドをご覧ください。

YOLO11のOBBサポートが適用できる例を見てきたところで、Ultralytics Pythonパッケージを探索し、それを使ってどのように推論を実行し、カスタムモデルを訓練できるかを見てみよう。 

YOLO11を使った推論の実行

まず、YOLO11をPythonで使うには、Ultralyticsパッケージをインストールする必要がある。好みに応じて、pip、conda、またはDockerを使用してインストールすることができます。ステップバイステップの手順については、Ultralyticsインストールガイドを参照してください。インストール中に何らかの問題に直面した場合は、「よくある問題ガイド」に役立つトラブルシューティングのヒントが記載されています。

一度Ultralyticsパッケージをインストールすれば、YOLO11での作業は驚くほど簡単だ。推論の実行とは、新しい画像に対して予測を行うために学習済みモデルを使用するプロセスを指す。これはモデルのトレーニングとは異なり、新しいオブジェクトを認識したり、特定のタスクのパフォーマンスを向上させたりするためにモデルをティーチングすることです。推論は、モデルを未知のデータに適用する場合に使用します。

以下の例では、モデルを読み込み、それを使って画像上のバウンディングボックスを予測する方法を説明します。より詳細な例や高度な使い方のヒントについては、Ultralyticsの公式ドキュメントをご覧ください。

__wf_reserved_inherit
図4.YOLO11を使って推論を実行するコード・スニペット。

YOLO11カスタムモデルのトレーニング

YOLO11モデルをトレーニングすることで、特定のデータセットや タスク、例えばバウンディングボックスのオブジェクト検出などのパフォーマンスを微調整することができます。YOLO11のような事前にトレーニングされたモデルは、一般的なオブジェクト検出に使用できますが、カスタムモデルのトレーニングは、モデルがユニークなオブジェクトを検出したり、特定のデータセットでのパフォーマンスを最適化する必要がある場合に不可欠です。

以下のコード・スニペットでは、OBB検出のためのYOLO11モデルのトレーニング手順を説明する。 

まず、事前に訓練されたYOLO11 OBB固有の重み(yolo11n-obb.pt)を使ってモデルを初期化する。次に、学習関数を使用して、データセット設定ファイル、学習サイクル数、学習画像サイズ、学習を実行するハードウェア(CPUまたはGPUなど)などのパラメータを指定して、カスタムデータセットでモデルを学習する。トレーニング後、モデルのパフォーマンスを検証し、精度や損失などのメトリクスをチェックします。 

学習済みのモデルを使用して、新しい画像に対して推論を実行し、OBBを持つオブジェクトを検出して可視化することができます。また、学習済みのモデルは、エクスポート機能を使って ONNXなどの 形式に変換して配置することができます。

__wf_reserved_inherit
図5.OBB物体検出のためのYOLO11の学習例。

YOLO11のAI進化への道筋

Ultralytics YOLO11は、オリエンテッドなバウンディングボックスをサポートすることで、オブジェクト検出を次のレベルに引き上げます。さまざまな角度から物体を検出できるため、YOLO11はさまざまな業界のさまざまなアプリケーションに使用できます。例えば、都市計画、エネルギー、海運など、ソーラーパネル検査や車両モニタリングのような精度が重要な業界に最適です。より高速なパフォーマンスと精度の向上により、YOLO11はAI開発者が現実世界の課題を解決するのに役立ちます。 

AIがより広く採用され、日常生活に溶け込むようになれば、YOLO11のようなモデルがAIソリューションの未来を形作るだろう。

Vision AIの可能性を知るには、成長中のコミュニティに参加し、GitHubリポジトリを探索してください。私たちは、ヘルスケアから 自動運転車まで、様々な分野のイノベーションを推進しています。

AIの未来
を一緒に作りましょう!

機械学習の未来への旅を始めよう

無料で始める
クリップボードにコピーされたリンク