Ultralytics YOLO11とそのアプリケーションについて知っておくべきすべて

アビラミ・ヴィナ

4 min read

2024年10月4日

Ultralyticsの新モデルYOLO11、その特徴、様々な業界におけるリアルタイムアプリケーションのすべてをご紹介します。知っておくべきことをすべてご説明します。

9月30日(月)、Ultralyticsは、Ultralyticsの年次ハイブリッドイベントであるYOLO Vision 2024(YV24)でのデビューに続き、コンピュータビジョンの最新の進歩であるUltralytics YOLO11を正式に発表した。AIコミュニティは、このモデルの能力を探求しようと躍起になっており、興奮に包まれている。より高速な処理、より高い精度、エッジデバイスとクラウド展開の両方に最適化されたモデルにより、YOLO11はリアルタイムコンピュータビジョンアプリケーションの可能性を再定義します

Ultralyticsの創設者兼CEOのグレン・ジョーチャーはインタビューの中で次のように語っている。私たちは、より少ないエポック、より少ない補強、より少ないデータでモデルを訓練できるようにしたいと考えています。最小の物体検出モデルであるYOLO11nのパラメータはわずか260万個で、JPEGのサイズに匹敵する。最大の物体検出モデルであるYOLO11xのパラメータは約5,600万個で、これでも他のモデルに比べると信じられないほど小さい。5年前のNvidia GPUのような安価なGPUでも、興奮と少しのコーヒーがあれば学習させることができる。"

この記事では、YOLO11の特徴、改良点、パフォーマンス・ベンチマーク、実際のアプリケーションを詳しく紹介し、このモデルで何ができるかを理解してもらう。始めよう!

YOLO11を理解する:過去のバージョンからの改善点

YOLO11は、コンピュータビジョンモデルのYOLO(You Only Look Once)シリーズの最新の進歩であり、YOLOv5や YOLOv8といった以前のバージョンよりも大幅に改良されています。Ultralyticsのチームは、YOLO11をより速く、より正確に、より効率的にするために、コミュニティからのフィードバックと最先端の研究を取り入れました。YOLO11は、物体検出インスタンス分割 画像分類など、YOLOv8と同じコンピュータ・ビジョン・タスクもサポートしています。実際、ユーザーは既存のワークフローを変更することなく、簡単にYOLO11に乗り換えることができる。

YOLO11の主なハイライトの1つは、前モデルと比較して、精度と速度の両方で優れた性能を発揮することです。YOLO11mは、YOLOv8mよりも22%少ないパラメータで、COCOデータセットにおいて高い平均精度(mAP)を達成しています。処理速度の面でも、YOLO11は以前のモデルを凌駕しており、迅速な検出と応答が重要であり、ミリ秒単位が重要なリアルタイム・アプリケーションに最適です。

下のベンチマークグラフは、YOLO11が従来のモデルと比べてどのように際立っているかを示している。横軸は、物体検出の精度を示すCOCO Box Average Precision(AP)。縦軸は、NVIDIA T4 GPU上のTensorRT10 FP16を使用したレイテンシを示し、このモデルがどれだけ高速にデータを処理するかを示しています。 

__wf_reserved_inherit
図1.YOLO11は最先端のリアルタイム物体検出機能を提供する。

YOLO11モデル発表:オープンソースと企業向けオプション

Ultralytics YOLO11の発売により、UltralyticsはYOLOシリーズを拡大し、オープンソースと エンタープライズモデルの両方を提供することで、業界全体の需要の高まりに応えています。

__wf_reserved_inherit
図2.今回の発表で、ウルトラリティクスは新たに30モデルを提供することになる。

YOLO11は、Nano、Small、Medium、Large、Xの5つの異なるモデルサイズを備えています。ユーザーは、コンピュータビジョンアプリケーションの特定のニーズに応じて最適なモデルを選択することができます。この5つのサイズは、画像分類物体検出インスタンス分割追跡姿勢推定方向バウンディングボックス(OBB)物体検出などのタスクに柔軟性を提供します。各サイズには各タスクで利用可能なモデルがあり、合計25のオープンソースモデルが Ultralyticsの提供する製品の中核を成しています。これらのモデルは、YOLO11nモデルが素晴らしい効率を提供するエッジデバイス上の軽量タスクから、YOLO11lやYOLO11xモデルを必要とする大規模なアプリケーションまで、幅広いアプリケーションに最適です。

Ultralyticsは初めて企業向けモデルを導入し、当社の製品提供における大きなマイルストーンとなります。YOLO11では、商用ユースケース向けに特別に設計された5つの独自モデルを導入します。来月から利用可能になるこれらの企業向けモデルは、100万枚以上の画像からなるUltralytics独自の新しいデータセットで学習され、よりロバストな事前学習済みモデルを提供します。これらのモデルは、医療画像解析や 衛星画像処理など、正確な物体検出が重要な、要求の厳しい実際のアプリケーション向けに設計されています。

YOLO11の次世代機能を探る

さて、YOLO11の特徴について説明してきた。

YOLO11の開発における重要な課題のひとつは、モデルの小型化、高速化、高精度化という、相反する優先事項の間で適切なバランスを見つけることでした。Ultralyticsの創設者兼CEOのグレン・ジョーチャーは、次のように説明する。「YOLOの研究開発に取り組むことは、3つの異なる方向に進みたいので、本当に難しいのです。モデルをより小さくしたい、より正確にしたい、しかし、CPUやGPUのような異なるプラットフォームでより速くしたい。これらはすべて競合する関心事なので、妥協して変更する箇所を選択しなければなりません"このような課題にもかかわらず、YOLO11は見事なバランスを達成し、YOLOv8のような以前のバージョンよりもスピードと精度の両方を向上させている。

__wf_reserved_inherit
図3.YOLO11を使った物体検出の例。

YOLO11では、バックボーンとネックアーキテクチャの再設計による特徴抽出の改善など、大幅な機能強化が行われ、より正確な物体検出が可能になりました。また、スピードと効率性も最適化されており、高い精度を維持しながら処理時間を短縮しています。これらの利点に加え、YOLO11は、エッジデバイス、クラウドプラットフォーム、およびNVIDIA GPUを使用するシステム上でシームレスに動作し、さまざまな環境に高度に適応します。この適応性により、モバイル機器から大規模サーバーまで、さまざまなハードウェア・セットアップにわたって柔軟な展開オプションを必要とするユーザーにとって理想的な選択肢となる。

リアルタイムYOLO11アプリケーション

YOLO11の多用途性により、特に複雑なユースケースを扱う場合、多くの業界で信頼できるツールとなる。例えば、エッジ・デバイス上でシームレスに動作し、コンピューティング・パワーが限られた環境でリアルタイムの分析を必要とするアプリケーションに使用できる。その優れた例が自律走行で、車両は皆の安全を守るために瞬時の判断を下す必要がある。YOLO11は、歩行者や他の車など、道路上の物体を検出・分析することで、低照度や物体が部分的に隠れているような厳しい条件下でも役立ちます。迅速で正確な検知は、事故を防ぎ、自動運転車が安全に航行できるようにします。

__wf_reserved_inherit
図4。YV24のステージでYOLO11のアプリケーションについて話すグレン・ジョーチャー。

YOLO11の範囲の広さを示すもうひとつの興味深い例は、オリエンテッド・バウンディング・ボックス(OBB)を扱えることだ。これは、完全に整列していないオブジェクトを検出するために不可欠です。OBBオブジェクトの検出は、農業マッピング監視などの業界で特に役立つ機能で、空撮画像や衛星画像には、作物や建物のような回転したオブジェクトが含まれていることが多い。従来のモデルとは異なり、YOLO11はあらゆる角度の物体を識別することができ、精度が要求される作業においてより正確な結果を提供します。

AI開発者のためのYOLO11:自分で試す

YOLO11を使い始めるのは簡単で、コーディングが好きでも、コーディングなしのオプションが好きでも、アクセスしやすい。コードを使ってYOLO11を操作するには、Ultralytics Pythonパッケージを使用して、簡単にモデルをトレーニングし、デプロイすることができます。コードなしのアプローチをご希望の場合は、Ultralytics HUBを使えば、数回クリックするだけでYOLO11を試すことができます。

YOLO11コード・ウォークスルー

PythonでYOLO11を使うには、まずUltralyticsパッケージをインストールする必要がある。好みに応じて、pip、conda、またはDockerを使用してこれを行うことができます。インストールプロセスに関する詳細な手順とベストプラクティスについては、Ultralyticsインストールガイドをぜひご覧ください。YOLO11に必要なパッケージのインストール中に、何らかの問題が発生した場合は、解決策とヒントについて、よくある問題ガイドを参照してください。

Ultralyticsパッケージをインストールすれば、YOLO11の使い方は簡単だ。以下のコード・スニペットは、モデルのロードトレーニングパフォーマンスのテストONNXフォーマットへの エクスポートのプロセスを説明します。YOLO11を最大限に活用するための詳細なガイドとベストプラクティスが掲載されています。

__wf_reserved_inherit
図5.Ultralyticsパッケージを通してYOLO11を使用する。 

UltralyticsのHUBは、数回のクリックでYOLO11モデルをトレーニングし、デプロイする簡単な方法を提供します。HUBを使い始めるには、Ultralytics HUBプラットフォームでアカウントを作成するだけで、直感的なインターフェースでモデルのトレーニングと管理を始めることができます。

YOLO11:ビジョンAIの未来を形作る

AIコミュニティは、実世界のアプリケーションのために、より速く、より正確なモデルを開発するよう努力することで、コンピュータビジョンの分野を常に発展させています。Ultralytics YOLO11は、この取り組みにおける大きなマイルストーンであり、速度、精度、柔軟性の向上をもたらします。リアルタイムおよびエッジアプリケーション向けに設計されているため、ヘルスケアや自律走行などの業界に最適です。Ultralytics Pythonパッケージまたはコード不要のUltralytics Hubのいずれを使用している場合でも、YOLO11は複雑なビジョンAIタスクを簡素化します。YOLO11は強力なコンピュータービジョン機能を提供し、開発者や企業にとって最適な選択肢となります。

GitHubリポジトリをチェックし、活発なコミュニティに参加してAIについてもっと学びましょう。ビジョンAIがヘルスケアや 農業などの分野でどのようにイノベーションを推進しているかをご覧ください。

AIの未来
を一緒に作りましょう!

機械学習の未来への旅を始めよう

無料で始める
クリップボードにコピーされたリンク