新しいUltralytics YOLO11モデル、その機能、およびさまざまな業界でのリアルタイムアプリケーションについて学びましょう。知っておくべきことをすべてご説明します。

新しいUltralytics YOLO11モデル、その機能、およびさまざまな業界でのリアルタイムアプリケーションについて学びましょう。知っておくべきことをすべてご説明します。
9月30日(月)、Ultralyticsは、年次ハイブリッドイベントであるYOLO Vision 2024(YV24)でのデビューに続き、コンピュータビジョンにおける最新の進歩であるUltralytics YOLO11を正式に発表しました。AIコミュニティは、モデルの能力を探求しようと急いでおり、興奮に沸いています。より高速な処理、より高い精度、およびエッジデバイスとクラウドデプロイメントの両方に最適化されたモデルにより、YOLO11はリアルタイムコンピュータビジョンアプリケーションで可能なことを再定義します。
インタビューで、Ultralyticsの創設者兼CEOであるGlenn Jocherは、次のように述べています。「世界はクリーンエネルギーに向かっていますが、十分な速さではありません。モデルをより少ないエポック数、より少ない拡張、より少ないデータでトレーニングできるようにしたいと考えており、そのために懸命に取り組んでいます。最小の物体検出モデルであるYOLO11nは、わずか260万のパラメータしかありません。これはJPEGのサイズ程度であり、非常に驚くべきことです。最大の物体検出モデルであるYOLO11xは約5600万のパラメータを持っていますが、それでも他のモデルと比較して非常に小さいです。5年前のNvidia GPUのような安価なGPUでも、少しの興奮と少しのコーヒーがあればトレーニングできます。」
この記事では、YOLO11の機能、改善点、パフォーマンスベンチマーク、および実際のアプリケーションを詳しく見ていき、このモデルで何ができるかを理解するのに役立てます。それでは始めましょう!
YOLO11は、YOLO(You Only Look Once)シリーズのコンピュータビジョンモデルにおける最新の進歩であり、YOLOv5やYOLOv8などの以前のバージョンに比べて大幅な改善を提供します。Ultralyticsのチームは、コミュニティからのフィードバックと最先端の研究を取り入れて、YOLO11をより高速、より正確、より効率的にしました。YOLO11は、物体検出、インスタンスセグメンテーション、および画像分類を含む、YOLOv8と同じコンピュータビジョンタスクをサポートしています。実際、ユーザーは既存のワークフローを変更せずにYOLO11に簡単に切り替えることができます。
YOLO11の主な特徴の一つは、その前身モデルと比較して、精度と速度の両方において優れた性能を発揮することです。YOLO11mは、YOLOv8mよりも22%少ないパラメータで、平均適合率(mAP)がCOCOデータセットでより高い値を達成しており、これはより正確かつ効率的にオブジェクトを検出できることを意味します。処理速度の面では、YOLO11は以前のモデルを凌駕しており、迅速な検出と応答が不可欠で、1ミリ秒が重要なリアルタイムアプリケーションに最適です。
以下のベンチマークグラフは、YOLO11が以前のモデルからいかに際立っているかを示しています。横軸は、オブジェクト検出の精度を測るCOCO Box Average Precision(AP)を示しています。縦軸は、NVIDIA T4 GPU上でTensorRT10 FP16を使用した際のレイテンシを表示しており、モデルがデータを処理する速さを示しています。
Ultralytics YOLO11の発表により、Ultralyticsは、業界全体で高まる需要に応えるため、オープンソースモデルとエンタープライズモデルの両方を提供することで、YOLOシリーズを拡大しています。
YOLO11は、Nano、Small、Medium、Large、Xの5つの異なるモデルサイズを特徴としています。ユーザーは、コンピュータビジョンアプリケーションの特定のニーズに応じて最適なモデルを選択できます。5つのサイズは、画像分類、物体検出、インスタンスセグメンテーション、トラッキング、姿勢推定、傾斜バウンディングボックス(OBB)物体検出などのタスクに柔軟に対応します。各サイズに対して、各タスクで使用できるモデルが用意されており、Ultralyticsの中核となる製品を構成する合計25個のオープンソースモデルが提供されます。これらのモデルは、YOLO11nモデルが優れた効率を提供するエッジデバイスでの軽量タスクから、YOLO11lおよびYOLO11xモデルを必要とする大規模アプリケーションまで、幅広いアプリケーションに最適です。
Ultralyticsは今回初めてエンタープライズモデルを導入し、製品提供における大きな節目を迎えます。これらの新しいイノベーションをユーザーと共有できることを嬉しく思います。YOLO11は、商用利用のために特別に設計された5つの独自のモデルを導入します。これらのエンタープライズモデルは、来月提供開始予定で、100万枚以上の画像で構成されるUltralyticsの新しい独自のデータセットでトレーニングされており、より堅牢な事前トレーニング済みモデルを提供します。これらは、正確な物体検出が不可欠な医療画像解析や衛星画像処理など、要求の厳しい現実世界のアプリケーション向けに設計されています。
YOLO11が提供するものについて説明したので、YOLO11を特別なものにしているものを見てみましょう。
YOLO11の開発における主要な課題の1つは、モデルをより小さく、より速く、より正確にすることという、競合する優先事項の適切なバランスを見つけることでした。Ultralyticsの創設者兼CEOであるGlenn Jocher氏は、次のように説明しています。「YOLOの研究開発に取り組むことは、3つの異なる方向、つまりモデルをより小さく、より正確にし、CPUやGPUなどのさまざまなプラットフォームでより高速にしたいという要望があるため、非常に困難です。これらはすべて競合する関心事であるため、妥協してどこを変更するかを選択する必要があります。」これらの課題にもかかわらず、YOLO11は印象的なバランスを実現し、YOLOv8などの以前のバージョンよりも速度と精度の両方を向上させています。
YOLO11は、再設計されたバックボーンおよびネックアーキテクチャによる特徴抽出の改善など、大幅な機能強化をもたらし、より正確な物体検出につながります。このモデルは、速度と効率も最適化されており、高い精度を維持しながら、より高速な処理時間を提供します。これらの利点に加えて、YOLO11は適応性が高く、エッジデバイス、クラウドプラットフォーム、NVIDIA GPUを使用するシステムでシームレスに動作します。この適応性により、モバイルデバイスから大規模サーバーまで、さまざまなハードウェアセットアップにわたって柔軟なデプロイメントオプションを必要とするユーザーにとって理想的な選択肢となります。
YOLO11の汎用性により、特に複雑なユースケースを扱う場合に、多くの業界で信頼できるツールとなっています。たとえば、エッジデバイスでシームレスに動作し、コンピューティング能力が限られた環境でのリアルタイム分析を必要とするアプリケーションに使用できます。この優れた例は自動運転であり、車両はすべての人の安全を確保するために、一瞬の判断を下す必要があります。YOLO11は、薄暗い場所や物が部分的に隠れているなどの困難な状況でも、歩行者や他の車などの道路上の物体を検出および分析することで役立ちます。迅速かつ正確な検出は、事故を防ぎ、自動運転車が安全に走行できるようにします。
YOLO11の範囲のもう1つの興味深い例は、傾斜バウンディングボックス(OBB)を処理できることです。これは、完全に整列していない物体を検出するために不可欠です。OBB物体検出は、農業、マッピング、監視などの業界で特に役立つ機能であり、画像には、航空写真や衛星写真の作物や建物など、回転した物体が含まれていることがよくあります。従来のモデルとは異なり、YOLO11は任意の角度で物体を識別し、精度を必要とするタスクに対してはるかに正確な結果を提供できます。
YOLO11の使い始めは簡単で、コーディングまたはノーコードオプションのどちらを好む場合でもアクセスできます。コードを通じてYOLO11を操作するには、Ultralytics Pythonパッケージを使用して、モデルを簡単にトレーニングおよびデプロイできます。ノーコードアプローチを好む場合は、Ultralytics HUBを使用すると、数回クリックするだけでYOLO11を試すことができます。
PythonでYOLO11を使用するには、まずUltralyticsパッケージをインストールする必要があります。好みに応じて、pip、conda、またはDockerを使用してこれを行うことができます。インストールプロセスに関連する詳細な手順とベストプラクティスについては、Ultralyticsインストールガイドを必ず確認してください。YOLO11に必要なパッケージのインストール中に問題が発生した場合は、解決策とヒントについて一般的な問題ガイドを参照してください。
Ultralyticsパッケージをインストールすると、YOLO11の使用は簡単です。次のコードスニペットは、モデルのロード、トレーニング、パフォーマンスのテスト、ONNX形式へのエクスポートのプロセスを順を追って説明します。より詳細な例と高度な使用法については、公式Ultralyticsドキュメントを必ず参照してください。ここでは、YOLO11を最大限に活用するための詳細なガイドとベストプラクティスが提供されています。
ノーコードアプローチを好むユーザーのために、Ultralytics HUBは、数回クリックするだけでYOLO11モデルをトレーニングおよびデプロイする簡単な方法を提供します。HUBの使用を開始するには、Ultralytics HUBプラットフォームでアカウントを作成するだけで、直感的なインターフェイスを通じてモデルのトレーニングと管理を開始できます。
AIコミュニティは、現実世界のアプリケーション向けにより高速で正確なモデルを開発することを目指し、コンピュータビジョンの分野を常に進化させています。Ultralytics YOLO11は、この取り組みにおける重要なマイルストーンであり、速度、精度、柔軟性を向上させました。リアルタイムおよびエッジアプリケーション向けに設計されており、ヘルスケアや自動運転などの業界に最適です。Ultralytics Pythonパッケージを使用する場合でも、ノーコードのUltralytics Hubを使用する場合でも、YOLO11は複雑なVision AIタスクを簡素化します。強力なコンピュータビジョン機能を提供し、開発者や企業にとって最適な選択肢となります。
AIの詳細については、GitHubリポジトリをご覧いただき、活発なコミュニティにご参加ください。Vision AIがヘルスケアや農業などの分野でどのようにイノベーションを推進しているかをご覧ください。