YOLO Vision 2025にご期待ください!
2025年9月25日
10:00 — 18:00(英国夏時間)
ハイブリッドイベント
Yolo Vision 2024

YOLO11のようなUltralytics YOLOモデルをベンチマークする方法

Abirami Vina

5分で読めます

2025年4月28日

Ultralytics YOLO11のベンチマーク方法、デバイス間のパフォーマンス比較、および速度、精度、効率を最適化するためのさまざまなエクスポート形式について学びます。

今日利用可能なAIモデルの数が増加しているため、特定のAIアプリケーションに最適なモデルを選択することは、正確で信頼性の高い結果を得るために不可欠です。各モデルは、速度、精度、および全体的なパフォーマンスが異なります。では、特定のタスクに最適なモデルをどのように判断すればよいのでしょうか?これは、自律走行車、セキュリティソリューション、ロボット工学など、迅速かつ信頼性の高い意思決定が不可欠なリアルタイムシステムにとって特に重要です。

ベンチマークは、さまざまな条件下でモデルを評価することにより、この質問に答えるのに役立ちます。さまざまなハードウェアセットアップと構成にわたってモデルがどれだけうまく機能するかについての洞察を提供し、より多くの情報に基づいた意思決定を可能にします。

例えば、Ultralytics YOLO11は、物体検出やインスタンスセグメンテーションのような様々な視覚データ分析タスクをサポートするコンピュータビジョンモデルです。その能力を完全に理解するために、異なる設定でその性能をベンチマークし、実際のシナリオでどのように動作するかを確認できます。

この記事では、YOLO11のようなUltralytics YOLOモデルをベンチマークし、さまざまなハードウェアでのパフォーマンスを比較し、異なるエクスポート形式が速度と効率にどのように影響するかを見ていきます。それでは始めましょう。

モデルベンチマークとは?

実際のアプリケーションでVision AIモデルを使用する場合、それが十分に高速で、正確で、信頼できるかどうかをどのように判断できますか?モデルのベンチマークは、これに答えるための洞察を提供できます。モデルのベンチマークとは、異なるAIモデルをテストおよび比較して、どれが最も優れたパフォーマンスを発揮するかを確認するプロセスです。 

比較の基準を設定し、適切なパフォーマンス指標(精度や速度など)を選択し、すべてのモデルを同じ条件下でテストすることが含まれます。その結果は、各モデルの長所と短所を特定するのに役立ち、特定のAIソリューションに最適なものを決定しやすくします。特に、ベンチマークデータセットは、公平な比較を提供し、さまざまな現実世界のシナリオでモデルがどの程度うまく機能するかを評価するためによく使用されます。

図1. コンピュータビジョンモデルをベンチマークする理由。画像は著者による。

ベンチマークが不可欠である理由の明確な例は、監視やロボット工学などのリアルタイムアプリケーションであり、わずかな遅延でも意思決定に影響を与える可能性があります。ベンチマークは、モデルが信頼性の高い予測を提供しながら、画像を迅速に処理できるかどうかを評価するのに役立ちます。 

また、パフォーマンスのボトルネックを特定する上で重要な役割を果たします。モデルの実行速度が遅い場合や、リソースを過剰に使用する場合は、ベンチマークによって、問題がハードウェアの制限、モデルの構成、エクスポート形式のいずれに起因するかが明らかになります。これらの洞察は、最も効果的なセットアップを選択するために不可欠です。

モデルのベンチマーク評価とテストの比較

モデルのベンチマーク、評価、およびテストは、一般的に使用されるAI用語です。これらは類似していますが、同一ではなく、それぞれ異なる機能を持っています。モデルテストは、テストデータセット上でモデルを実行し、精度や速度などの要素を測定することで、単一のモデルの性能をチェックします。一方、モデル評価はさらに一歩進んで、結果を分析し、モデルの強み、弱み、および実際の状況での動作を理解します。どちらも一度に1つのモデルに焦点を当てています。

しかし、モデルのベンチマーク評価では、同じテストとデータセットを使用して、複数のモデルを並べて比較します。モデル間の精度、速度、効率の違いを明確にすることで、特定のタスクに最適なモデルを見つけ出すのに役立ちます。テストと評価が単一のモデルに焦点を当てるのに対し、ベンチマーク評価は、さまざまな選択肢を公平に比較することで、適切なモデル(または最適なモデル)を選択するのに役立ちます。

図2. モデルのベンチマークが評価およびテストと異なる点。画像提供:著者。

Ultralytics YOLO11の概要

Ultralytics YOLO11は、さまざまなコンピュータビジョンタスクを正確に実行するように設計された、信頼性の高いVision AIモデルです。以前のYOLOモデルバージョンを改良し、現実世界の問題を解決するのに役立つ機能が満載です。たとえば、オブジェクトの検出、画像の分類、領域のセグメント化、動きの追跡などに使用できます。また、セキュリティから自動化、分析まで、多くの業界のアプリケーションで使用できます。

Fig 3. YOLO11を使用して画像内の人物をセグメント化する例。

Ultralytics YOLO11に関連する主な利点の1つは、使いやすさです。わずか数行のコードで、誰でも複雑なセットアップや高度な技術的専門知識を必要とせずに、AIプロジェクトに統合できます。 

また、さまざまなハードウェアでスムーズに動作し、CPU(中央処理装置)、GPU(グラフィックス処理装置)、その他の特殊なAIアクセラレータで効率的に実行されます。エッジデバイスまたはクラウドサーバーのどちらにデプロイされても、強力なパフォーマンスを発揮します。 

YOLO11はさまざまなモデルサイズで利用でき、それぞれが異なるタスクに最適化されています。ベンチマークは、特定のニーズに最適なバージョンを判断するのに役立ちます。たとえば、ベンチマークで明らかになる重要な洞察の1つは、nanoやsmallなどの小型モデルは高速で実行される傾向がありますが、精度が若干低下する可能性があることです。

YOLO11のようなYOLOモデルのベンチマーク方法

ベンチマークとは何か、そしてその重要性を理解したところで、YOLO11のようなYOLOモデルをベンチマークし、その効率性を評価して、貴重な洞察を得る方法を見ていきましょう。

まず、ターミナルまたはコマンドプロンプトで次のコマンド「pip install ultralytics」を実行して、Ultralytics Pythonパッケージをインストールできます。インストール中に問題が発生した場合は、よくある問題ガイドでトラブルシューティングのヒントをご覧ください。

パッケージがインストールされると、数行のPythonコードで簡単にYOLO11をベンチマークできます。

from ultralytics.utils.benchmarks import benchmark

# Benchmark on GPU
benchmark(model="yolo11n.pt", data="coco8.yaml", imgsz=640, half=False, device=0)

上記のコードを実行すると、モデルが画像を処理する速度、1秒間に処理できるフレーム数、およびオブジェクトを検出する精度が計算されます。 

コード内の「coco8.yaml」の記述は、COCO8(Common Objects in Context)データセットに基づいたデータセット構成ファイルを指します。これは、COCOデータセット全体の小さなサンプルバージョンであり、テストや実験によく使用されます。

トラフィック監視や医療画像処理など、特定のアプリケーションでYOLO11をテストする場合は、関連するデータセット(トラフィックデータセットや医療データセットなど)を使用すると、より正確な洞察が得られます。COCOでのベンチマークは、パフォーマンスの一般的なアイデアを提供しますが、最良の結果を得るには、実際のユースケースを反映したデータセットを選択できます。

YOLO11のベンチマーク出力の理解

YOLO11のベンチマークが完了したら、次のステップは結果を解釈することです。ベンチマークを実行すると、結果にさまざまな数値が表示されます。これらの指標は、YOLO11が精度と速度の点でどれだけうまく機能するかを評価するのに役立ちます。 

注目すべきYOLO11のベンチマーク指標をいくつかご紹介します。

  • mAP50-95: 物体検出の精度を測定します。値が高いほど、モデルが物体を認識する能力が高いことを意味します。
  • accuracy_top5: これは、分類タスクで一般的に使用されます。正しいラベルが上位5つの予測に表示される頻度を示します。
  • 推論時間: 1枚の画像を処理するのにかかる時間で、ミリ秒単位で測定されます。値が小さいほど、処理が高速であることを意味します。
図4. YOLO11のベンチマークパフォーマンスを示すグラフ。

YOLO11のベンチマーク時に考慮すべきその他の要素 

ベンチマークの結果だけを見ても、ストーリーの一部しかわかりません。パフォーマンスをより良く理解するには、さまざまな設定やハードウェアオプションを比較すると役立ちます。注目すべき重要な点をいくつかご紹介します。

  • GPU vs. CPU: GPUはCPUよりもはるかに高速に画像を処理できます。ベンチマークは、CPUがニーズに十分な速度であるか、GPUの使用からメリットが得られるかどうかを確認するのに役立ちます。
  • Precision settings (FP32, FP16, INT8)(精度設定(FP32、FP16、INT8)): これらは、モデルが数値をどのように処理するかを制御します。精度が低いほど(FP16やINT8など)、モデルの実行速度が速くなり、使用するメモリが少なくなりますが、精度がわずかに低下する可能性があります。
  • エクスポート形式: モデルをTensorRTのような形式に変換すると、特定のハードウェア上でより高速に実行できます。これは、特定のデバイスでの速度を最適化する場合に役立ちます。

異なるハードウェアでのYOLO11のベンチマーク方法

Ultralytics Pythonパッケージを使用すると、YOLO11モデルを特定のハードウェア上でより効率的に実行できるさまざまな形式に変換し、速度とメモリ使用量の両方を向上させることができます。各エクスポート形式は、異なるデバイス向けに最適化されています。 

一方、ONNX形式は、さまざまな環境でのパフォーマンスを向上させることができます。他方、OpenVINOはIntelハードウェアの効率を向上させ、CoreMLやTF SavedModelのような形式は、Appleデバイスやモバイルアプリケーションに最適です。 

YOLO11を特定の形式でベンチマークする方法を見てみましょう。以下のコードは、CPUとGPUの両方でAIモデルを実行するために広く使用されているONNX形式でYOLO11をベンチマークします。

from ultralytics.utils.benchmarks import benchmark  

# Benchmark a specific export format (e.g., ONNX)  
benchmark(model="yolo11n.pt", data="coco8.yaml", imgsz=640, format="onnx")

ベンチマーク結果以外にも、適切な形式の選択は、システムの仕様と展開のニーズによって異なります。たとえば、自動運転車は高速な物体検出が必要です。NVIDIA GPUを使用してパフォーマンスを加速する場合は、NVIDIA GPUでYOLO11を実行するには、TensorRT形式が理想的な選択肢です。

図5. 自動運転車における物体検出のためのYOLO11の使用。

主なポイント

Ultralytics Pythonパッケージを使用すると、パフォーマンスのテストを処理できる簡単なコマンドを提供することで、YOLO11のベンチマークを簡単に実行できます。わずか数ステップで、さまざまな設定がモデルの速度と精度にどのように影響するかを確認できるため、深い技術的な専門知識がなくても、情報に基づいた選択を行うことができます。

適切なハードウェアと設定も、大きな違いをもたらす可能性があります。モデルサイズやデータセットなどのパラメータを調整することで、ハイエンドGPUで実行する場合でも、エッジデバイスでローカルに実行する場合でも、最高のパフォーマンスを得るためにYOLO11を微調整できます。

当社のコミュニティとつながり、当社のGitHubリポジトリで最先端のAIプロジェクトを探求してください。ソリューションページで、農業におけるAIの影響と、製造業におけるコンピュータビジョンの役割について学びましょう。当社のライセンスプランをご覧になり、今すぐAIの旅を始めましょう!

AIの未来を
共に築きましょう!

未来の機械学習で、新たな一歩を踏み出しましょう。

無料ではじめる
クリップボードにコピーしました