YOLO Vision 2025にご期待ください!
2025年9月25日
10:00 — 18:00(英国夏時間)
ハイブリッドイベント
Yolo Vision 2024
用語集

Mean Average Precision (mAP)

自動運転や医療などのAIアプリケーションにおける物体検出モデルの評価における Mean Average Precision (mAP) の重要性について解説します。

平均適合率(mAP)は、特にコンピュータビジョン、とりわけ物体検出タスクで広く使用されている重要な評価指標です。これは、すべての物体カテゴリにおける予測の精度を測定することにより、モデルのパフォーマンスを要約する単一の包括的なスコアを提供します。mAPスコアは、分類の正確さ(物体がモデルの言うとおりであるか)とローカリゼーションの品質(予測されたバウンディングボックスが実際の物体の位置とどれだけ一致するか)の両方を考慮します。バランスの取れた評価を提供するため、mAPはUltralytics YOLOのような異なる物体検出モデルの性能を比較するための標準的な指標となっています。

mAPの仕組み

mAPを理解するには、まずそのコアコンポーネントであるPrecision(適合率)、Recall(再現率)、Intersection over Union(IoU)を把握すると役立ちます。

  • 適合率: モデルの予測がどれだけ正確かを測定します。「モデルが検出したオブジェクトのうち、正しかった割合はどれくらいですか?」という問いに答えます。
  • 再現率: モデルがすべての実際のオブジェクトをどれだけうまく見つけるかを測定します。「画像に存在するすべての真のオブジェクトのうち、モデルが正常に検出した割合はどれくらいですか?」という問いに答えます。
  • Intersection over Union(IoU): 予測されたバウンディングボックスが、グラウンドトゥルース(手動でラベル付けされた)バウンディングボックスとどれだけ重複しているかを定量化するメトリック。IoUが特定のしきい値(例:0.5)を超えている場合、検出は通常、真陽性と見なされます。

mAPの計算は、これらの概念を統合します。オブジェクトクラスごとに、さまざまな信頼性スコアのしきい値で適合率と再現率をプロットすることにより、適合率-再現率曲線が生成されます。そのクラスの平均適合率(AP)は、この曲線の下の領域であり、その特定のクラスでのモデルのパフォーマンスを表す単一の数値を提供します。最後に、mAPは、すべてのオブジェクトクラスのAPスコアの平均を取ることによって計算されます。一般的なCOCOデータセットの評価スキームなど、一部の評価スキームでは、複数のIoUしきい値でmAPを平均化して、さらに堅牢な評価を提供します。

mAPと他の指標との区別

mAPは他の評価指標と関連がありますが、明確な目的を持っています。

  • Accuracy(精度)精度とは、予測の総数に対する正しい予測の割合を測定するものです。一般的に分類タスクに使用され、予測が正しく分類され、ローカライズされる必要のある物体検出には適していません。
  • F1スコア: F1スコアは、適合率と再現率の調和平均です。便利ですが、通常は単一の信頼度閾値で計算されます。対照的に、mAP はすべての閾値にわたってパフォーマンスを平均化することにより、より包括的な評価を提供します。
  • 信頼度 これはモデル全体の評価指標ではなく、個々の予測に割り当てられるスコアであり、モデルがその1つの検出についてどれだけ確信しているかを示します。mAPの計算では、これらの信頼度スコアを使用してPrecision-Recallカーブを作成します。

ツールとベンチマーク

標準化されたベンチマークデータセットは、物体検出の分野を進歩させるために不可欠です。PASCAL VOCやCOCOなどのデータセットは、mAPを公開リーダーボードでの提出物をランク付けするための主要な指標として使用しています。これにより、研究者や実務者は、YOLOv8YOLO11など、さまざまなモデルを客観的に比較できます。

Ultralytics HUBのようなプラットフォームは、モデルのトレーニングおよび検証中のパフォーマンスを追跡するために、mAPを大きく表示します。これらのモデルを強化する基盤となる深層学習フレームワーク(PyTorchTensorFlowなど)は、最終的にmAPを使用して評価されるモデルを構築およびトレーニングするために必要なツールを提供します。

実際のアプリケーション

mAPメトリックは、信頼性の高いAIシステムを開発する上で基本となります。

  1. 自動運転車 自動運転車向けAIでは、認識モデルは、自動車、歩行者、自転車、交通標識などのさまざまなオブジェクトを正確に検出する必要があります。Argoverseのような難しいデータセットで高いmAPスコアを獲得することは、モデルがすべての重要なクラスにおいて堅牢で信頼性が高いことを示しており、安全性の確保に不可欠です。Waymoのようなこの分野の主要企業は、mAPのような指標を使用した厳密な評価に大きく依存しています。
  2. 医用画像解析 脳腫瘍データセットのようなデータセットを使用して、スキャン画像から腫瘍や病変などの異常を検出するモデルをトレーニングする場合、mAPはその全体的な診断精度を評価するために使用されます。高いmAPは、モデルが最も一般的なタイプの異常を検出するだけでなく、まれではあるものの同様に重要な状態を識別するのにも効果的であることを保証します。この包括的な評価は、モデルを医療現場での展開を検討する上で重要なステップとなります。

Ultralyticsコミュニティに参加しませんか?

AIの未来を共に切り開きましょう。グローバルなイノベーターと繋がり、協力し、成長を。

今すぐ参加
クリップボードにコピーしました