Intersection over Union(IoU)とは何か、その計算方法、および物体検出とAIモデルの評価における重要な役割について学びます。
Intersection over Union(IoU)は、特にコンピュータビジョン(CV)、中でも物体検出タスクで使用される基本的な評価指標です。これは、モデルによって生成された予測バウンディングボックスと、手作業でラベル付けされた正しいアウトラインである正解バウンディングボックスという、2つの境界間の重複を測定します。結果として得られるスコア(0〜1の値)は、モデルが画像内のオブジェクトをどの程度正確に特定したかを定量化します。スコア1は完全に一致することを表し、スコア0はまったく重複がないことを示します。この指標は、Ultralytics YOLO11のようなモデルのローカリゼーション精度を評価する上で非常に重要です。
IoUは、本質的に、予測されたバウンディングボックスと正解のバウンディングボックスの交差(重なり合う領域)と和(両方のボックスで覆われた総面積)の比率を計算します。2つの重なり合う正方形を想像してください。「交差」は、それらが重なり合う共有領域です。「和」は、両方の正方形が覆う総面積を組み合わせたもので、重なり合う部分は1回だけカウントされます。交差を和で割ることにより、IoUは、予測されたボックスが実際のオブジェクトとどれだけうまく一致しているかの標準化された尺度を提供します。このシンプルでありながら強力な概念は、オブジェクト検出のための最新の深層学習(DL)の基礎です。
IoUを使用する上で重要な部分は、「IoU閾値」を設定することです。この閾値は、予測が正しいかどうかを判断する事前定義された値(例:0.5)です。予測されたボックスのIoUスコアがこの閾値を超えている場合、「真陽性」として分類されます。スコアが下回っている場合は、「偽陽性」です。この閾値は、精度や再現率などの他のパフォーマンスメトリックに直接影響し、平均適合率(mAP)の計算における重要な要素であり、COCOなどのベンチマークデータセットでオブジェクト検出モデルを評価するための標準的なメトリックです。
IoUは、数え切れないほどのAIシステムのパフォーマンスを検証するために不可欠です。いくつかの例を次に示します。
IoUは単なる評価指標ではありません。トレーニングプロセス自体にも不可欠です。 Ultralytics YOLOv8およびYOLO11のバリアントを含む、多くの最新の物体検出アーキテクチャは、損失関数内でIoUまたはそのバリエーションを直接使用します。 Generalized IoU(GIoU)、Distance-IoU(DIoU)、Complete-IoU(CIoU)などのこれらの高度なIoUベースの損失は、モデルが適切に重複するだけでなく、中心間の距離やアスペクト比の一貫性などの要素も考慮したバウンディングボックスを予測することを学習するのに役立ちます。 これにより、従来の回帰損失と比較して、収束が速くなり、ローカリゼーションのパフォーマンスが向上します。 詳細なさまざまなYOLOモデル間の比較は、ドキュメントに記載されています。
モデルトレーニングおよびハイパーパラメータ調整中のIoUを監視することで、開発者はローカリゼーションを向上させるためにモデルを改良できます。Ultralytics HUBのようなツールを使用すると、IoUやその他のメトリクスを追跡し、モデル改善サイクルを効率化できます。その広範な有用性にもかかわらず、標準的なIoUは、特に重複しないボックスの場合には、感度が低い場合があります。この制限により、前述のIoUバリアントの開発が促進されました。それにもかかわらず、IoUはコンピュータビジョン評価の基礎であり続けています。
IoUは非常に重要ですが、他の指標との関係を理解することが重要です。