YOLO Vision 2025にご期待ください!
2025年9月25日
10:00 — 18:00(英国夏時間)
ハイブリッドイベント
Yolo Vision 2024
用語集

再現率

機械学習におけるRecallとは何か、なぜそれが重要なのか、そしてAIモデルが重要な陽性インスタンスを効果的に捉えることをどのように保証するかを学びます。

リコールは、感度または真陽性率とも呼ばれ、機械学習(ML)と統計における基本的な評価指標です。データセット内のすべての関連インスタンスを正しく識別するモデルの能力を測定します。簡単に言うと、リコールは「すべての実際の陽性インスタンスのうち、モデルはいくつを陽性として正しく予測したか」という問いに答えます。高いリコールスコアは、モデルが探すべきものを効果的に見つけ、見逃された陽性ケース(偽陰性)の数を最小限に抑えることを示します。この指標は、陽性ケースの検出失敗が重大な結果をもたらすアプリケーションにおいて特に重要です。

高いリコールの重要性

多くの現実世界のシナリオでは、偽陰性(検出漏れ)のコストは、偽陽性(誤報)のコストよりもはるかに高くなります。そのため、高いRecall(再現率)を優先することが不可欠になります。例えば、医療画像解析や不正検出などのタスクでは、高いRecallのモデルを使用することで、いくつかの非該当事例が誤ってフラグ付けされたとしても、可能な限り多くの真の事例を捕捉し、詳細なレビューに回すことができます。

  • 医療診断: 医療スキャンから癌を検出するための AI 搭載システム では、高い再現率のモデルが重要です。生命を救う治療を遅らせる可能性のある癌性腫瘍を見逃す(偽陰性)よりも、放射線科医によるレビューのために健康な患者にシステムがフラグを立てる(偽陽性)方がはるかに優れています。多くの ヘルスケアにおける AI ソリューションは、高い感度に合わせて最適化されています。
  • セキュリティと監視: 侵入者を検出するように設計されたセキュリティアラームシステムの場合、高い再現率(Recall)が最も重要です。システムは、迷い込んだ動物を侵入者と間違えることがあっても、潜在的な脅威をすべて識別する必要があります。真のセキュリティ侵害を見逃すと、システムは効果がなくなります。

Ultralytics YOLO モデルにおける Recall

コンピュータビジョン(CV)およびUltralytics YOLOのようなモデルの分野において、再現率は、精度および平均適合率(mAP)とともに、物体検出インスタンスセグメンテーションなどのタスクのパフォーマンスを評価するために使用される重要な指標です。多くの場合、現実世界の堅牢なパフォーマンスには、再現率と精度の間の良好なバランスを達成することが不可欠です。たとえば、YOLOv8とYOLO11のようなモデルを比較する場合、再現率は、各モデルがすべてのターゲットオブジェクトをどれだけうまく識別するかを理解するのに役立ちます。ユーザーは、PyTorchTensorFlowのようなフレームワークを使用してカスタムモデルをトレーニングし、Weights & BiasesUltralytics HUBの統合機能などのツールを使用して再現率を追跡できます。再現率を理解することは、ハイパーパラメータチューニングや、YOLOv10や最新のYOLO11のような異なるモデルアーキテクチャの探索など、特定のユースケースに合わせてモデルを最適化するのに役立ちます。Ultralyticsドキュメントのようなリソースは、トレーニングと評価に関する包括的なガイドを提供します。

リコールとその他の指標

再現率を他の一般的な評価指標と区別することが重要です。

  • 適合率: 再現率がすべての陽性サンプルを見つけることに焦点を当てているのに対し、適合率は陽性と予測されたものの精度を測定します。「モデルが陽性と予測したインスタンスのうち、実際に陽性だったものはいくつですか?」という問いに答えます。適合率と再現率の間にはトレードオフがあることが多く、一方を上げるともう一方が下がる可能性があります。この概念は、適合率と再現率のトレードオフとして知られています。
  • Accuracy(精度):正しい予測(肯定的および否定的)の全体的な割合を測定します。精度は、一方のクラスが他方を大幅に上回る不均衡なデータセットでは、誤解を招く可能性のある指標です。たとえば、99%の否定的なサンプルを含むデータセットでは、すべてを否定的として予測するモデルは99%の精度を達成しますが、肯定的なクラスに対する再現率はゼロになります。
  • F1スコア: これは、適合率と再現率の調和平均です。F1スコアは、両方の指標のバランスを取る単一の数値を提供するため、偽陽性と偽陰性の両方を考慮する必要がある場合に役立つ指標となります。クラス分布が不均一な場合によく使用されます。
  • Area Under the Curve (AUC)(曲線下面積):特に二値分類の場合、Receiver Operating Characteristic (ROC)曲線は、真陽性率(再現率)を偽陽性率に対してプロットします。AUCは、すべての分類しきい値におけるモデルのパフォーマンスを要約する単一のスコアを提供します。Precision-Recall曲線下面積(AUC-PR)は、不均衡な分類タスクの場合、より多くの情報を提供する場合があります。

Ultralyticsコミュニティに参加しませんか?

AIの未来を共に切り開きましょう。グローバルなイノベーターと繋がり、協力し、成長を。

今すぐ参加
クリップボードにコピーしました