Yolo 深圳
深セン
今すぐ参加
用語集

混同行列

混同行列を使用してモデルのパフォーマンスを理解します。指標、実際の使用例、およびAI分類の精度を向上させるためのツールについて解説します。

混同行列は、機械学習(ML)で使用される包括的な性能測定ツールである。 機械学習(ML)において、分類モデル で使用される包括的な性能測定ツールである。単純な精度スコアとは異なります、 とは異なり、混同行列は、モデルが各クラスをどのように分類しているのかの詳細な内訳を提供します。 の詳細な内訳を提供します。これは、予測されたラベルと実際のグランドトゥルースとの間の不一致を視覚化します。 開発者は、モデルがどこで「混乱」しているか、あるいは系統的なエラーを起こしているかを正確に突き止めることができます。この 複雑なコンピュータビジョン コンピュータビジョン(CV)システムの改良に不可欠である。 で構築された Ultralytics YOLO11.

マトリックスのコア・コンポーネント

混同行列は、分類器の予測値を4つの異なるカテゴリに分類し、通常はグリッド状に配置します。 に分類されます.これらの構成要素は、モデルが次のような特定のタイプのエラーに苦しんでいるかどうかを識別するのに役立ちます。 「誤報 "や "ミスターゲット":

  • 真の陽性(TP):モデルは正クラスを正しく予測する。例えば 例えば物体検出では 歩行者を識別する。
  • 真の陰性(TN):モデルは否定クラスを正しく予測する。製造業におけるAIの欠陥検出システムにおいて 製造業におけるAIの欠陥検出システムでは モデルが機能部品を欠陥なしと正しく識別した場合。
  • 偽陽性 (FP):モデルが誤って陽性のクラスを予測する。これはしばしば 型エラーと呼ばれる。例えば、防犯カメラ が揺れる木の枝を侵入者と判断した場合です。
  • 偽陰性(FN):モデルが誤って否定クラスを予測すること。これは II型エラー。これは 医療診断ツールが実際に存在する腫瘍をdetect できなかった場合に起こる。

モデル評価における意義

大まかな指標はハイレベルな概観に役立つが、混同行列は不均衡なデータセットを扱うときには不可欠である。 不可欠である。あるデータセットに95匹のネコと5匹のイヌが含まれていた場合、毎回「ネコ」と推測するだけのモデルは95%の精度を達成するが、イヌを見つけるのには役に立たない。 の精度を達成するが、犬を見つけるのには役に立たない。混同行列は、「猫」に対してゼロの真陽性(True Positives)を示すことで、この失敗を即座に明らかにするでしょう。 犬」クラスの真陽性はゼロである。

この内訳は、他の重要なパフォーマンス指標を計算するための基礎となる。 パフォーマンス指標を算出するための基礎となる。マトリックスを分析することで マトリクスを分析することで、エンジニアは以下を導き出すことができます:

  • 精度:正の予測の精度 (TP / (TP + FP)).
  • リコール(感度):実際の陽性症例(TP / (TP + FN))を 実際の陽性症例をすべて捕捉する能力(TP / (TP + FN))。
  • F1-スコア:精度と想起の調和平均で、モデルの頑健性をバランスよく示す。

実際のアプリケーション

混同行列の重要性は、具体的なアプリケーションや、さまざまなエラーの「コスト」によって異なる。 によって異なる。

  • 医療診断医療診断 医療におけるAIでは、偽陰性のコスト のコストは極めて高い。X線写真から肺炎をdetect するように設計されたモデルの場合、陽性の症例(FN)を見逃すと、救命処置が遅れる可能性がある。 救命処置が遅れることになる。そのため、開発者はRecallを最大化するために混同行列を分析し、病気の微妙な兆候でさえも人間のためにフラグが立てられるようにする。 を最大化するために混同行列を分析します。詳しくは 医用画像における評価について詳しくお読みください。 ステークス
  • 不正検知:金融システムでは、誤検知(正当な取引を不正と判断すること)は顧客に迷惑をかけ、資金へのアクセスを遮断する。 金融システムでは、False Positive(正当な取引を詐欺と判定すること)は顧客を悩ませ、資金へのアクセスをブロックする。しかし、False Negative(実際の不正を許可する)は、直接的な金銭的損失を引き起こす。 直接的な金銭的損失をもたらす。混同行列を使うことで、データサイエンティストは信頼度閾値を調整することができる。 信頼性の閾値を調整し、最適なトレードオフを見つけることができる、 セキュリティとユーザーエクスペリエンスのバランスをとる。
  • 自律走行車自動運転車の場合 自動運転車にとって、静止している物体と 自動運転車にとって、静止している物体と動いている歩行者を区別することは非常に重要です。混同マトリックスは、システムが特定のクラス エンジニアは、混同マトリックスによって、街灯を人と見間違えるなど、システムが特定のクラスを頻繁に混同しているかどうかを把握することができます。 データ補強を行うことができます。

コードによる結果の分析

について ultralytics ライブラリは、検証プロセス中に自動的に混同行列を計算し、保存する。 を自動的に計算して保存します。これにより、ユーザはデータセットの全クラスにわたるパフォーマンスを可視化することができます。

from ultralytics import YOLO

# Load the YOLO11 model
model = YOLO("yolo11n.pt")

# Validate the model on a dataset like COCO8
# This generates the confusion matrix in the 'runs/detect/val' directory
results = model.val(data="coco8.yaml")

# You can also programmatically access the matrix data
print(results.confusion_matrix.matrix)

関連用語との比較

混同行列と派生メトリクスを区別することは重要である。AccuracyPrecisionRecallが1つの数値の要約であるのに対して 混同行列はこれらの数値が計算される生のデータソースです。これは スナップショットではなく「全体像」を提供します。さらに オブジェクト検出では、行列はしばしば インターセクション・オーバー・ユニオン(IoU) 閾値と相互作用し、何がTrue Positiveとしてカウントされるかを決定します。 コンピュータビジョンタスクの評価にもう1つの深みを加えています。

Ultralytics コミュニティに参加する

AIの未来を共に切り開きましょう。グローバルなイノベーターと繋がり、協力し、成長を。

今すぐ参加