YOLO Vision Shenzhen
深セン
今すぐ参加
用語集

混同行列

混同行列が分類性能をどのように評価するかを学びましょう。TP、FP、TN、FNを探索し、Ultralytics YOLO26モデルを最適化して精度を向上させましょう。

混同行列は、出力が2つ以上のクラスになり得る機械学習の分類問題における性能測定ツールです。これは、予測値と実際の値の4つの異なる組み合わせを示す表であり、モデル評価におけるデータ可視化の基礎要素として機能します。データセットが不均衡な場合に誤解を招く可能性がある単純な精度とは異なり、混同行列はコンピュータービジョン (CV)モデルがどこで間違いを犯しているかの詳細な内訳を提供します。予測をグラウンドトゥルースラベルと比較することで、開発者はシステムが2つの特定のクラスを混同しているのか、それともオブジェクトを完全にdetectできないのかを判断できます。

マトリックスのコア・コンポーネント

この行列自体は、バイナリ分類の場合、通常4つの象限に分割されますが、Ultralytics YOLO26が扱うような多クラス問題では拡張されます。これら4つのコンポーネントは、モデルが予測したものと画像内に実際に存在するものの交差を表します。

  • 真の陽性(TP): モデルが陽性クラスを正しく予測することです。例えば、object detectionタスクでは、モデルが実際にフレーム内にいる人物の周りにバウンディングボックスを成功裏に描画します。
  • 真の陰性(TN): モデルが陰性クラスを正しく予測することです。異常検知のようなシナリオでは、システムが製造された部品に欠陥がないことを正しく識別するため、これは非常に重要です。
  • 偽陽性 (FP): モデルが正のクラスを誤って予測することです。しばしば「第一種過誤」と呼ばれ、セキュリティカメラが影を侵入者としてdetectするなど、システムが存在しないオブジェクトをdetectする場合に発生します。
  • 偽陰性 (FN): モデルが負のクラスを誤って予測することです。「第二種過誤」として知られており、モデルが存在するオブジェクトをdetectできず、本質的にターゲットを「見逃す」場合に発生します。

派生メトリクスと意義

混同行列の生の値は、モデル性能を記述するより高度なメトリクスを計算するために使用されます。これらの派生値を理解することは、ニューラルネットワークを最適化するために不可欠です。

  • 適合率: TP / (TP + FP)として計算されるこの指標は、陽性予測がどれだけ正確であるかを示します。適合率が高いほど、誤報が少なくなります。
  • Recall (Sensitivity): TP / (TP + FN)として計算されるこれは、モデルがすべての陽性インスタンスを見つける能力を測定します。オブジェクトを見逃すことが重大な結果を招く場合、高いリコールは不可欠です。
  • F1 Score: 適合率と再現率の調和平均です。これは両者のトレードオフをバランスさせる単一のスコアを提供し、異なるYOLO26 modelsを比較するのに有用です。

実際のアプリケーション

混同行列によって定義される特定のエラーコストは、モデルが異なる業界向けにどのように調整されるかを決定します。

医療分野における 医療分野におけるAIにおいてにおいて、混同行列は安全性の問題である。detect するための 医療画像解析モデルを訓練する際、 偽陰性(腫瘍を見逃すこと)は偽陽性(良性病変を医師の検討対象として誤検知すること)よりもはるかに深刻である。 したがって、エンジニアは潜在的な健康リスクを見逃さないよう、これらの行列において精度よりも再現率を優先する。

対照的に、製造品質管理では、効率が重要です。組み立てラインの部品を分類するシステムが過剰な誤検出(良品を不良品と誤って判定すること)を生成すると、不必要な無駄が生じ、生産が滞ります。ここで、混同行列はエンジニアがモデルを調整して精度を最大化し、拒否されたものが真に欠陥品であることを保証することで、自動機械学習ワークフローを合理化するのに役立ちます。

YOLO26で混同行列を生成する

最新のフレームワークを使用する場合、この行列の生成は標準的な検証パイプラインの一部であることがよくあります。以下の例は、を検証する方法を示しています。 YOLO26モデル および、混同行列データにアクセスするには、 ultralytics パッケージで提供される。

from ultralytics import YOLO

# Load a pre-trained YOLO26 model
model = YOLO("yolo26n.pt")

# Validate the model on the COCO8 dataset
# This automatically generates and plots the confusion matrix
metrics = model.val(data="coco8.yaml")

# Access the confusion matrix object directly
print(metrics.confusion_matrix.matrix)

関連概念の区別

混同行列と類似の評価用語を区別することが重要です。

  • Vs. Accuracy: 精度は、単に正しい予測の総予測に対する比率です。有用ではありますが、不均衡なデータセットでは精度は非常に誤解を招く可能性があります。例えば、メールの95%がスパムでない場合、すべてのメールに対して「スパムではない」と予測するモデルは95%の精度を持ちますが、役に立ちません。混同行列は、スパムクラスの真陽性がゼロであることを示すことで、この欠陥を明らかにします。
  • Vs. ROC Curve: 混同行列は、単一の特定の信頼度閾値におけるパフォーマンスのスナップショットを提供します。対照的に、受信者操作特性(ROC)曲線は、その閾値が変化するにつれて真陽性率と偽陽性率がどのように変化するかを視覚化します。Ultralytics Platformのようなツールを使用すると、ユーザーは両方の視覚化を探索し、デプロイメントに最適な動作点を選択できます。

共にAIの未来を築きましょう!

未来の機械学習で、新たな一歩を踏み出しましょう。