Yolo 深圳
深セン
今すぐ参加
用語集

混同行列

混同行列を使用してモデルのパフォーマンスを理解します。指標、実際の使用例、およびAI分類の精度を向上させるためのツールについて解説します。

混同行列は、出力結果が2つ以上のクラスとなる機械学習分類問題の性能測定ツールである。予測値と実際の値の4つの異なる組み合わせを示す表であり、モデル評価におけるデータ可視化の基盤要素として機能する。データセットの不均衡により誤解を招く可能性がある単純な精度とは異なり、混同行列はコンピュータビジョン(CV)モデルが誤りを生じている箇所を詳細に分析する。 予測結果と 真のラベルを比較することで、開発者はシステムが 特定の2つのクラスを混同しているのか、あるいはdetect 完全にdetect できていないのかを判断できます。

マトリックスのコア・コンポーネント

このマトリクス自体は、二値分類では通常4つの象限に分割されますが、 Ultralytics 扱うような多クラス問題では拡張されます。 これら4つの要素は、モデルが予測した内容と画像内に実際に存在する内容の 交差点を表しています。

  • 真の陽性(TP)モデルが陽性クラスを正しく予測する。 例えば、物体検出タスクにおいて、モデルが実際にフレーム内に存在する人物の周囲に境界ボックスを正しく描画する場合。
  • 真陰性(TN)モデルが陰性クラスを正しく予測する状態。 これは異常検出のようなシナリオにおいて極めて重要であり、 システムが製造部品に欠陥がないことを正しく識別することを意味する。
  • 偽陽性(FP)モデルが誤って陽性クラスを予測すること。 「第I種の誤り」とも呼ばれ、システムが存在しない対象を検知した場合に発生する。 例:防犯カメラが影を侵入者と誤検知するケース。
  • 偽陰性(FN)モデルが陰性クラスを誤って予測すること。「第II種誤り」として知られ、モデルが存在するdetect できず、本質的にターゲットを「見逃す」場合に発生する。

派生指標と重要性

混同行列の生の数値は、モデルの性能を説明するより高度な指標を計算するために使用される。 これらの派生指標を理解することは、ニューラルネットワークを最適化するために不可欠である。

  • 精度TP / (TP + FP) で算出されるこの指標は、陽性予測の正確性を示す。精度が高いほど誤検知が少ないことを意味する。
  • 再現率(感度)真陽性/(真陽性+偽陰性)で計算され、モデルが全ての陽性例を検出する能力を測定する。対象の検出漏れが深刻な結果を招く場合、高い再現率は極めて重要である。
  • F1スコア 精度と再現率の調和平均。両者のトレードオフをバランスさせた単一のスコアを提供し、異なるYOLO26モデルの比較に有用である。

実際のアプリケーション

混同行列によって定義される誤りの具体的なコストが、異なる産業向けにモデルを調整する方法を決定する。

医療分野における 医療分野におけるAIにおいてにおいて、混同行列は安全性の問題である。detect するための 医療画像解析モデルを訓練する際、 偽陰性(腫瘍を見逃すこと)は偽陽性(良性病変を医師の検討対象として誤検知すること)よりもはるかに深刻である。 したがって、エンジニアは潜在的な健康リスクを見逃さないよう、これらの行列において精度よりも再現率を優先する。

逆に、 製造品質管理においてはでは効率性が重要である。組立ラインの部品を分類するシステムが偽陽性(良品を不良品と誤判定)を過剰に生成すると、不要な廃棄物を生み出し生産を遅延させる。この場合、混同行列はエンジニアが精度を最大化するようモデルを調整するのに役立ち、排除されるものが真の不良品であることを保証し、自動化された機械学習ワークフローを効率化する。

YOLO26を用いた混同行列の生成

現代的なフレームワークを使用する場合、この行列の生成は標準的な検証パイプラインの一部となることが多い。以下の例は、 YOLO26モデル そして、以下のメソッドを使用して混同行列データにアクセスする ultralytics パッケージで提供される。

from ultralytics import YOLO

# Load a pre-trained YOLO26 model
model = YOLO("yolo26n.pt")

# Validate the model on the COCO8 dataset
# This automatically generates and plots the confusion matrix
metrics = model.val(data="coco8.yaml")

# Access the confusion matrix object directly
print(metrics.confusion_matrix.matrix)

関連概念の区別

混同行列を類似の評価指標と区別することが重要です。

  • 精度精度は単純に 全予測に対する正予測の比率である。有用ではあるが、不均衡データセットでは精度が非常に誤解を招く可能性がある。 例えば、メールの95%がスパムでない場合、全てのメールを「スパムではない」と予測するモデルの精度は95%だが無意味である。 混同行列はスパムクラスにおける真陽性(True Positives)がゼロであることを示し、この欠陥を明らかにする。
  • ROC曲線 混同行列は、特定の単一の信頼度閾値における性能の瞬間的なスナップショットを提供する。これに対し、受信者動作特性(ROC)曲線は、その閾値を変化させるにつれて真陽性率と偽陽性率がどのように変化するかを可視化する。Ultralytics ツールは、ユーザーが両方の可視化を探索し、自身の展開に最適な動作点を選択することを可能にする。

Ultralytics コミュニティに参加する

AIの未来を共に切り開きましょう。グローバルなイノベーターと繋がり、協力し、成長を。

今すぐ参加