混同行列を使用してモデルのパフォーマンスを理解します。指標、実際の使用例、およびAI分類の精度を向上させるためのツールについて解説します。
混同行列は、出力結果が2つ以上のクラスとなる機械学習分類問題の性能測定ツールである。予測値と実際の値の4つの異なる組み合わせを示す表であり、モデル評価におけるデータ可視化の基盤要素として機能する。データセットの不均衡により誤解を招く可能性がある単純な精度とは異なり、混同行列はコンピュータビジョン(CV)モデルが誤りを生じている箇所を詳細に分析する。 予測結果と 真のラベルを比較することで、開発者はシステムが 特定の2つのクラスを混同しているのか、あるいはdetect 完全にdetect できていないのかを判断できます。
このマトリクス自体は、二値分類では通常4つの象限に分割されますが、 Ultralytics 扱うような多クラス問題では拡張されます。 これら4つの要素は、モデルが予測した内容と画像内に実際に存在する内容の 交差点を表しています。
混同行列の生の数値は、モデルの性能を説明するより高度な指標を計算するために使用される。 これらの派生指標を理解することは、ニューラルネットワークを最適化するために不可欠である。
混同行列によって定義される誤りの具体的なコストが、異なる産業向けにモデルを調整する方法を決定する。
医療分野における 医療分野におけるAIにおいてにおいて、混同行列は安全性の問題である。detect するための 医療画像解析モデルを訓練する際、 偽陰性(腫瘍を見逃すこと)は偽陽性(良性病変を医師の検討対象として誤検知すること)よりもはるかに深刻である。 したがって、エンジニアは潜在的な健康リスクを見逃さないよう、これらの行列において精度よりも再現率を優先する。
逆に、 製造品質管理においてはでは効率性が重要である。組立ラインの部品を分類するシステムが偽陽性(良品を不良品と誤判定)を過剰に生成すると、不要な廃棄物を生み出し生産を遅延させる。この場合、混同行列はエンジニアが精度を最大化するようモデルを調整するのに役立ち、排除されるものが真の不良品であることを保証し、自動化された機械学習ワークフローを効率化する。
現代的なフレームワークを使用する場合、この行列の生成は標準的な検証パイプラインの一部となることが多い。以下の例は、
YOLO26モデル そして、以下のメソッドを使用して混同行列データにアクセスする ultralytics パッケージで提供される。
from ultralytics import YOLO
# Load a pre-trained YOLO26 model
model = YOLO("yolo26n.pt")
# Validate the model on the COCO8 dataset
# This automatically generates and plots the confusion matrix
metrics = model.val(data="coco8.yaml")
# Access the confusion matrix object directly
print(metrics.confusion_matrix.matrix)
混同行列を類似の評価指標と区別することが重要です。