Verstehen Sie die Modellleistung mit einer Confusion Matrix. Entdecken Sie Metriken, reale Anwendungen und Tools zur Verfeinerung der Genauigkeit der KI-Klassifizierung.
Eine Konfusionsmatrix ist ein umfassendes Werkzeug zur Leistungsmessung, das beim maschinellen Lernens (ML) zur Bewertung der Genauigkeit eines Klassifikationsmodells. Im Gegensatz zu einer einfachen Genauigkeitsbewertung, die nur den Prozentsatz der richtigen Vorhersagen angibt, liefert eine Konfusionsmatrix eine detaillierte Aufschlüsselung, wie wie das Modell die einzelnen Klassen kategorisiert. Sie veranschaulicht die Diskrepanz zwischen den vorhergesagten Bezeichnungen und der tatsächlichen Grundlage. Sie visualisiert die Diskrepanz zwischen den vorhergesagten Bezeichnungen und der tatsächlichen Basiswahrheit und ermöglicht es den Entwicklern, genau festzustellen, wo ein Modell "verwirrt" ist oder systematische Fehler macht. Diese Detailgenauigkeit ist entscheidend für die Verfeinerung komplexer Computer Vision (CV) Systeme, wie zum Beispiel die gebaut mit Ultralytics YOLO11.
Eine Konfusionsmatrix unterteilt die Vorhersagen eines Klassifikators in vier verschiedene Kategorien, die in der Regel in einem Gitternetz angeordnet. Anhand dieser Komponenten lässt sich feststellen, ob ein Modell unter bestimmten Fehlertypen leidet, wie z. B. "Fehlalarme" oder "verfehlte Ziele":
Während breite Metriken für einen umfassenden Überblick nützlich sind, ist die Konfusionsmatrix für den Umgang mit unausgewogenen Datensätzen. Wenn ein Datensatz 95 Katzen und 5 Hunde enthält, erreicht ein Modell, das einfach jedes Mal "Katze" errät, 95% Genauigkeit, ist aber für die Suche nach Hunden unbrauchbar. Die Konfusionsmatrix würde diesen Fehler sofort offenbaren, da sie null True Positives für die Klasse "Hund".
Diese Aufschlüsselung dient als Grundlage für die Berechnung anderer wichtiger Leistungsmetriken. Durch die Analyse der Matrix können Ingenieure ableiten:
Die Bedeutung der Konfusionsmatrix variiert je nach spezifischer Anwendung und den "Kosten" der verschiedenen Fehler. verschiedener Fehler.
Die ultralytics Bibliothek berechnet und speichert automatisch Verwechslungsmatrizen während der Validierung
Prozess. Dies ermöglicht es den Benutzern, die Leistung über alle Klassen in ihrem Datensatz zu visualisieren.
from ultralytics import YOLO
# Load the YOLO11 model
model = YOLO("yolo11n.pt")
# Validate the model on a dataset like COCO8
# This generates the confusion matrix in the 'runs/detect/val' directory
results = model.val(data="coco8.yaml")
# You can also programmatically access the matrix data
print(results.confusion_matrix.matrix)
Es ist wichtig, die Konfusionsmatrix von abgeleiteten Metriken zu unterscheiden. Während Accuracy, Precision und Recall Zusammenfassungen einzelner Zahlen sind, ist die Konfusionsmatrix die Rohdatenquelle, aus der diese Zahlen berechnet werden. Sie liefert das "Gesamtbild" und nicht nur eine Momentaufnahme. Außerdem wird bei der Objekterkennung interagiert die Matrix häufig mit Schnittmenge über Vereinigung (IoU) Schwellenwerten, um zu bestimmen, was als "True Positive" gilt, was der Bewertung bei Computer-Vision-Aufgaben eine weitere Computer Vision Aufgaben.