Schalten Sie ein zu YOLO Vision 2025!
25. September 2025
10:00 — 18:00 Uhr BST
Hybride Veranstaltung
Yolo Vision 2024
Glossar

Genauigkeit

Entdecken Sie die Bedeutung der Genauigkeit im maschinellen Lernen, ihre Berechnung, Einschränkungen bei unausgewogenen Datensätzen und Möglichkeiten zur Verbesserung der Modellleistung.

Die Genauigkeit ist eine der grundlegendsten und intuitivsten Evaluierungsmetriken im maschinellen Lernen (ML). Sie misst den Anteil der korrekten Vorhersagen, die ein Modell von allen getroffenen Vorhersagen macht. Aufgrund ihrer Einfachheit ist die Genauigkeit oft die erste Metrik, die Entwickler betrachten, um ein allgemeines Gefühl für die Leistung eines KI-Modells zu bekommen, insbesondere bei Klassifizierungsaufgaben. Sie dient als schneller Gesundheitscheck, bevor man sich eingehender mit differenzierteren Bewertungen befasst.

Anwendungsfälle in der Praxis

Die Genauigkeit ist ein wichtiger Leistungsindikator in vielen Bereichen, in denen die Klassifizierung von entscheidender Bedeutung ist. Hier sind zwei Beispiele:

  • Medizinische Diagnose: In der KI-gestützten Gesundheitsversorgung könnte ein für die medizinische Bildanalyse entwickeltes Modell trainiert werden, um Röntgenbilder danach zu klassifizieren, ob sie Anzeichen einer Lungenentzündung aufweisen oder nicht. Eine hohe Genauigkeit bedeutet, dass das Modell das Vorhandensein oder Fehlen der Krankheit in einem hohen Prozentsatz der Fälle korrekt erkennt und Radiologen zuverlässige Unterstützung bietet.
  • Qualitätskontrolle in der Fertigung: In der intelligenten Fertigung kann ein Computer Vision-System eingesetzt werden, um Produkte auf einem Förderband zu inspizieren. Das Modell klassifiziert jeden Artikel als „defekt“ oder „nicht defekt“. Eine hohe Genauigkeit stellt sicher, dass fehlerhafte Produkte korrekt zur Entfernung identifiziert werden, während gleichzeitig die falsche Kennzeichnung guter Produkte minimiert wird, was sich direkt auf die Produktionseffizienz und -qualität auswirkt.

Einschränkungen der Genauigkeit

Trotz ihrer Nützlichkeit kann die Genauigkeit sehr irreführend sein, insbesondere wenn man es mit unausgewogenen Datensätzen zu tun hat. Ein unausgewogener Datensatz ist ein Datensatz, bei dem die Anzahl der Beispiele in verschiedenen Klassen stark variiert. Bei der Betrugserkennung beispielsweise überwiegen legitime Transaktionen bei weitem die betrügerischen. Ein Modell, das immer "nicht betrügerisch" vorhersagt, könnte eine Genauigkeit von über 99 % erreichen, wäre aber für seinen eigentlichen Zweck völlig nutzlos. Dies liegt daran, dass es die seltenen, aber kritischen Fälle nicht identifiziert. Dieses Szenario verdeutlicht das Accuracy Paradox, bei dem ein hoher Genauigkeitswert ein falsches Gefühl für die Effektivität eines Modells vermittelt.

Genauigkeit vs. andere Metriken

Um ein vollständiges Bild der Leistung eines Modells zu erhalten, ist es entscheidend, neben der Genauigkeit auch andere Metriken zu berücksichtigen.

  • Präzision: Misst den Anteil der positiven Vorhersagen, die tatsächlich korrekt waren. Sie beantwortet die Frage: "Wie viele meiner Vorhersagen für die positive Klasse waren richtig?" Eine hohe Präzision ist entscheidend, wenn die Kosten eines falsch positiven Ergebnisses hoch sind.
  • Recall: Auch bekannt als Sensitivität, misst diese Metrik den Anteil der tatsächlich positiven Fälle, die korrekt identifiziert wurden. Sie beantwortet: "Wie viele der tatsächlich positiven Fälle hat mein Modell gefunden?" Ein hoher Recall ist entscheidend, wenn die Kosten eines falsch negativen Ergebnisses hoch sind, wie z. B. beim medizinischen Screening.
  • F1-Score: Dies ist das harmonische Mittel aus Präzision und Rückruf (Recall) und bietet eine einzelne Kennzahl, die beide ausgleicht. Er ist besonders nützlich für die Bewertung von Modellen auf unausgewogenen Datensätzen, bei denen sowohl falsch positive als auch falsch negative Ergebnisse wichtig sind.
  • Konfusionsmatrix: Eine Tabelle, die die Leistung eines Klassifikationsmodells visualisiert, indem sie die Anzahl der True Positives, True Negatives, False Positives und False Negatives anzeigt. Sie liefert die Daten, die zur Berechnung von Genauigkeit, Präzision und Recall benötigt werden.
  • Mean Average Precision (mAP): Für komplexere Aufgaben wie die Objekterkennung ist mAP die Standardmetrik. Sie bewertet nicht nur die Korrektheit der Klassifizierung, sondern auch die Lokalisierungsgenauigkeit der vorhergesagten Bounding Boxes über verschiedene Konfidenzniveaus hinweg. Für ein tieferes Verständnis können Sie verschiedene Modellvergleiche untersuchen.

Verbesserung der Modellgenauigkeit

Verschiedene Techniken können dazu beitragen, die Modellgenauigkeit zu verbessern, beinhalten jedoch oft Kompromisse mit anderen Metriken oder Rechenkosten:

Die Beratung von Ressourcen wie Tipps zum Modelltraining kann praktische Anleitungen bieten. Plattformen wie Ultralytics HUB ermöglichen es Benutzern, Modelle zu trainieren und die Genauigkeit zusammen mit anderen wichtigen Metriken einfach zu verfolgen, oft visualisiert mit Tools wie TensorBoard. Die Verfolgung des Fortschritts auf diesem Gebiet kann über Ressourcen wie den Stanford AI Index Report oder das Durchsuchen von Datensätzen auf Papers With Code erfolgen. Frameworks wie PyTorch und TensorFlow werden häufig für den Aufbau und das Training dieser Modelle verwendet.

Zusammenfassend lässt sich sagen, dass die Genauigkeit zwar eine wertvolle und intuitive Metrik zur Bewertung der Leistung von KI-Modellen ist, sie aber selten isoliert verwendet werden sollte. Die Berücksichtigung der spezifischen Ziele der ML-Aufgabe und der Art der Daten, insbesondere potenzieller Ungleichgewichte oder unterschiedlicher Fehlerkosten, ist für die Auswahl der am besten geeigneten Bewertungsmetriken unerlässlich. Die Verwendung von Techniken aus der Erklärbaren KI (XAI) kann auch tiefere Einblicke über einzelne Metrikwerte hinaus liefern.

Treten Sie der Ultralytics-Community bei

Gestalten Sie die Zukunft der KI mit. Vernetzen Sie sich, arbeiten Sie zusammen und wachsen Sie mit globalen Innovatoren

Jetzt beitreten
Link in die Zwischenablage kopiert