Mean Average Precision (mAP)
Erfahre, wie Mean Average Precision (mAP) Computer-Vision-Modelle bewertet. Erkunde IoU, Präzision und Recall und berechne mAP noch heute mit Ultralytics YOLO26.
Mean Average Precision (mAP) ist eine umfassende Metrik, die weit verbreitet ist, um die Leistung von computer vision Modellen zu bewerten, insbesondere bei Aufgaben wie object detection und instance segmentation. Im Gegensatz zur einfachen Genauigkeit (Accuracy), die lediglich prüft, ob ein Bild korrekt klassifiziert wurde, bewertet mAP, wie gut ein Modell Objekte findet und wie präzise es die bounding box um sie herum positioniert. Dies macht es zum primären Benchmark für den Vergleich modernster Architekturen wie YOLO26 mit früheren Generationen. Durch die Zusammenfassung des Kompromisses zwischen Präzision (Precision) und Recall über alle Klassen hinweg liefert mAP einen einzigen Wert, der die Robustheit eines Modells in realen Szenarien widerspiegelt.
Link to this sectionDie Komponenten von mAP#
Um mAP zu berechnen, ist es notwendig, zunächst drei grundlegende Konzepte zu verstehen, die die Erkennungsqualität definieren:
- Intersection over Union (IoU): Dies misst die räumliche Überlappung zwischen der vorhergesagten Box und der ground truth Annotation. Es ist ein Verhältnis, das zwischen 0 und 1 liegt. Eine Vorhersage wird oft nur dann als "True Positive" betrachtet, wenn die IoU einen bestimmten Schwellenwert überschreitet, wie z. B. 0,5 oder 0,75.
- Precision: Diese Metrik beantwortet die Frage: "Welcher Anteil der Objekte, die das Modell zu erkennen glaubte, war tatsächlich korrekt?" Eine hohe Precision bedeutet, dass das Modell sehr wenige false positives erzeugt.
- Recall: Diese Metrik fragt: "Welchen Anteil aller tatsächlich im Bild vorhandenen Objekte hat das Modell gefunden?" Ein hoher Recall zeigt an, dass das Modell false negatives vermeidet und selten ein Objekt übersieht.
Link to this sectionBerechnungsmethodik#
Die Berechnung beginnt mit der Bestimmung der Average Precision (AP) für jede spezifische Klasse (z. B. "Person", "Auto", "Hund"). Dies erfolgt durch Ermittlung der Fläche unter der Precision-Recall Curve, welche die Precision gegen den Recall bei verschiedenen confidence Schwellenwerten aufträgt. Das "Mean" in Mean Average Precision bezieht sich einfach auf die Mittelwertbildung dieser AP-Werte über alle Kategorien in den training data hinweg.
Standard-Forschungsbenchmarks, wie das COCO dataset, berichten häufig von zwei Hauptvarianten:
-
mAP@50: Dies betrachtet eine Erkennung als korrekt, wenn die IoU mindestens 0,50 beträgt. Es ist eine nachsichtige Metrik.
-
mAP@50-95: Dies ist der Durchschnitt der mAP, berechnet bei IoU-Schwellenwerten von 0,50 bis 0,95 in Schritten von 0,05. Diese strenge Metrik belohnt Modelle, die eine hohe localization accuracy erreichen.
Link to this sectionmAP im Vergleich zu ähnlichen Metriken#
Es ist wichtig, mAP von Accuracy zu unterscheiden. Accuracy ist für die image classification geeignet, bei der die Ausgabe ein einziges Label für das gesamte Bild ist, versagt jedoch bei der Objekterkennung, da sie die räumliche Position des Objekts oder die Hintergrundklasse nicht berücksichtigt. Während der F1-Score zwar ein harmonisches Mittel aus Precision und Recall bei einem einzelnen Konfidenzschwellenwert liefert, integriert mAP die Leistung über alle Konfidenzniveaus hinweg und bietet somit einen ganzheitlicheren Blick auf die Modellstabilität.
Link to this sectionPraxisanwendungen#
Hohe mAP-Werte sind in Umgebungen, in denen Sicherheit und Effizienz oberste Priorität haben, von entscheidender Bedeutung.
- Autonomous Vehicles: In der Technologie für selbstfahrende Autos hängt die Sicherheit davon ab, Fußgänger und Verkehrsschilder mit hohem Recall (nichts übersehen) und hoher Precision (Vermeidung von Phantombremsungen) zu erkennen. mAP stellt sicher, dass das Wahrnehmungssystem diese Anforderungen effektiv ausbalanciert.
- Medical Image Analysis: Bei der Identifizierung von Tumoren oder Frakturen in Röntgenbildern verlassen sich Radiologen auf AI in healthcare, um potenzielle Probleme zu markieren. Ein hoher mAP-Wert zeigt an, dass das Modell Anomalien zuverlässig hervorhebt, ohne den Arzt mit Fehlalarmen zu überhäufen, was eine genaue Diagnose erleichtert.
Link to this sectionMessen von mAP mit Ultralytics#
Moderne Frameworks vereinfachen die Berechnung dieser Metriken während der validation Phase. Das folgende Beispiel zeigt, wie du ein Modell lädst und mAP mit dem ultralytics Python-Paket berechnest.
from ultralytics import YOLO
# Load the YOLO26 model (recommended for new projects)
model = YOLO("yolo26n.pt")
# Validate the model on a dataset to compute mAP
# This runs inference and compares predictions to ground truth
metrics = model.val(data="coco8.yaml")
# Print mAP@50-95 (map) and mAP@50 (map50)
print(f"mAP@50-95: {metrics.box.map:.3f}")
print(f"mAP@50: {metrics.box.map50:.3f}")Das Verständnis und die Optimierung für mAP ist entscheidend vor dem model deployment. Um diesen Prozess zu rationalisieren, bietet die Ultralytics Platform ein automatisiertes Tracking von mAP, Verlustkurven (Loss Curves) und anderen KPIs während des Trainings, wodurch Entwickler Fortschritte visualisieren und den besten Modell-Checkpoint für die Produktion auswählen können.






