Glossar

Kreuzung über Union (IoU)

Erfahren Sie, was Intersection over Union (IoU) ist, wie es berechnet wird und welche wichtige Rolle es bei der Objekterkennung und der Bewertung von KI-Modellen spielt.

Intersection over Union (IoU) ist eine grundlegende Bewertungsmetrik, die in der Computer Vision (CV) verwendet wird, insbesondere für Aufgaben der Objekterkennung. Sie misst die Überlappung zwischen zwei Begrenzungen: der von einem Modell erzeugten vorhergesagten Bounding Box und der Ground Truth Bounding Box, d. h. dem von Hand beschrifteten, korrekten Umriss. Die resultierende Punktzahl, ein Wert zwischen 0 und 1, gibt an, wie genau ein Modell ein Objekt in einem Bild lokalisiert hat. Ein Wert von 1 steht für eine perfekte Übereinstimmung, während ein Wert von 0 anzeigt, dass es überhaupt keine Überschneidung gibt. Diese Metrik ist entscheidend für die Bewertung der Lokalisierungsgenauigkeit von Modellen wie Ultralytics YOLO11.

Wie IoU funktioniert

Im Kern berechnet IoU das Verhältnis zwischen der Schnittmenge (überlappende Fläche) und der Vereinigung (Gesamtfläche, die von beiden Boxen abgedeckt wird) der vorhergesagten und der wahren Bounding Box. Stellen Sie sich zwei sich überschneidende Quadrate vor. Die "Schnittmenge" ist der gemeinsame Bereich, in dem sie sich überschneiden. Die "Union" ist die Gesamtfläche, die beide Quadrate zusammen abdecken, wobei der überlappende Teil nur einmal gezählt wird. Indem die Schnittmenge durch die Summe geteilt wird, liefert IoU ein standardisiertes Maß dafür, wie gut das vorhergesagte Feld mit dem tatsächlichen Objekt übereinstimmt. Dieses einfache, aber leistungsfähige Konzept ist ein Eckpfeiler des modernen Deep Learning (DL) für die Objekterkennung.

Ein wichtiger Bestandteil der Verwendung von IoU ist die Festlegung eines "IoU-Schwellenwerts". Dieser Schwellenwert ist ein vordefinierter Wert (z. B. 0,5), der bestimmt, ob eine Vorhersage korrekt ist. Liegt der IoU-Wert für ein vorhergesagtes Feld über diesem Schwellenwert, wird es als "wahr positiv" eingestuft. Liegt der Wert darunter, handelt es sich um ein "falsches Positiv". Dieser Schwellenwert wirkt sich direkt auf andere Leistungskennzahlen wie Precision und Recall aus und ist eine entscheidende Komponente bei der Berechnung der mittleren durchschnittlichen Precision (mAP), einer Standardkennzahl für die Bewertung von Objekterkennungsmodellen in Benchmark-Datensätzen wie COCO.

Anwendungen in der realen Welt

IoU ist für die Validierung der Leistung zahlreicher KI-Systeme unerlässlich. Hier sind ein paar Beispiele:

  1. Autonomes Fahren: Bei der künstlichen Intelligenz für selbstfahrende Autos wird IoU verwendet, um zu bewerten, wie gut das Sichtsystem des Fahrzeugs Fußgänger, andere Fahrzeuge und Verkehrsschilder erkennt. Ein hoher IoU-Wert stellt sicher, dass die vorhergesagten Bounding Boxes präzise sind, was für eine sichere Navigation und Kollisionsvermeidung entscheidend ist. Unternehmen wie Waymo verlassen sich für die Sicherheit ihrer autonomen Systeme in hohem Maße auf eine genaue Objekterkennung.
  2. Medizinische Bildgebung: In der medizinischen Bildanalyse hilft IoU bei der Bewertung der Genauigkeit von Modellen, die Anomalien wie Tumore oder Läsionen in Scans wie MRT oder CT erkennen. Eine präzise Lokalisierung ist für die Behandlungsplanung von entscheidender Bedeutung, und IoU liefert ein zuverlässiges Maß dafür, ob die Vorhersage eines Modells klinisch nützlich ist. Dies ist entscheidend für Anwendungen wie die Tumorerkennung mit YOLO-Modellen.

Verbesserung der Modellleistung mit IoU

IoU ist nicht nur eine Bewertungsmetrik, sondern auch ein wesentlicher Bestandteil des Trainingsprozesses selbst. Viele moderne Objekterkennungsarchitekturen, einschließlich der Varianten von Ultralytics YOLOv8 und YOLO11, verwenden IoU oder seine Variationen direkt in ihren Verlustfunktionen. Diese fortschrittlichen IoU-basierten Verlustfunktionen, wie Generalized IoU (GIoU), Distance-IoU (DIoU) oder Complete-IoU (CIoU), helfen dem Modell beim Lernen, Bounding Boxes vorherzusagen, die sich nicht nur gut überlappen, sondern auch Faktoren wie den Abstand zwischen den Zentren und die Konsistenz des Seitenverhältnisses berücksichtigen. Dies führt zu einer schnelleren Konvergenz und besseren Lokalisierungsleistung im Vergleich zu herkömmlichen Regressionsverlusten. Detaillierte Vergleiche zwischen verschiedenen YOLO-Modellen finden Sie in unserer Dokumentation.

Die Überwachung der IoU während der Modellschulung und der Abstimmung der Hyperparameter hilft den Entwicklern, die Modelle für eine bessere Lokalisierung zu verfeinern. Tools wie Ultralytics HUB ermöglichen die Verfolgung von IoU und anderen Metriken und rationalisieren den Modellverbesserungszyklus. Trotz ihres weit verbreiteten Nutzens kann die Standard-IoU manchmal unempfindlich sein, insbesondere bei nicht überlappenden Boxen. Diese Einschränkung veranlasste die Entwicklung der oben genannten IoU-Varianten. Nichtsdestotrotz bleibt IoU ein Eckpfeiler der Bewertung von Computer Vision.

IoU vs. andere Metriken

Obwohl der IoU von entscheidender Bedeutung ist, ist es wichtig, seine Beziehung zu anderen Messgrößen zu verstehen:

  • IoU vs. Genauigkeit: Die Genauigkeit ist eine gängige Kennzahl für Klassifizierungsaufgaben, die den Prozentsatz der richtigen Vorhersagen misst. Für die Objekterkennung ist sie jedoch ungeeignet, da sie Lokalisierungsfehler nicht berücksichtigt. Eine Vorhersage könnte ein Objekt richtig klassifizieren, aber die Bounding Box schlecht platzieren. IoU geht speziell auf dieses Problem ein, indem es die Qualität der Lokalisierung misst.
  • IoU vs. mittlere durchschnittliche Präzision (mAP): Diese Begriffe sind verwandt, aber unterschiedlich. IoU misst die Qualität einer einzelnen vorhergesagten Bounding Box. Im Gegensatz dazu ist mAP eine umfassende Metrik, die die Leistung des Modells für alle Objekte und Klassen in einem Datensatz bewertet. Sie wird berechnet, indem die Präzisionswerte über mehrere IoU-Schwellenwerte und alle Klassen gemittelt werden. Im Wesentlichen ist IoU ein Baustein für die Berechnung von mAP. Eine ausführliche Erklärung dieser Beziehung finden Sie in unserem Leitfaden zu YOLO-Leistungsmetriken.
  • IoU vs. F1-Score: Der F1-Score ist das harmonische Mittel aus Precision und Recall und wird häufig bei der Klassifizierung verwendet. Während Präzision und Recall bei der Berechnung von mAP verwendet werden, misst der F1-Score selbst nicht direkt die Lokalisierungsqualität, wie es IoU tut. Er konzentriert sich eher auf das Gleichgewicht zwischen dem Auffinden aller positiven Instanzen und der Korrektheit dieser Ergebnisse.

Werden Sie Mitglied der Ultralytics-Gemeinschaft

Beteiligen Sie sich an der Zukunft der KI. Vernetzen Sie sich, arbeiten Sie zusammen und wachsen Sie mit globalen Innovatoren

Jetzt beitreten
Link in die Zwischenablage kopiert