Yolo Vision Shenzhen
Shenzhen
Jetzt beitreten
Glossar

Kreuzung über UnionIoU)

Erfahren Sie, was Intersection over UnionIoU) ist, wie es berechnet wird und welche wichtige Rolle es bei der Objekterkennung und der Bewertung von KI-Modellen spielt.

Intersection over UnionIoU) ist eine grundlegende Bewertungsmetrik, die in der Computer Vision (CV) zur Messung der Genauigkeit eines eines Objektdetektors für einen bestimmten Datensatz zu messen. In akademischen Kreisen wird sie oft auch als Jaccard-Index bezeichnet, quantifiziert IoU den Grad der Überlappung zwischen zwei Regionen: der vorhergesagten Bounding Box, die von einem Modell erzeugten Bounding Box und der Bounding Box der Grundwahrheit, d. h. der handbeschrifteten Annotation, die die tatsächliche Position des Objekts darstellt. Diese Metrik ergibt einen Wert zwischen 0 und 1, wobei 0 für keine Überlappung und 1 für eine perfekte Übereinstimmung zwischen der Vorhersage und der Realität darstellt.

Verstehen, wie IoU funktioniert

Die Berechnung von IoU ist konzeptionell einfach, was sie zu einem Standardmaßstab für Objekterkennung und Bildsegmentierungsaufgaben. Er wird bestimmt durch den Schnittbereich (die überlappende Region) durch den Vereinigungsbereich (die kombinierte Gesamtfläche der beiden Boxen). Durch die Normalisierung der Überlappungsfläche im Verhältnis zur Gesamtfläche bietet IoU ein skaleninvariantes Maß, d. h. es die Qualität der Anpassung unabhängig von der Größe des Objekts bewertet.

In praktischen Anwendungen wird häufig ein Schwellenwert auf die IoU angewendet, um classify Vorhersage als "positive" oder "negative" Erkennung zu klassifizieren. Zum Beispiel wird bei Standardherausforderungen wie den COCO , ein IoU von 0,5 (oder 50 %) verwendet, um festzustellen, ob eine Erkennung gültig ist. Dieser Schwellenwert ist entscheidend für die Berechnung von nachgelagerten Metriken wie Präzision und Recall, die letztendlich in den Mean Average Precision (mAP) -Punktzahl einfließen, die um die Leistung des Modells zu bewerten.

IoU mit Python

Sie können die IoU zwischen den Boxen leicht berechnen, indem Sie die Utility-Funktionen verwenden, die in der ultralytics Paket. Dies ist nützlich für benutzerdefinierte Auswertungsskripte oder zum Verständnis des Modellverhaltens während der Inferenz.

import torch
from ultralytics.utils.metrics import box_iou

# Define a ground truth box and a predicted box in (x1, y1, x2, y2) format
# Example: A 100x100 pixel box starting at (50,50) vs shifted prediction
ground_truth = torch.tensor([[50, 50, 150, 150]])
prediction = torch.tensor([[60, 60, 160, 160]])

# Calculate the Intersection over Union
iou_score = box_iou(ground_truth, prediction)

print(f"IoU Score: {iou_score.item():.4f}")
# Output represents the overlap ratio

Anwendungsfälle in der Praxis

Die von IoU gebotene Präzision der Lokalisierung ist in verschiedenen Branchen, in denen Sicherheit und Genauigkeit im Vordergrund stehen.

  • KI in der Automobilindustrie: Bei der Entwicklung von autonomen Fahrzeugen müssen die Systeme müssen die Systeme genau zwischen Fußgängern, anderen Fahrzeugen und statischen Hindernissen unterscheiden. Ein hoher IoU stellt sicher, dass dass das Wahrnehmungssystem genau weiß, wo sich ein Objekt in Bezug auf das Fahrzeug befindet, und nicht nur, dass es existiert. Diese präzise Lokalisierung ist entscheidend für die Flugbahnplanung und Kollisionsvermeidungssysteme, die von führenden Unternehmen wie Waymo und Tesla.
  • Medizinische Bildanalyse: Bei der Verwendung von KI zur detect Anomalien wie Tumoren in MRT- oder CT-Scans ist die genaue Begrenzung der Läsion der Läsion für die Diagnose und die Behandlungsplanung entscheidend. Ein Modell mit hohem IoU stellt sicher, dass die KI-Tools im Gesundheitswesen genau den gesamten betroffenen Bereich hervorhebt, ohne zu viel gesundes Gewebe einzuschließen, und so den Radiologen bei kritischen Entscheidungen.

IoU in Modelltraining und Inferenz

Über die einfache Bewertung hinaus spielt IoU eine aktive Rolle in der internen Mechanik moderner Architekturen wie YOLO11.

  • Optimierung derVerlustfunktion: Herkömmliche Verlustfunktionen haben oft Probleme mit Bounding Boxes, die sich nicht überschneiden. Um dieses Problem zu lösen, werden Variationen wie Generalized IoU GIoU), Distance IoU DIoU) und Complete IoU CIoU) direkt in den Trainingsprozess integriert. Prozess integriert. Diese Variationen liefern Gradienten, auch wenn sich die Boxen nicht berühren, und helfen dem Modell, schneller zu konvergieren und bessere Lokalisierung zu erreichen.
  • Nicht-maximale Unterdrückung (NMS): Während der Inferenz kann ein Objektdetektor mehrere Boundingboxen für ein einzelnes Objekt ausgeben. NMS verwendet IoU , um diese Ergebnisse zu filtern. Wenn zwei vorhergesagte Boxen einen IoU haben, der höher ist als ein bestimmter NMS (z. B. 0,7) und der gleichen Klasse angehören, wird das Feld mit dem niedrigeren Konfidenzwert unterdrückt, so dass nur die beste Vorhersage übrig.

IoU vs. verwandte Metriken

Es ist wichtig, IoU von ähnlichen Begriffen zu unterscheiden, um die richtige Kennzahl für Ihre spezielle Aufgabe zu wählen.

  • IoU vs. Genauigkeit: Die Genauigkeit misst den Prozentsatz der richtigen Klassifizierungen (z. B. "Ist das eine Katze?"). Dabei wird nicht berücksichtigt wo sich das Objekt befindet. IoU misst speziell die Qualität der Lokalisierung (z. B. "Wie gut passt passt die Schachtel zur Katze?"). Ein Modell kann eine hohe Klassifizierungsgenauigkeit, aber einen niedrigen IoU haben, wenn die Boxen lose sind oder falsch ausgerichtet sind.
  • IoU vs. Dice-Koeffizient: Während beide die Überschneidung messen und positiv korreliert sind, verleiht der Dice-Koeffizient (oder die F1-Punktzahl von Pixeln) mehr der Überschneidung mehr Gewicht. Der Dice-Koeffizient wird in der Regel bei semantischen Segmentierungsaufgaben, während IoU der Standard für die Erkennung von Bounding-Box-Objekten ist.

Werden Sie Mitglied der Ultralytics

Gestalten Sie die Zukunft der KI mit. Vernetzen Sie sich, arbeiten Sie zusammen und wachsen Sie mit globalen Innovatoren

Jetzt beitreten