Glossar

Bounding Box

Erfahren Sie, wie Bounding Boxes die Objekterkennung, KI und maschinelle Lernsysteme ermöglichen. Erforschen Sie ihre Rolle in Computer-Vision-Anwendungen!

Ein Begrenzungsrahmen (Bounding Box) ist ein rechteckiger Rahmen, der in der Computer Vision (CV) verwendet wird, um die Position und ungefähre Ausdehnung eines Objekts innerhalb eines Bildes oder Videobildes anzugeben. Diese Boxen, die in der Regel durch die Koordinaten der linken oberen und rechten unteren Ecke (oder des Mittelpunkts, der Breite und der Höhe) definiert sind, bieten eine einfache, aber effektive Methode, um anzugeben, wo sich ein Objekt befindet und wie viel Platz es einnimmt. Bounding Boxes sind grundlegende Komponenten für verschiedene Lebenslaufaufgaben, darunter Objekterkennung, Objektverfolgung und Bildbeschriftung, und bilden einen Eckpfeiler vieler moderner Systeme für künstliche Intelligenz (KI) und maschinelles Lernen (ML). Sie sind unerlässlich, damit Maschinen nicht nur verstehen können , welche Objekte vorhanden sind, sondern auch , wo sie sich in einer visuellen Szene befinden.

Bedeutung bei der Objekterkennung

Bounding Boxes sind sowohl für das Training als auch für die Bewertung von Objekterkennungsmodellen von entscheidender Bedeutung. Bei Aufgaben, die von Modellen wie Ultralytics YOLO gelöst werden, dienen Bounding Boxes während des Trainingsprozesses als "Grundwahrheit". Das bedeutet, dass sie die korrekte Position und Größe von Objekten in den Trainingsdaten darstellen und dem Modell beibringen, Objekte genau zu lokalisieren. Dieser Prozess beginnt oft mit einer sorgfältigen Datenbeschriftung, bei der Menschen oder automatisierte Tools diese Boxen um die Objekte in den Bildern zeichnen. Dabei werden häufig Plattformen wie CVAT verwendet oder mit Plattformen wie Ultralytics HUB für die Datensatzverwaltung integriert. Während der Inferenz sagt das trainierte Modell die Bounding Boxes um die erkannten Objekte zusammen mit den Klassenbezeichnungen und Vertrauenswerten voraus. Diese Lokalisierungsfunktion ist für Anwendungen, die nicht nur die Identifizierung von Objekten, sondern auch deren genaue Position erfordern, von entscheidender Bedeutung.

Wichtige Konzepte im Zusammenhang mit Bounding Boxes

Mehrere Metriken und Techniken sind eng mit der Verwendung und Bewertung von Bounding Boxes in ML-Modellen verbunden:

  • Schnittpunkt über Union (IoU): Eine Metrik zur Messung der Überlappung zwischen der vorhergesagten Bounding Box und der Bounding Box der Grundwahrheit. Sie quantifiziert die Genauigkeit der Lokalisierung.
  • Nicht-Maximum-Unterdrückung (NMS): Eine Nachbearbeitungstechnik, die dazu dient, redundante, sich überschneidende Bounding Boxes für dasselbe Objekt zu eliminieren und nur die zuverlässigste Vorhersage zu behalten.
  • Mittlere durchschnittliche Präzision (mAP): Eine Standardmetrik zur Bewertung der Leistung von Objekterkennungsmodellen, die sowohl die Klassifizierungsgenauigkeit als auch die Lokalisierungsgenauigkeit berücksichtigt (oft auf der Grundlage eines IoU-Schwellenwerts). Siehe detaillierte YOLO-Leistungskennzahlen.
  • Anker-Boxen: Vordefinierte Boxen verschiedener Größen und Seitenverhältnisse, die in einigen Detektoren (z. B. älteren YOLO-Versionen) verwendet werden, um die Bounding Boxes besser vorhersagen zu können. Neuere Modelle, einschließlich YOLO11, sind oft ankerfrei und vereinfachen den Erkennungskopf.
  • COCO-Datensatz: Ein umfangreicher Datensatz zur Objekterkennung, -segmentierung und -beschriftung, der häufig zum Benchmarking von Objekterkennungsmodellen verwendet wird. Ultralytics bietet einfachen Zugang zu COCO und anderen Erkennungsdatensätzen.

Bounding Boxes vs. verwandte Begriffe

Während die standardmäßigen (achsenausgerichteten) Bounding Boxes Objekte mit einfachen Rechtecken lokalisieren, bieten andere Computer-Vision-Techniken unterschiedliche Detailstufen oder behandeln unterschiedliche Szenarien:

Anwendungen in realen Szenarien

Bounding Boxes sind Bestandteil zahlreicher praktischer KI-Anwendungen:

  1. Autonome Fahrzeuge: Selbstfahrende Autos sind in hohem Maße auf die Objekterkennung angewiesen, um Fußgänger, andere Fahrzeuge, Ampeln und Hindernisse mithilfe von Bounding Boxes zu erkennen und zu lokalisieren. Dieses räumliche Bewusstsein, das oft durch Deep-Learning-Modelle erreicht wird, ist entscheidend für eine sichere Navigation und Entscheidungsfindung. Unternehmen wie Waymo setzen diese Technologie ausgiebig ein. Ultralytics bietet Einblicke in die KI in selbstfahrenden Autos.
  2. Analytik im Einzelhandel: Im Einzelhandel helfen Bounding Boxes bei der KI-gesteuerten Bestandsverwaltung, indem sie Produkte in den Regalen erkennen, den Lagerbestand überwachen und das Kundenverhalten anhand von Regalinteraktionen oder Laufmustern analysieren(Objektzählung).
  3. Sicherheit und Überwachung: Bounding Boxes ermöglichen es automatischen Überwachungssystemen, Personen oder Objekte von Interesse in Echtzeit zu erkennen und zu verfolgen und bei unbefugtem Zutritt oder verdächtigen Aktivitäten einen Alarm auszulösen. Dies ist für Gebäudeanwendungen wie Sicherheitsalarmsysteme von grundlegender Bedeutung.
  4. Medizinische Bildanalyse: Im Gesundheitswesen unterstützen Bounding Boxes Radiologen und Kliniker, indem sie potenzielle Anomalien wie Tumore oder Läsionen in Scans (Röntgenaufnahmen, CT, MRT) hervorheben und so zu einer schnelleren und genaueren Diagnose beitragen. Siehe Beispiele in Radiologie: Künstliche Intelligenz und Ultralytics' Überblick über die medizinische Bildanalyse.
  5. Landwirtschaft: Bounding Boxes werden in der Präzisionslandwirtschaft für Aufgaben wie die Identifizierung von Früchten für die Ernte(Fruchterkennung), die Überwachung der Pflanzengesundheit oder die Erkennung von Schädlingen eingesetzt.

Werden Sie Mitglied der Ultralytics-Gemeinschaft

Beteiligen Sie sich an der Zukunft der KI. Vernetzen Sie sich, arbeiten Sie zusammen und wachsen Sie mit globalen Innovatoren

Jetzt beitreten
Link in die Zwischenablage kopiert