Schalten Sie ein zu YOLO Vision 2025!
25. September 2025
10:00 — 18:00 Uhr BST
Hybride Veranstaltung
Yolo Vision 2024
Glossar

Bounding Box

Erfahren Sie, wie Begrenzungsrahmen (Bounding Boxes) Objekterkennung, KI und Machine-Learning-Systeme ermöglichen. Entdecken Sie ihre Rolle in Computer-Vision-Anwendungen!

Eine Bounding Box ist eine rechteckige Annotation, die in der Computer Vision verwendet wird, um die Position eines Objekts innerhalb eines Bildes oder Videoframes anzugeben. Sie dient als grundlegender Bestandteil der Objekterkennung und bietet eine einfache, aber effektive Möglichkeit, die Position und Größe eines Objekts zu definieren. Im maschinellen Lernen werden Modelle anhand großer Datensätze von Bildern mit beschrifteten Bounding Boxes trainiert, um zu lernen, wie man Objekte selbstständig identifiziert und lokalisiert. Die Ausgabe dieser Modelle umfasst die Koordinaten der Box, eine Klassenbezeichnung (z. B. "Auto", "Person") und einen Konfidenzwert, der die Sicherheit des Modells bei seiner Vorhersage angibt.

Wie Bounding Boxes funktionieren

Eine Bounding Box wird typischerweise durch eine Reihe von Koordinaten definiert, die ihre Position und Größe angeben. Die gebräuchlichsten Darstellungen sind:

  • Koordinaten der oberen linken Ecke mit Breite und Höhe (x, y, w, h): Dieses Format gibt die x- und y-Koordinaten der oberen linken Ecke zusammen mit der Breite und Höhe des Felds an.
  • Eckpunkte (x_min, y_min, x_max, y_max): Dieses Format definiert die Koordinaten der oberen linken und unteren rechten Ecke des Rechtecks.

Diese Koordinaten werden verwendet, um Deep-Learning-Modelle zu trainieren, die lernen, diese Werte für neue, unbekannte Bilder vorherzusagen. Die Genauigkeit einer vorhergesagten Bounding Box wird oft mit einer Metrik namens Intersection over Union (IoU) bewertet, die die Überlappung zwischen der vorhergesagten Box und der Ground-Truth-Box misst. Moderne Objekterkennungsmodelle, wie Ultralytics YOLO11, sind hochgradig optimiert, um präzise Bounding Boxes in Echtzeit zu generieren.

Arten von Bounding Boxes

Es gibt zwei Haupttypen von Begrenzungsrahmen:

  1. Achsenparallele Bounding Box: Dies ist der gebräuchlichste Typ, bei dem die Seiten des Rechtecks an der horizontalen und vertikalen Achse des Bildes ausgerichtet sind. Sie sind einfach darzustellen und zu verarbeiten, können jedoch ineffizient für Objekte sein, die gedreht oder unregelmäßig geformt sind, da die Box einen erheblichen Hintergrundbereich enthalten kann.
  2. Orientierte Bounding Box (OBB): Diese Art von Box enthält einen zusätzlichen Parameter für die Rotation, wodurch sie sich enger um geneigte Objekte legen kann. OBBs sind besonders nützlich in spezialisierten Anwendungen wie der Satellitenbildanalyse oder Luftaufnahmen von Drohnen, wo Objekte oft aus verschiedenen Winkeln betrachtet werden. Modelle wie YOLO11 unterstützen die orientierte Objekterkennung, um diese Szenarien effektiver zu handhaben.

Beziehung zu anderen Konzepten

Bounding Boxes sind eng mit anderen Computer-Vision-Aufgaben verwandt, dienen aber einem bestimmten Zweck.

  • Objekterkennung vs. Bildsegmentierung: Während die Objekterkennung Bounding Boxes verwendet, um Objekte zu lokalisieren, bietet die Bildsegmentierung ein detaillierteres Verständnis der Form eines Objekts. Die Instanzsegmentierung geht beispielsweise noch einen Schritt weiter, indem sie die exakte Pixelebene jedes einzelnen Objekts umreißt, anstatt nur ein Rechteck darum zu zeichnen. Dies ist nützlich für Anwendungen, die präzise Forminformationen erfordern. Weitere Informationen finden Sie in diesem Leitfaden zur Instanzsegmentierung.
  • Bounding Box vs. Anchor Box: In einigen Objekterkennungsmodellen, die als Anchor-basierte Detektoren bekannt sind, werden vordefinierte Boxen, sogenannte "Anchor Boxes", als Referenzen verwendet, um dem Modell bei der Vorhersage der endgültigen Bounding Box zu helfen. Im Gegensatz dazu sagen Anchor-freie Detektoren Bounding Boxes direkt ohne diese Voreinstellungen voraus, was oft die Modellarchitektur vereinfacht.

Anwendungen in realen Szenarien

Bounding Boxes sind integraler Bestandteil zahlreicher praktischer KI-Anwendungen:

  1. Autonome Fahrzeuge: Selbstfahrende Autos sind stark auf die Objekterkennung angewiesen, um Fußgänger, andere Fahrzeuge und Ampeln mithilfe von Bounding Boxes zu identifizieren und zu lokalisieren. Dieses räumliche Bewusstsein, das oft durch Deep-Learning-Modelle erreicht wird, ist entscheidend für eine sichere Navigation. Unternehmen wie Waymo präsentieren diese Technologie ausführlich. Ultralytics bietet Einblicke in KI in selbstfahrenden Autos.
  2. Einzelhandelsanalytik: Im Einzelhandel helfen Bounding Boxes bei der KI-gestützten Bestandsverwaltung, indem sie Produkte in Regalen erkennen, Lagerbestände überwachen und das Kundenverhalten anhand von Kundenfrequenzmustern analysieren (Objektzählung).
  3. Sicherheit und Überwachung: Bounding Boxes ermöglichen es automatisierten Überwachungssystemen, Personen oder Objekte in Echtzeit zu erkennen und zu verfolgen und so Warnmeldungen bei verdächtigen Aktivitäten auszulösen. Dies ist die Grundlage für den Aufbau von Anwendungen wie Sicherheitsalarmsystemen.
  4. Medizinische Bildanalyse: Im Gesundheitswesen unterstützen Bounding Boxes Kliniker, indem sie potenzielle Anomalien wie Tumore in Scans hervorheben und so eine schnellere Diagnose ermöglichen. Beispiele hierfür finden Sie in der Radiology: Artificial Intelligence research und auf unserer Seite zur medizinischen Bildanalyse.
  5. Landwirtschaft: Bounding Boxes werden in der Präzisionslandwirtschaft für Aufgaben wie die Identifizierung von Früchten für die Ernte, die Überwachung der Pflanzengesundheit oder die Erkennung von Schädlingen verwendet, wie in unserem Blog über Computer Vision in der Landwirtschaft beschrieben.

Treten Sie der Ultralytics-Community bei

Gestalten Sie die Zukunft der KI mit. Vernetzen Sie sich, arbeiten Sie zusammen und wachsen Sie mit globalen Innovatoren

Jetzt beitreten
Link in die Zwischenablage kopiert