Bounding Box

Lerne, wie Bounding Boxes Objektpositionen in der Computer Vision definieren. Erforsche Koordinatenformate, reale Anwendungen und wie du Ultralytics YOLO26 verwendest.

Eine Bounding Box ist ein rechteckiger Bereich, der durch eine Reihe von Koordinaten definiert ist und ein bestimmtes Objekt innerhalb eines Bildes oder Videoframes umschließt. Im Bereich computer vision (CV) dienen diese Boxen als grundlegende Annotationen, um artificial intelligence (AI)-Systemen beizubringen, wie sie bestimmte Elemente lokalisieren und erkennen können. Anstatt ein ganzes Bild einfach als „enthält ein Auto“ zu klassifizieren, ermöglicht eine Bounding Box einem Modell, den genauen Ort und die räumliche Ausdehnung des Autos zu bestimmen und es vom Hintergrund sowie anderen Entitäten zu trennen. Diese Lokalisierungsfähigkeit ist für object detection-Aufgaben unerlässlich, bei denen das Ziel darin besteht, mehrere Objekte gleichzeitig mit hoher Präzision zu identifizieren.

Link to this sectionGrundlegende Konzepte und Koordinaten#

Um visuelle Daten effektiv zu verarbeiten, verlassen sich machine learning (ML)-Modelle auf spezifische Koordinatensysteme, um Bounding Boxes mathematisch darzustellen. Das gewählte Format bestimmt oft, wie Daten für das model training aufbereitet werden und wie das Modell seine Vorhersagen ausgibt.

XYXY Coordinates: Dieses Format definiert eine Box unter Verwendung der absoluten Pixelwerte der oberen linken Ecke und der unteren rechten Ecke. Es ist intuitiv für Visualisierungstools wie OpenCV oder Matplotlib, wenn Rechtecke direkt auf Bilder gezeichnet werden.
XYWH Format: Diese Methode ist in Datensätzen wie COCO verbreitet und spezifiziert den Mittelpunkt des Objekts gefolgt von der Breite und Höhe der Box. Diese Darstellung ist entscheidend für die Berechnung von loss functions während des Lernprozesses.
Normalized Coordinates: Um die scalability über Bilder verschiedener Auflösungen hinweg sicherzustellen, werden Koordinaten oft auf einen Bereich zwischen 0 und 1 skaliert. Dies hilft Modellen, besser zu generalisieren, wenn sie Eingaben mit unterschiedlichen Dimensionen analysieren.

Link to this sectionPraxisanwendungen#

Bounding Boxes sind die Bausteine für unzählige AI-Lösungen in verschiedenen Branchen. Durch die Ermöglichung präziser Lokalisierung erlauben sie Systemen, intelligent mit der physischen Welt zu interagieren.

Autonomous Vehicles: Selbstfahrende Autos nutzen Bounding Boxes, um Fußgänger, andere Fahrzeuge, Verkehrsschilder und Hindernisse in Echtzeit zu erkennen und zu verfolgen. Dieses räumliche Bewusstsein ist für Navigations- und Sicherheitssysteme entscheidend, um Entscheidungen in Sekundenbruchteilen zu treffen.
Retail Analytics: In Smart Stores helfen Bounding Boxes dabei, den Lagerbestand in Regalen zu überwachen und Interaktionen von Kunden mit Produkten zu verfolgen. Diese Daten können die Bestandsauffüllung automatisieren und Einblicke in das Verhalten der Käufer geben, ohne dass manuell gezählt werden muss.

Link to this sectionBounding Boxes im Einsatz#

Bei der Verwendung moderner Architekturen wie YOLO26 sagt das Modell Bounding Boxes zusammen mit einem Klassen-Label und einem confidence score voraus. Das folgende Beispiel demonstriert, wie du eine Inferenz auf einem Bild durchführst und mithilfe des ultralytics-Pakets auf die Bounding-Box-Koordinaten zugreifst.

from ultralytics import YOLO

# Load the YOLO26 model
model = YOLO("yolo26n.pt")

# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")

# Access bounding box coordinates (xyxy format) for the first detected object
boxes = results[0].boxes
print(boxes.xyxy[0])  # Output: tensor([x1, y1, x2, y2, ...])

Link to this sectionVerwandte Begriffe und Unterscheidung#

Während Bounding Boxes Standard für die allgemeine Erkennung sind, unterscheiden sie sich von anderen Annotationstypen, die für granularere Aufgaben verwendet werden.

Instance Segmentation: Im Gegensatz zu einer rechteckigen Bounding Box erstellt die Segmentierung eine pixelgenaue Maske, die den exakten Umriss eines Objekts nachzeichnet. Dies ist nützlich, wenn die präzise Form wichtiger ist als die allgemeine Position.
Oriented Bounding Box (OBB): Standard-Bounding Boxes sind achsen-ausgerichtet (aufrechte Rechtecke). OBBs können gedreht werden, um Objekte anzupassen, die angewinkelt sind, wie etwa Schiffe auf Satellitenbildern oder Pakete auf einem Förderband, wodurch sie eine engere Passform bieten und Hintergrundrauschen reduzieren.
Keypoints: Anstatt ein Objekt zu umschließen, identifizieren Keypoints spezifische Orientierungspunkte, wie etwa Gelenke an einem menschlichen Körper für die pose estimation.

Link to this sectionTools für Annotation und Verwaltung#

Das Erstellen hochwertiger Bounding-Box-Annotationen ist ein entscheidender Schritt in der ML-Pipeline. Die Ultralytics Platform vereinfacht diesen Prozess durch das Angebot von Tools für data annotation und Datensatzverwaltung. Eine korrekte Annotation stellt sicher, dass Modelle lernen, Objekte präzise zu unterscheiden, wodurch Fehler wie overfitting oder Hintergrundkonfusion minimiert werden. Fortschrittliche Techniken wie Non-Maximum Suppression (NMS) werden während der Inferenz verwendet, um diese Vorhersagen zu verfeinern, indem überlappende Boxen entfernt werden, wodurch sichergestellt wird, dass für jedes Objekt nur die genaueste Erkennung verbleibt.

Bounding Box

Link to this sectionGrundlegende Konzepte und Koordinaten#

Link to this sectionPraxisanwendungen#

Link to this sectionBounding Boxes im Einsatz#

Link to this sectionVerwandte Begriffe und Unterscheidung#

Link to this sectionTools für Annotation und Verwaltung#

Explore solutions

KI in der Robotik

KI in der Logistik

KI im Einzelhandel

KI im Gesundheitswesen

KI in der Fertigung

KI in der Automobilbranche

KI in der Landwirtschaft

KI in der Robotik

KI in der Logistik

KI im Einzelhandel

KI im Gesundheitswesen

KI in der Fertigung

KI in der Automobilbranche

KI in der Landwirtschaft

KI in der Robotik

KI in der Logistik

KI im Einzelhandel

KI im Gesundheitswesen

KI in der Fertigung

KI in der Automobilbranche

KI in der Landwirtschaft

Lass uns gemeinsam die Zukunft der KI bauen!