Triff YOLO26: Vision-KI der nächsten Generation.
Ultralytics
Zurück zum Ultralytics Glossar

3D Object Detection

Erkunde die 3D-Objekterkennung, um räumliches Verständnis in der KI zu meistern. Lerne, wie Ultralytics YOLO26 Tiefe, Orientierung und 3D-BBox-Schätzungen in der realen Welt ermöglicht.

Die 3D-Objekterkennung ist eine anspruchsvolle Aufgabe der Computer Vision, die es Maschinen ermöglicht, Objekte in einem dreidimensionalen Raum zu identifizieren, zu lokalisieren und deren Größe zu bestimmen. Im Gegensatz zur herkömmlichen 2D-Objekterkennung, die einen flachen Begrenzungsrahmen um ein Element in einem Bild zieht, schätzt die 3D-Objekterkennung einen Quader (eine 3D-Box), der das Objekt umschließt. Dies liefert entscheidende Tiefeninformationen, die Ausrichtung (Heading) und präzise räumliche Abmessungen, wodurch Systeme nicht nur verstehen, was ein Objekt ist, sondern auch, wo es sich relativ zum Sensor in der realen Welt befindet. Diese Fähigkeit ist grundlegend für Technologien, die physisch mit ihrer Umgebung interagieren müssen.

Link to this sectionWie 3D-Objekterkennung funktioniert#

Um Tiefe und Volumen wahrzunehmen, stützen sich 3D-Erkennungsmodelle in der Regel auf reichhaltigere Dateneingaben, als dies bei Standardkameras der Fall ist. Während einige fortgeschrittene Methoden 3D-Strukturen aus monokularen (Ein-Objektiv-) Bildern ableiten können, nutzen die meisten robusten Systeme Daten von LiDAR-Sensoren, Radar oder Stereokameras. Diese Sensoren erzeugen Punktwolken – massive Ansammlungen von Datenpunkten, die die äußere Oberfläche von Objekten darstellen.

Der Prozess umfasst mehrere wichtige Schritte:

  • Datenerfassung: Sensoren erfassen die Geometrie der Szene. LiDAR verwendet beispielsweise Laserpulse, um Entfernungen zu messen und eine präzise 3D-Karte zu erstellen.
  • Merkmalsextraktion: Deep-Learning-Modelle, die oft auf Convolutional Neural Networks (CNNs) oder Transformern basieren, verarbeiten die Punktwolken- oder fusionierten Bilddaten, um Muster zu erkennen.
  • Vorhersage des Begrenzungsrahmens: Das Modell gibt eine 3D-Box aus, die durch ihre Mittelpunktskoordinaten (x, y, z), Abmessungen (Länge, Breite, Höhe) und den Rotationswinkel (Gierwinkel/Yaw) definiert ist.
  • Klassifizierung: Ähnlich wie bei der Bildklassifizierung weist das System dem erkannten Objekt eine Bezeichnung zu (z. B. „Fußgänger“, „Fahrzeug“).

Link to this sectionUnterschied zwischen 2D- und 3D-Erkennung#

Es ist wichtig, zwischen diesen beiden verwandten Konzepten zu unterscheiden.

  • 2D-Objekterkennung: Arbeitet auf flachen Bildern (Pixeln). Sie sagt dir, dass sich ein Objekt „oben links“ oder „unten rechts“ in einem Bild befindet, kann aber ohne Referenzmarkierungen weder die Entfernung noch die reale Größe effektiv beurteilen. Sie ist ideal für Aufgaben wie die Identifizierung von Fertigungsfehlern oder die Analyse von Video-Feeds, bei denen die Tiefe weniger kritisch ist.
  • 3D-Objekterkennung: Arbeitet im volumetrischen Raum (Voxel oder Punkte). Sie liefert die Entfernung von der Kamera (Tiefe), die physische Größe des Objekts und dessen Ausrichtung. Dies ist unerlässlich, um Kollisionen in dynamischen Umgebungen zu vermeiden.

Link to this sectionPraxisanwendungen#

Der Übergang von der 2D- zur 3D-Wahrnehmung erschließt leistungsstarke Anwendungsfälle in Branchen, in denen Sicherheit und räumliches Bewusstsein von größter Bedeutung sind.

  • Autonomes Fahren: Selbstfahrende Autos verlassen sich stark auf 3D-Erkennung, um sicher zu navigieren. Durch die Verarbeitung von Daten von LiDAR und Kameras kann das Fahrzeug andere Autos, Fußgänger und Hindernisse erkennen und deren genaue Entfernung und Geschwindigkeit berechnen. Dies ermöglicht es dem Wahrnehmungssystem, Trajektorien vorherzusagen und Entscheidungen zum Bremsen oder Lenken in Echtzeit-Inferenz-Szenarien zu treffen. Unternehmen wie Waymo nutzen diese umfangreichen Sensor-Suites, um städtische Umgebungen sofort zu kartieren.
  • Robotik und Behälterkommissionierung (Bin Picking): In der Logistik und Lagerhaltung müssen Roboter Objekte unterschiedlicher Form und Größe aus Behältern greifen. Die 3D-Erkennung ermöglicht es einem Roboterarm, die Ausrichtung eines Pakets zu verstehen, den besten Greifpunkt zu bestimmen und einen kollisionsfreien Pfad zu planen, um das Teil zu bewegen. Dies steigert die Effizienz von KI in der Logistik, indem komplexe manuelle Aufgaben automatisiert werden.

Link to this sectionImplementierung der Objekterkennung mit Ultralytics#

Während eine vollständige 3D-Erkennung oft spezialisierte Punktwolken-Architekturen erfordert, werden moderne 2D-Detektoren wie YOLO26 zunehmend als Komponente in Pseudo-3D-Workflows oder zur Tiefenschätzung durch Skalierung von Begrenzungsrahmen eingesetzt. Für Entwickler, die Modelle auf eigenen Datensätzen trainieren möchten, bietet die Ultralytics Platform eine optimierte Umgebung für Annotation und Training.

Hier ist ein einfaches Beispiel dafür, wie du eine Standarderkennung mit der Ultralytics Python API durchführst, was oft der erste Schritt in einer größeren Wahrnehmungspipeline ist:

import cv2
from ultralytics import YOLO

# Load the YOLO26n model (nano version for speed)
model = YOLO("yolo26n.pt")

# Perform inference on a local image
results = model("path/to/image.jpg")

# Visualize the results
for result in results:
    # Plot predictions on the image (returns a numpy array)
    im_array = result.plot()

    # Display using OpenCV
    cv2.imshow("Detections", im_array)
    cv2.waitKey(0)  # Press any key to close
    cv2.destroyAllWindows()

Trotz ihres Nutzens steht die 3D-Objekterkennung vor Herausforderungen hinsichtlich der Rechenkosten und der Sensorkosten. Die Verarbeitung von Millionen von Punkten in einer Punktwolke erfordert erhebliche GPU-Leistung, was den Einsatz auf Edge-Geräten erschwert. Innovationen bei der Modellquantisierung und effiziente neuronale Architekturen reduzieren diese Belastung jedoch.

Darüber hinaus verbessern Techniken wie die Sensorfusion die Genauigkeit, indem sie die reichhaltigen Farbinformationen von Kameras mit den präzisen Tiefendaten von LiDAR kombinieren. Mit der Reifung dieser Technologien können wir davon ausgehen, dass die 3D-Wahrnehmung in immer zugänglichere Geräte integriert wird, von Augmented-Reality-Brillen bis hin zu Smart-Home-Geräten.

Explore solutions

Real-time AI that works with your team

KI in der Robotik

Stärke intelligentere Maschinen mit Ultralytics YOLO Modellen. Vision AI in der Robotik treibt autonome Navigation, Wahrnehmung, Objektverfolgung und Echtzeitsteuerung voran.
Erfahre mehr
Real-time AI that works with your team

KI in der Logistik

Optimiere die Logistik mit Ultralytics YOLO-Modellen. Vision AI ermöglicht Paketkontrolle, Sortierung, Fahrzeugverfolgung und Echtzeit-Überwachung der Lagersicherheit.
Erfahre mehr
Real-time AI that works with your team

KI im Einzelhandel

Erfinde den Einzelhandel neu mit Ultralytics YOLO-Modellen. Vision AI fördert Bestandsverfolgung, Regalüberwachung, Warteschlangenmanagement und intelligentere Kundeneinblicke.
Erfahre mehr
Real-time AI that works with your team

KI im Gesundheitswesen

Baue Gesundheitslösungen mit Ultralytics YOLO Modellen. Vision AI im Gesundheitswesen ermöglicht schnellere medizinische Bildgebung, intelligentere Diagnostik und Patientenüberwachung.
Erfahre mehr
Real-time AI that works with your team

KI in der Fertigung

Optimiere die Fertigung mit Ultralytics YOLO-Modellen. Vision AI treibt Qualitätskontrolle, Fehlererkennung, PSA-Einhaltung und die Automatisierung von Montagelinien voran.
Erfahre mehr
Real-time AI that works with your operation

KI in der Automobilbranche

Nutze Computer Vision in der Automobilindustrie mit Ultralytics YOLO Modellen. Vision AI steigert die Verkehrssicherheit, Fahrerassistenz und Fahrzeugautomatisierung für intelligentere Straßen.
Erfahre mehr
Real-time AI tailored to your operation

KI in der Landwirtschaft

Bringe Vision AI mit Ultralytics YOLO Modellen in die smarte Landwirtschaft. Optimiere die Ernteüberwachung, Viehverfolgung und Präzisionslandwirtschaft für höhere, intelligentere Erträge.
Erfahre mehr
Real-time AI that works with your team

KI in der Robotik

Stärke intelligentere Maschinen mit Ultralytics YOLO Modellen. Vision AI in der Robotik treibt autonome Navigation, Wahrnehmung, Objektverfolgung und Echtzeitsteuerung voran.
Erfahre mehr
Real-time AI that works with your team

KI in der Logistik

Optimiere die Logistik mit Ultralytics YOLO-Modellen. Vision AI ermöglicht Paketkontrolle, Sortierung, Fahrzeugverfolgung und Echtzeit-Überwachung der Lagersicherheit.
Erfahre mehr
Real-time AI that works with your team

KI im Einzelhandel

Erfinde den Einzelhandel neu mit Ultralytics YOLO-Modellen. Vision AI fördert Bestandsverfolgung, Regalüberwachung, Warteschlangenmanagement und intelligentere Kundeneinblicke.
Erfahre mehr
Real-time AI that works with your team

KI im Gesundheitswesen

Baue Gesundheitslösungen mit Ultralytics YOLO Modellen. Vision AI im Gesundheitswesen ermöglicht schnellere medizinische Bildgebung, intelligentere Diagnostik und Patientenüberwachung.
Erfahre mehr
Real-time AI that works with your team

KI in der Fertigung

Optimiere die Fertigung mit Ultralytics YOLO-Modellen. Vision AI treibt Qualitätskontrolle, Fehlererkennung, PSA-Einhaltung und die Automatisierung von Montagelinien voran.
Erfahre mehr
Real-time AI that works with your operation

KI in der Automobilbranche

Nutze Computer Vision in der Automobilindustrie mit Ultralytics YOLO Modellen. Vision AI steigert die Verkehrssicherheit, Fahrerassistenz und Fahrzeugautomatisierung für intelligentere Straßen.
Erfahre mehr
Real-time AI tailored to your operation

KI in der Landwirtschaft

Bringe Vision AI mit Ultralytics YOLO Modellen in die smarte Landwirtschaft. Optimiere die Ernteüberwachung, Viehverfolgung und Präzisionslandwirtschaft für höhere, intelligentere Erträge.
Erfahre mehr
Real-time AI that works with your team

KI in der Robotik

Stärke intelligentere Maschinen mit Ultralytics YOLO Modellen. Vision AI in der Robotik treibt autonome Navigation, Wahrnehmung, Objektverfolgung und Echtzeitsteuerung voran.
Erfahre mehr
Real-time AI that works with your team

KI in der Logistik

Optimiere die Logistik mit Ultralytics YOLO-Modellen. Vision AI ermöglicht Paketkontrolle, Sortierung, Fahrzeugverfolgung und Echtzeit-Überwachung der Lagersicherheit.
Erfahre mehr
Real-time AI that works with your team

KI im Einzelhandel

Erfinde den Einzelhandel neu mit Ultralytics YOLO-Modellen. Vision AI fördert Bestandsverfolgung, Regalüberwachung, Warteschlangenmanagement und intelligentere Kundeneinblicke.
Erfahre mehr
Real-time AI that works with your team

KI im Gesundheitswesen

Baue Gesundheitslösungen mit Ultralytics YOLO Modellen. Vision AI im Gesundheitswesen ermöglicht schnellere medizinische Bildgebung, intelligentere Diagnostik und Patientenüberwachung.
Erfahre mehr
Real-time AI that works with your team

KI in der Fertigung

Optimiere die Fertigung mit Ultralytics YOLO-Modellen. Vision AI treibt Qualitätskontrolle, Fehlererkennung, PSA-Einhaltung und die Automatisierung von Montagelinien voran.
Erfahre mehr
Real-time AI that works with your operation

KI in der Automobilbranche

Nutze Computer Vision in der Automobilindustrie mit Ultralytics YOLO Modellen. Vision AI steigert die Verkehrssicherheit, Fahrerassistenz und Fahrzeugautomatisierung für intelligentere Straßen.
Erfahre mehr
Real-time AI tailored to your operation

KI in der Landwirtschaft

Bringe Vision AI mit Ultralytics YOLO Modellen in die smarte Landwirtschaft. Optimiere die Ernteüberwachung, Viehverfolgung und Präzisionslandwirtschaft für höhere, intelligentere Erträge.
Erfahre mehr

Lass uns gemeinsam die Zukunft der KI bauen!

Beginne deine Reise mit der Zukunft des maschinellen Lernens