Triff YOLO26: Vision-KI der nächsten Generation.
Ultralytics
Zurück zum Ultralytics Glossar

Spatial Intelligence

Erforsche, wie räumliche Intelligenz es der KI ermöglicht, die 3D-Welt wahrzunehmen und darin zu navigieren. Lerne, räumlich bewusste Systeme mit Ultralytics YOLO26 und der Ultralytics Platform zu bauen.

Räumliche Intelligenz bezeichnet die Fähigkeit eines KI-Systems, die physische Welt in drei Dimensionen wahrzunehmen, zu verstehen und sich darin zu bewegen. Im Gegensatz zur klassischen Computer Vision, die oft 2D-Bilder als statische Momentaufnahmen analysiert, beinhaltet räumliche Intelligenz das Denken über Tiefe, Geometrie, Bewegung und die Beziehungen zwischen Objekten in einer dynamischen Umgebung. Sie befähigt Maschinen nicht nur dazu, Pixel zu "sehen", sondern den physischen Kontext einer Szene zu erfassen, sodass sie effektiver mit der realen Welt interagieren können. Diese Fähigkeit ist das Bindeglied zwischen digitalen visuellen Daten und physischer Aktion und dient als Grundstein für fortschrittliche AI agents und Robotersysteme.

Link to this sectionDie Kernkomponenten räumlicher Intelligenz#

Um ein menschenähnliches Verständnis des Raums zu erlangen, greift ein KI-System auf mehrere miteinander verknüpfte Technologien und Konzepte zurück.

  • Tiefenwahrnehmung und 3D-Rekonstruktion: Systeme müssen 2D-Eingaben von Kameras in 3D-Darstellungen umwandeln. Techniken wie monocular depth estimation ermöglichen es Modellen, die Entfernung aus einem einzelnen Bild vorherzusagen, während 3D object detection dabei hilft, das Volumen und die Ausrichtung von Objekten innerhalb dieses Raums zu identifizieren.
  • SLAM (Simultaneous Localization and Mapping): Dies ermöglicht es einem Gerät, wie etwa einem Roboter oder einer Drohne, eine unbekannte Umgebung zu kartieren und gleichzeitig den eigenen Standort darin zu verfolgen. Moderne Ansätze integrieren oft visual SLAM mit Deep Learning, um die Robustheit bei wechselnden Lichtverhältnissen zu verbessern.
  • Geometrisches Denken: Über die reine Erkennung hinaus muss das System physikalische Beschränkungen verstehen – etwa, dass eine Tasse auf einem Tisch steht oder eine Tür geöffnet werden muss, um hindurchzugehen. Dies beinhaltet oft pose estimation, um die Ausrichtung von Objekten oder menschlichen Gelenken in Echtzeit zu verfolgen.
  • Embodied AI: Dieses Konzept verknüpft Wahrnehmung mit Handeln. Ein verkörperter Agent beobachtet nicht nur; er nutzt räumliche Daten, um Bewegungen zu planen, Hindernissen auszuweichen und Objekte zu manipulieren, ähnlich wie AI in robotics in einer Fertigungshalle funktioniert.

Link to this sectionPraxisanwendungen#

Räumliche Intelligenz transformiert Branchen, indem sie es Maschinen ermöglicht, autonom in komplexen Umgebungen zu agieren.

  • Autonomous Robotics and Logistics: In warehousing, robots use spatial intelligence to navigate crowded aisles, identify specific packages using object detection, and place them precisely onto conveyors. They must calculate the spatial relationship between their gripper and the box to ensure a secure hold without crushing the item.
  • Augmented Reality (AR) und Mixed Reality: Geräte wie Smart Glasses nutzen Spatial Computing, um digitale Inhalte mit der physischen Welt zu verankern. Eine AR-Wartungs-App könnte beispielsweise Reparaturanleitungen direkt über ein bestimmtes Motorteil legen. Dies erfordert eine präzise object tracking, um sicherzustellen, dass die Grafiken ausgerichtet bleiben, während der Benutzer seinen Kopf bewegt.

Link to this sectionRäumliche Intelligenz vs. Computer Vision#

Obwohl eng verwandt, ist es hilfreich, zwischen spatial intelligence vs. computer vision zu unterscheiden. Computer Vision ist das breitere Feld, das sich darauf konzentriert, aussagekräftige Informationen aus digitalen Bildern, Videos und anderen visuellen Eingaben zu gewinnen. Es umfasst Aufgaben wie Klassifizierung oder grundlegende 2D-Erkennung. Räumliche Intelligenz ist eine spezialisierte Teilmenge oder Weiterentwicklung der Computer Vision, die spezifisch die Dimension des Raums und der Physik hinzufügt. Sie bewegt sich von der Frage "Was ist dieses Objekt?" (Vision) hin zu "Wo ist dieses Objekt, wie ist es ausgerichtet und wie kann ich damit interagieren?" (räumliche Intelligenz).

Link to this sectionImplementierung von räumlichem Bewusstsein mit Ultralytics#

Entwickler können die Grundlage für Systeme mit räumlicher Intelligenz mithilfe der Ultralytics Platform aufbauen. Durch das Training von Modellen wie Ultralytics YOLO26 für Aufgaben wie Oriented Bounding Box (OBB)-Erkennung oder Pose Estimation können Ingenieure die notwendigen geometrischen Daten für nachgelagerte Robotik- oder AR-Anwendungen bereitstellen.

Hier ist ein einfaches Beispiel für die Extraktion räumlicher Keypoints mithilfe eines Pose-Estimation-Modells, was ein entscheidender Schritt zum Verständnis menschlicher Bewegungen innerhalb eines 3D-Raums ist:

from ultralytics import YOLO

# Load a pre-trained YOLO26 pose estimation model
model = YOLO("yolo26n-pose.pt")

# Run inference on an image to detect human keypoints
results = model("path/to/image.jpg")

# Access the keypoints (x, y coordinates and confidence)
for result in results:
    # keypoints.xy returns a tensor of shape (N, 17, 2)
    keypoints = result.keypoints.xy
    print(f"Detected keypoints for {len(keypoints)} persons.")

Aktuelle Fortschritte bei Vision Transformers (ViT) und foundation models beschleunigen dieses Feld weiter und ermöglichen es Systemen, räumliches Verständnis auf verschiedene Umgebungen zu übertragen, ohne dass ein umfangreiches Nachtraining erforderlich ist. Da die Forschung von Gruppen wie Stanford's HAI und Google DeepMind weiter voranschreitet, können wir erwarten, dass räumliche Intelligenz zu einem Standardmerkmal in der nächsten Generation von Smart Devices wird.

Explore solutions

Real-time AI that works with your team

KI in der Robotik

Stärke intelligentere Maschinen mit Ultralytics YOLO Modellen. Vision AI in der Robotik treibt autonome Navigation, Wahrnehmung, Objektverfolgung und Echtzeitsteuerung voran.
Erfahre mehr
Real-time AI that works with your team

KI in der Logistik

Optimiere die Logistik mit Ultralytics YOLO-Modellen. Vision AI ermöglicht Paketkontrolle, Sortierung, Fahrzeugverfolgung und Echtzeit-Überwachung der Lagersicherheit.
Erfahre mehr
Real-time AI that works with your team

KI im Einzelhandel

Erfinde den Einzelhandel neu mit Ultralytics YOLO-Modellen. Vision AI fördert Bestandsverfolgung, Regalüberwachung, Warteschlangenmanagement und intelligentere Kundeneinblicke.
Erfahre mehr
Real-time AI that works with your team

KI im Gesundheitswesen

Baue Gesundheitslösungen mit Ultralytics YOLO Modellen. Vision AI im Gesundheitswesen ermöglicht schnellere medizinische Bildgebung, intelligentere Diagnostik und Patientenüberwachung.
Erfahre mehr
Real-time AI that works with your team

KI in der Fertigung

Optimiere die Fertigung mit Ultralytics YOLO-Modellen. Vision AI treibt Qualitätskontrolle, Fehlererkennung, PSA-Einhaltung und die Automatisierung von Montagelinien voran.
Erfahre mehr
Real-time AI that works with your operation

KI in der Automobilbranche

Nutze Computer Vision in der Automobilindustrie mit Ultralytics YOLO Modellen. Vision AI steigert die Verkehrssicherheit, Fahrerassistenz und Fahrzeugautomatisierung für intelligentere Straßen.
Erfahre mehr
Real-time AI tailored to your operation

KI in der Landwirtschaft

Bringe Vision AI mit Ultralytics YOLO Modellen in die smarte Landwirtschaft. Optimiere die Ernteüberwachung, Viehverfolgung und Präzisionslandwirtschaft für höhere, intelligentere Erträge.
Erfahre mehr
Real-time AI that works with your team

KI in der Robotik

Stärke intelligentere Maschinen mit Ultralytics YOLO Modellen. Vision AI in der Robotik treibt autonome Navigation, Wahrnehmung, Objektverfolgung und Echtzeitsteuerung voran.
Erfahre mehr
Real-time AI that works with your team

KI in der Logistik

Optimiere die Logistik mit Ultralytics YOLO-Modellen. Vision AI ermöglicht Paketkontrolle, Sortierung, Fahrzeugverfolgung und Echtzeit-Überwachung der Lagersicherheit.
Erfahre mehr
Real-time AI that works with your team

KI im Einzelhandel

Erfinde den Einzelhandel neu mit Ultralytics YOLO-Modellen. Vision AI fördert Bestandsverfolgung, Regalüberwachung, Warteschlangenmanagement und intelligentere Kundeneinblicke.
Erfahre mehr
Real-time AI that works with your team

KI im Gesundheitswesen

Baue Gesundheitslösungen mit Ultralytics YOLO Modellen. Vision AI im Gesundheitswesen ermöglicht schnellere medizinische Bildgebung, intelligentere Diagnostik und Patientenüberwachung.
Erfahre mehr
Real-time AI that works with your team

KI in der Fertigung

Optimiere die Fertigung mit Ultralytics YOLO-Modellen. Vision AI treibt Qualitätskontrolle, Fehlererkennung, PSA-Einhaltung und die Automatisierung von Montagelinien voran.
Erfahre mehr
Real-time AI that works with your operation

KI in der Automobilbranche

Nutze Computer Vision in der Automobilindustrie mit Ultralytics YOLO Modellen. Vision AI steigert die Verkehrssicherheit, Fahrerassistenz und Fahrzeugautomatisierung für intelligentere Straßen.
Erfahre mehr
Real-time AI tailored to your operation

KI in der Landwirtschaft

Bringe Vision AI mit Ultralytics YOLO Modellen in die smarte Landwirtschaft. Optimiere die Ernteüberwachung, Viehverfolgung und Präzisionslandwirtschaft für höhere, intelligentere Erträge.
Erfahre mehr
Real-time AI that works with your team

KI in der Robotik

Stärke intelligentere Maschinen mit Ultralytics YOLO Modellen. Vision AI in der Robotik treibt autonome Navigation, Wahrnehmung, Objektverfolgung und Echtzeitsteuerung voran.
Erfahre mehr
Real-time AI that works with your team

KI in der Logistik

Optimiere die Logistik mit Ultralytics YOLO-Modellen. Vision AI ermöglicht Paketkontrolle, Sortierung, Fahrzeugverfolgung und Echtzeit-Überwachung der Lagersicherheit.
Erfahre mehr
Real-time AI that works with your team

KI im Einzelhandel

Erfinde den Einzelhandel neu mit Ultralytics YOLO-Modellen. Vision AI fördert Bestandsverfolgung, Regalüberwachung, Warteschlangenmanagement und intelligentere Kundeneinblicke.
Erfahre mehr
Real-time AI that works with your team

KI im Gesundheitswesen

Baue Gesundheitslösungen mit Ultralytics YOLO Modellen. Vision AI im Gesundheitswesen ermöglicht schnellere medizinische Bildgebung, intelligentere Diagnostik und Patientenüberwachung.
Erfahre mehr
Real-time AI that works with your team

KI in der Fertigung

Optimiere die Fertigung mit Ultralytics YOLO-Modellen. Vision AI treibt Qualitätskontrolle, Fehlererkennung, PSA-Einhaltung und die Automatisierung von Montagelinien voran.
Erfahre mehr
Real-time AI that works with your operation

KI in der Automobilbranche

Nutze Computer Vision in der Automobilindustrie mit Ultralytics YOLO Modellen. Vision AI steigert die Verkehrssicherheit, Fahrerassistenz und Fahrzeugautomatisierung für intelligentere Straßen.
Erfahre mehr
Real-time AI tailored to your operation

KI in der Landwirtschaft

Bringe Vision AI mit Ultralytics YOLO Modellen in die smarte Landwirtschaft. Optimiere die Ernteüberwachung, Viehverfolgung und Präzisionslandwirtschaft für höhere, intelligentere Erträge.
Erfahre mehr

Lass uns gemeinsam die Zukunft der KI bauen!

Beginne deine Reise mit der Zukunft des maschinellen Lernens