Glossar

Verkörperte KI

Entdecken Sie Embodied AI und erfahren Sie, wie intelligente Systeme mit der physischen Welt interagieren. Erfahren Sie, wie Sie mit Ultralytics die Wahrnehmung von Robotern verbessern können.

Embodied AI stellt einen bedeutenden Wandel von passiven Algorithmen hin zu intelligenten Systemen dar, die in einer physischen oder simulierten 3D-Umgebung wahrnehmen, denken und interagieren können. Im Gegensatz zu herkömmlichen Modellen des maschinellen Lernens, die ausschließlich auf statischen Datensätzen basieren, verfügen diese Systeme über einen „Körper“ – sei es ein physisches Roboterchassis oder ein virtueller Avatar –, der es ihnen ermöglicht, Aktionen auszuführen und aus kontinuierlichem Feedback der Umgebung zu lernen. Durch die Kombination von Sensoreingaben mit intelligenter Entscheidungsfindung schließen verkörperte Agenten die Lücke zwischen digitaler Berechnung und realer Ausführung.

Wie verkörperte Systeme die Welt wahrnehmen

Das Herzstück dieser dynamischen Systeme ist fortschrittliche Computervision, die es dem Agenten ermöglicht, seine Umgebung räumlich zu erfassen. Um sicher und effektiv zu navigieren, sind verkörperte Agenten in hohem Maße auf Echtzeit-Objekterkennung und kontinuierliche Posenabschätzung angewiesen. Wenn Entwickler die neuronalen Pfade für diese Agenten aufbauen, integrieren sie häufig Deep-Learning-Frameworks aus dem PyTorch oder TensorFlow , um komplexe räumliche Daten zu verarbeiten.

Um echte Autonomie zu erreichen, nutzen diese Systeme zunehmend Vision-Sprach-Modelle in Verbindung mit robusten Echtzeit-Inferenzmaschinen. Dadurch kann die KI nicht nur eine Tasse erkennen, sondern auch komplexe Anweisungen wie „Nimm die rote Tasse am Rand des Tisches“ verstehen. Forschungen von Institutionen wie dem Stanford Institute for Human-Centered Artificial Intelligence (HAI) erweitern weiterhin die Grenzen der Integration multisensorischer Daten durch diese Agenten.

Unterscheidung verwandter Begriffe aus dem Bereich der künstlichen Intelligenz

Um dieses Gebiet zu verstehen, muss man es von eng verwandten Konzepten unterscheiden:

Robotik: Die Robotik konzentriert sich stark auf die mechanische Hardware, Aktuatoren und Motorsteuerung. Verkörperte KI bietet die kognitive Softwareebene, die die Hardware autonom macht, wie in Projekten wie dem Atlas-Roboter von Boston Dynamics zu sehen ist.
Physikalische KI: Obwohl die Begriffe oft synonym verwendet werden, erfordert physikalische KI zwingend greifbare, reale Hardware. Verkörperte KI ist weiter gefasst und umfasst virtuelle Agenten, die in simulierten 3D-Physikumgebungen wie der Isaac-RobotikplattformNVIDIA trainiert werden.
KI-Agent: Herkömmliche KI-Agenten arbeiten in digitalen Räumen (z. B. beim Surfen im Internet oder beim Schreiben von Code). Verkörperte Agenten sind spezialisiert auf die Verarbeitung räumlicher Dimensionen, physikalischer Einschränkungen und kontinuierlicher Sinnesströme.

Anwendungsfälle in der Praxis

Die Integration von kognitivem Denken und physischer Handlung hat zu transformativen Anwendungen in verschiedenen Branchen geführt, die in der digitalen Bibliothek für KI-Forschung der ACM ausführlich dokumentiert sind.

Autonome Fahrzeuge: Selbstfahrende Autos sind auf eingebettete Intelligenz angewiesen, um sich in den Straßen der Stadt zurechtzufinden. Sie verarbeiten kontinuierlich Lidar- und Kameradaten, um Verkehrszeichen und Fußgängerbewegungen zu interpretieren, ähnlich wie die autonome Fahrtechnologie von Waymo, die sicher mit dynamischen städtischen Umgebungen interagiert.
Intelligente Fertigung: Roboterarme, die mit Ultralytics ausgestattet sind, führen komplexe Aufgaben in der Fertigungsstraße aus . Sie identifizieren, greifen und sortieren fehlerhafte Teile dynamisch und demonstrieren damit Prinzipien, die in der aktuellen DeepMind-Robotikforschung erforscht wurden.
Landwirtschaftliche Drohnen: Unbemannte Luftfahrzeuge nutzen räumliches Bewusstsein, um den Zustand von Nutzpflanzen zu überwachen und Ressourcen intelligent nur dort auszubringen, wo sie benötigt werden, wodurch Verschwendung reduziert und der Ertrag gesteigert wird.

Wahrnehmung für verkörperte Agenten aufbauen

Entwickler, die diese physischen Systeme aufbauen, nutzen häufig die Ultralytics , um dynamische Trainingsdaten zu annotieren und leichtgewichtige Edge-KI-Modelle nahtlos direkt auf energiesparender Hardware zu implementieren.

Nachstehend finden Sie ein Python , das veranschaulicht, wie ein Roboteragent ein Bildverarbeitungsmodell einsetzen könnte, um detect Objekte in seiner Umgebung kontinuierlich detect .

from ultralytics import YOLO

# Load the lightweight YOLO26 model designed for real-time edge hardware
model = YOLO("yolo26n.pt")

# Perform continuous object detection on a robotic camera feed
results = model.predict(source="camera_feed.mp4", stream=True)

# Process the spatial bounding boxes to guide robotic interaction
for r in results:
    print(f"Detected {len(r.boxes)} objects ready for physical interaction.")

Mit der Weiterentwicklung der Bereiche Hardware-Design und kognitive Modellierung – geleitet von Angleichungsbemühungen wie Anthropic Forschung zur KI-Sicherheit und den neuesten Schlussfolgerungsmodellen von OpenAI– werden verkörperte Systeme weiterhin den Übergang vom Forschungslabor in den Alltag vollziehen, wie häufig in der Robotikberichterstattung von IEEE Spectrum hervorgehoben wird.

Verkörperte KI

Exportieren Sie in über 17 Formate. Stellen Sie Ihre Inhalte in 43 Regionen weltweit bereit.

Trainieren Sie YOLO26 auf H100-GPUs für 2,39 $ pro Stunde.

Flexible Unternehmenslizenzen zur Umsetzung Ihrer Vision-AI-Projekte.

Unternehmenslizenzen, die Ihr nächstes Projekt voranbringen

Bis zu 10-mal schneller beschriften dank intelligenter Beschriftung

Annotieren. Trainieren. Bereitstellen. Alles auf einer Plattform.

Wie verkörperte Systeme die Welt wahrnehmen

Unterscheidung verwandter Begriffe aus dem Bereich der künstlichen Intelligenz

Anwendungsfälle in der Praxis

Wahrnehmung für verkörperte Agenten aufbauen

Mehr in dieser Kategorie lesen

Die wichtigsten Highlights von Ultralytics der Hannover Messe 2026 in Deutschland

Die Wahl zwischen PyTorch TensorFlow Computer-Vision-Projekte

Ein Vergleich zwischen überwachtem und unüberwachtem Lernen in der Bildverarbeitung

Lassen Sie uns gemeinsam die Zukunft der KI gestalten!

Verkörperte KI

Exportieren Sie in über 17 Formate. Stellen Sie Ihre Inhalte in 43 Regionen weltweit bereit.

Trainieren Sie YOLO26 auf H100-GPUs für 2,39 $ pro Stunde.

Flexible Unternehmenslizenzen zur Umsetzung Ihrer Vision-AI-Projekte.

Unternehmenslizenzen, die Ihr nächstes Projekt voranbringen

Bis zu 10-mal schneller beschriften dank intelligenter Beschriftung

Annotieren. Trainieren. Bereitstellen. Alles auf einer Plattform.

Wie verkörperte Systeme die Welt wahrnehmen

Unterscheidung verwandter Begriffe aus dem Bereich der künstlichen Intelligenz

Anwendungsfälle in der Praxis

Wahrnehmung für verkörperte Agenten aufbauen

Mehr in dieser Kategorie lesen

Die wichtigsten Highlights von Ultralytics der Hannover Messe 2026 in Deutschland

Die Wahl zwischen PyTorch TensorFlow Computer-Vision-Projekte

Ein Vergleich zwischen überwachtem und unüberwachtem Lernen in der Bildverarbeitung

Lassen Sie uns gemeinsam die Zukunft der KI gestalten!

Annotieren. Trainieren. Bereitstellen. Alles auf einer Plattform.