Изучите воплощенный искусственный интеллект и узнайте, как интеллектуальные системы взаимодействуют с физическим миром. Узнайте, как усилить восприятие роботов с помощью Ultralytics .
Воплощенный ИИ представляет собой серьезный сдвиг от пассивных алгоритмов к интеллектуальным системам, которые могут воспринимать, рассуждать и взаимодействовать в физической или симулированной 3D-среде. В отличие от традиционных моделей машинного обучения, которые работают исключительно на статических наборах данных, эти системы обладают «телом» — будь то физическое роботизированное шасси или виртуальный аватар — которое позволяет им выполнять действия и учиться на основе постоянной обратной связи с окружающей средой. Сочетая данные с датчиков с интеллектуальным принятием решений, воплощенные агенты устраняют разрыв между цифровыми вычислениями и реальным выполнением.
В основе этих динамических систем лежит передовое компьютерное зрение, которое позволяет агенту понимать свое окружение в пространстве. Для безопасной и эффективной навигации воплощенные агенты в значительной степени полагаются на обнаружение объектов в реальном времени и непрерывную оценку положения. Когда разработчики создают нейронные пути для этих агентов, они часто интегрируют фреймворки глубокого обучения из PyTorch или инструментыTensorFlow для обработки сложных пространственных данных.
Для достижения истинной автономности эти системы все чаще используют модели «зрение-язык» в сочетании с надежными механизмами вывода в реальном времени. Это позволяет ИИ не только распознавать чашку, но и понимать сложные инструкции, такие как «возьми красную чашку у края стола ». Исследования таких учреждений, как Стэнфордский институт человекоцентрированного искусственного интеллекта (HAI) продолжают расширять границы интеграции мультисенсорных данных этими агентами.
Чтобы понять эту область, необходимо отличать ее от близких по значению понятий:
Интеграция когнитивного мышления с физическими действиями привела к появлению трансформационных приложений в различных отраслях промышленности, что подробно описано в цифровой библиотеке ACM по исследованиям в области искусственного интеллекта.
Разработчики, создающие эти физические системы, часто используют Ultralytics для аннотирования динамических учебных данных и беспроблемного развертывания легких передовых моделей искусственного интеллекта непосредственно на аппаратном обеспечении с низким энергопотреблением.
Ниже приведен Python , демонстрирующий, как робот-агент может использовать модель зрения для непрерывного detect объектов в своем окружении.
from ultralytics import YOLO
# Load the lightweight YOLO26 model designed for real-time edge hardware
model = YOLO("yolo26n.pt")
# Perform continuous object detection on a robotic camera feed
results = model.predict(source="camera_feed.mp4", stream=True)
# Process the spatial bounding boxes to guide robotic interaction
for r in results:
print(f"Detected {len(r.boxes)} objects ready for physical interaction.")
По мере развития областей проектирования аппаратного обеспечения и когнитивного моделирования — под руководством таких инициатив, как исследованияAnthropic в области безопасности ИИ и последние модели рассуждений OpenAI— воплощенные системы будут продолжать переходить из исследовательских лабораторий в повседневную среду, как часто подчеркивается в репортажах IEEE Spectrum о робототехнике.