Yolo Vision Shenzhen
Шэньчжэнь
Присоединиться сейчас
Глоссарий

Воплощенный ИИ

Изучите воплощенный искусственный интеллект и узнайте, как интеллектуальные системы взаимодействуют с физическим миром. Узнайте, как усилить восприятие роботов с помощью Ultralytics .

Воплощенный ИИ представляет собой серьезный сдвиг от пассивных алгоритмов к интеллектуальным системам, которые могут воспринимать, рассуждать и взаимодействовать в физической или симулированной 3D-среде. В отличие от традиционных моделей машинного обучения, которые работают исключительно на статических наборах данных, эти системы обладают «телом» — будь то физическое роботизированное шасси или виртуальный аватар — которое позволяет им выполнять действия и учиться на основе постоянной обратной связи с окружающей средой. Сочетая данные с датчиков с интеллектуальным принятием решений, воплощенные агенты устраняют разрыв между цифровыми вычислениями и реальным выполнением.

Как воплощенные системы воспринимают мир

В основе этих динамических систем лежит передовое компьютерное зрение, которое позволяет агенту понимать свое окружение в пространстве. Для безопасной и эффективной навигации воплощенные агенты в значительной степени полагаются на обнаружение объектов в реальном времени и непрерывную оценку положения. Когда разработчики создают нейронные пути для этих агентов, они часто интегрируют фреймворки глубокого обучения из PyTorch или инструментыTensorFlow для обработки сложных пространственных данных.

Для достижения истинной автономности эти системы все чаще используют модели «зрение-язык» в сочетании с надежными механизмами вывода в реальном времени. Это позволяет ИИ не только распознавать чашку, но и понимать сложные инструкции, такие как «возьми красную чашку у края стола ». Исследования таких учреждений, как Стэнфордский институт человекоцентрированного искусственного интеллекта (HAI) продолжают расширять границы интеграции мультисенсорных данных этими агентами.

Разграничение связанных терминов в области искусственного интеллекта

Чтобы понять эту область, необходимо отличать ее от близких по значению понятий:

  • Робототехника: Робототехника в основном сосредоточена на механическом оборудовании, приводах и управлении двигателями. Воплощенный ИИ обеспечивает когнитивный программный уровень, который делает оборудование автономным, как видно на примере таких проектов, как робот Atlas от Boston Dynamics.
  • Физический ИИ: Хотя эти термины часто используются как синонимы, физический ИИ строго требует наличия материального, реального оборудования. Воплощенный ИИ имеет более широкое значение и включает в себя виртуальных агентов, обученных в симулированных трехмерных физических средах, таких как робототехническая платформаNVIDIA Isaac.
  • AI-агент: Традиционные ИИ-агенты работают в цифровом пространстве (например, просматривают веб-страницы или пишут код). Воплощенные агенты специализируются на обработке пространственной размерности, физических ограничений и непрерывных сенсорных потоков.

Применение в реальном мире

Интеграция когнитивного мышления с физическими действиями привела к появлению трансформационных приложений в различных отраслях промышленности, что подробно описано в цифровой библиотеке ACM по исследованиям в области искусственного интеллекта.

  • Автономные транспортные средства: самоуправляемые автомобили полагаются на встроенный интеллект для навигации по городским улицам. Они обрабатывают непрерывные данные лидара и камеры для интерпретации дорожных знаков и движений пешеходов, подобно тому, как технология автономного вождения Waymo безопасно взаимодействует с динамичной городской средой.
  • Интеллектуальное производство: роботизированные манипуляторы, оснащенные моделями Ultralytics , выполняют сложные задачи на сборочной линии. Они динамически идентифицируют, отбирают и сортируют дефектные детали, демонстрируя принципы, исследованные в недавних исследованиях DeepMind в области робототехники.
  • Сельскохозяйственные дроны: беспилотные летательные аппараты используют пространственное восприятие для мониторинга состояния урожая и разумного распыления ресурсов только там, где это необходимо, что позволяет сократить отходы и повысить урожайность.

Формирование восприятия для воплощенных агентов

Разработчики, создающие эти физические системы, часто используют Ultralytics для аннотирования динамических учебных данных и беспроблемного развертывания легких передовых моделей искусственного интеллекта непосредственно на аппаратном обеспечении с низким энергопотреблением.

Ниже приведен Python , демонстрирующий, как робот-агент может использовать модель зрения для непрерывного detect объектов в своем окружении.

from ultralytics import YOLO

# Load the lightweight YOLO26 model designed for real-time edge hardware
model = YOLO("yolo26n.pt")

# Perform continuous object detection on a robotic camera feed
results = model.predict(source="camera_feed.mp4", stream=True)

# Process the spatial bounding boxes to guide robotic interaction
for r in results:
    print(f"Detected {len(r.boxes)} objects ready for physical interaction.")

По мере развития областей проектирования аппаратного обеспечения и когнитивного моделирования — под руководством таких инициатив, как исследованияAnthropic в области безопасности ИИ и последние модели рассуждений OpenAI— воплощенные системы будут продолжать переходить из исследовательских лабораторий в повседневную среду, как часто подчеркивается в репортажах IEEE Spectrum о робототехнике.

Зарядитесь энергией с помощью Ultralytics YOLO

Получите передовое AI-зрение для ваших проектов. Найдите подходящую лицензию для ваших целей уже сегодня.

Изучите варианты лицензирования