Встречай YOLO26: ИИ компьютерного зрения нового поколения.
Ultralytics
Назад к глоссарию Ultralytics

Behavioral Cloning

Узнай, как поведенческое клонирование обеспечивает обучение ИИ через подражание. Открой для себя ключевые области применения, проблемы и способы интеграции с Ultralytics YOLO26.

Поведенческое клонирование — это фундаментальный метод в imitation learning, где AI agent учится выполнять задачу, строго имитируя набор данных экспертных демонстраций. Вместо опоры на сложную систему вознаграждений модель рассматривает последовательное принятие решений как стандартную задачу supervised learning. Изучая тысячи пар «состояние-действие» — например, видеопоток от оператора-человека и соответствующие движения джойстика, — агент обучается политике, которая сопоставляет новые наблюдения непосредственно с прогнозируемыми действиями.

Link to this sectionЧем поведенческое клонирование отличается от обучения с подкреплением#

В то время как reinforcement learning требует, чтобы агент взаимодействовал со средой и обучался методом проб и ошибок, максимизируя сигнал вознаграждения, поведенческое клонирование полностью опирается на статические, заранее записанные наборы данных. Поскольку оно работает без взаимодействия со средой или явных функций вознаграждения, оно позволяет избежать сложностей формулирования Markov Decision Process. Однако эта простота означает, что агент не может обнаружить новые решения, превосходящие навыки эксперта. Современные методы offline reinforcement learning часто используют поведенческое клонирование как надежную отправную точку для стабилизации начального model training перед дальнейшей оптимизацией с помощью вознаграждений.

Link to this sectionРеальные приложения#

Поведенческое клонирование широко применяется в областях, где разработка математической функции вознаграждения крайне сложна, а сбор данных о действиях человека относительно прост.

  • Autonomous Driving: Современные системы автономного вождения, такие как NVIDIA DRIVE, активно используют end-to-end behavioral cloning. Обучаясь на тысячах часов данных вождения человека, модели учатся выводить углы поворота руля и команды ускорения непосредственно из входящих потоков computer vision.
  • Robotics Manipulation: В телеуправляемых роботизированных манипуляторах используется поведенческое клонирование для изучения сложных физических задач, таких как сортировка посылок, сборка промышленных деталей или складывание белья. Записывая точные углы соединений и визуальные состояния действий человека, модели могут с высокой точностью воспроизводить тонкую моторику.

Link to this sectionПроблема накопления ошибок#

Самым значительным ограничением этого метода является covariate shift, обычно называемый накоплением ошибок. Во время обучения агент учится только на идеальных траекториях экспертов. В реальных условиях работы с обратной связью крошечная ошибка в начале переводит агента в незнакомое состояние, отсутствующее в данных для обучения. Из-за отсутствия знаний для исправления ситуации последующие действия быстро деградируют, что приводит к полному провалу задачи. Устранение этой проблемы требует огромных, разнообразных наборов данных и целевой data augmentation.

Link to this sectionПоследние достижения: Диффузионные политики и группировка действий (action chunking)#

Чтобы преодолеть традиционные ограничения, современные архитектуры deep learning интегрируют генеративные методы. Diffusion policies используют математический аппарат диффузионных моделей для представления высокосложных мультимодальных распределений действий, позволяя агентам уверенно справляться с неоднозначными сценариями — концепция, глубоко исследованная в recent robotics research. Одновременно с этим action chunking позволяет агенту прогнозировать последовательность будущих действий, а не отдельный шаг, что минимизирует частоту реактивных ошибок и обеспечивает более плавное выполнение.

Link to this sectionПрактическая реализация с использованием компьютерного зрения#

На практике поведенческое клонирование опирается на мощную основу восприятия для извлечения состояний среды перед их передачей в политическую сеть. Используя Ultralytics Platform для управления наборами данных, разработчики часто сочетают высокоскоростные модели object detection с библиотеками нейронных сетей, такими как PyTorch, или специализированными пакетами управления, такими как TorchRL.

Следующий фрагмент Python демонстрирует, как Ultralytics YOLO26 может служить уровнем восприятия, извлекая пространственные координаты для передачи в базовую политику поведенческого клонирования на PyTorch, которая прогнозирует действие по управлению рулем.

import torch
import torch.nn as nn
from ultralytics import YOLO

# Load an Ultralytics YOLO26 model as the perception layer
perception_model = YOLO("yolo26n.pt")
results = perception_model("robot_camera_feed.jpg")

# Extract the bounding box center to define the current environmental state
if len(results[0].boxes) > 0:
    box = results[0].boxes[0].xywh.squeeze()
    state = torch.tensor([box[0], box[1]])  # x, y center coordinates

    # A simplified PyTorch Behavioral Cloning policy mapping states to actions
    bc_policy = nn.Linear(in_features=2, out_features=1)

    # Predict the expert-cloned action (e.g., a steering angle)
    predicted_action = bc_policy(state)
    print(f"Predicted cloned action: {predicted_action.item()}")

Поскольку исследования таких организаций, как OpenAI и Anthropic, продвигаются в сторону создания базовых моделей для физического интеллекта, поведенческое клонирование останется краеугольным камнем в обучении машин интерпретации и навигации в сложных реальных средах.

Explore solutions

Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.

Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.

Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.

Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.

Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.

Узнать больше
Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.

Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.

Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.

Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.

Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.

Узнать больше
Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.

Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.

Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.

Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.

Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.

Узнать больше

Давай строить будущее ИИ вместе!

Начни свой путь в будущее машинного обучения