Conoce YOLO26: IA de visión de nueva generación.
Ultralytics
Volver al glosario de Ultralytics

Behavioral Cloning

Aprende cómo la clonación conductual impulsa el aprendizaje por imitación en IA. Descubre las aplicaciones clave, los desafíos y cómo integrarla con Ultralytics YOLO26.

La clonación conductual es una técnica fundamental en el aprendizaje por imitación donde un AI agent aprende a realizar una tarea imitando estrictamente un conjunto de datos de demostraciones de expertos. En lugar de depender de un sistema de recompensa complejo, el modelo trata la toma de decisiones secuencial como un problema estándar de aprendizaje supervisado. Al ingerir miles de pares de estado-acción —como la señal visual de un operador humano y sus movimientos correspondientes con el joystick—, el agente aprende una política que asigna nuevas observaciones directamente a acciones predichas.

Link to this sectionCómo se diferencia la clonación conductual del aprendizaje por refuerzo#

Mientras que el aprendizaje por refuerzo requiere que un agente interactúe con un entorno y aprenda mediante ensayo y error maximizando una señal de recompensa, la clonación conductual se basa totalmente en conjuntos de datos estáticos y pregrabados. Debido a que opera sin interacción con el entorno ni funciones de recompensa explícitas, evita las complejidades de formular un Proceso de Decisión de Markov. Sin embargo, esta simplicidad significa que el agente no puede descubrir soluciones novedosas que superen el rendimiento del experto. Los métodos recientes de aprendizaje por refuerzo offline suelen utilizar la clonación conductual como un punto de partida robusto para estabilizar el model training inicial antes de optimizar aún más con recompensas.

Link to this sectionAplicaciones en el mundo real#

La clonación conductual se implementa ampliamente en dominios donde diseñar una función de recompensa matemática es increíblemente difícil, pero recopilar datos de demostración humana es relativamente sencillo.

  • Autonomous Driving: Los sistemas modernos de conducción autónoma, como NVIDIA DRIVE, utilizan intensamente la clonación conductual de extremo a extremo. Al entrenarse con miles de horas de datos de conducción humana, los modelos aprenden a generar ángulos de dirección y comandos de aceleración directamente desde las señales de computer vision entrantes.
  • Robotics Manipulation: Los brazos robóticos teleoperados utilizan la clonación conductual para aprender tareas físicas intrincadas, como clasificar paquetes, ensamblar piezas manufacturadas o doblar ropa. Al registrar los ángulos exactos de las articulaciones y los estados visuales de las demostraciones humanas, los modelos pueden replicar habilidades motoras finas con alta precisión.

Link to this sectionEl problema del error compuesto#

La limitación más significativa de esta técnica es el desplazamiento de covariable, comúnmente conocido como errores compuestos. Durante el entrenamiento, el agente solo aprende de trayectorias de expertos perfectas. En la ejecución de bucle cerrado del mundo real, un pequeño error inicial desplaza al agente a un estado desconocido que no está presente en los datos de entrenamiento. Al carecer del conocimiento para recuperarse, las acciones posteriores se degradan rápidamente, lo que lleva al fallo total de la tarea. Mitigar este problema requiere conjuntos de datos masivos y diversos, además de una data augmentation dirigida.

Link to this sectionAvances recientes: Políticas de difusión y fragmentación de acciones#

Para superar las limitaciones tradicionales, las arquitecturas modernas de deep learning están integrando técnicas generativas. Las políticas de difusión aprovechan el marco matemático de los modelos de difusión para representar distribuciones de acciones multimodales altamente complejas, lo que permite a los agentes manejar escenarios ambiguos con elegancia, un concepto profundamente explorado en investigaciones recientes en robótica. Simultáneamente, la fragmentación de acciones permite que un agente prediga una secuencia de acciones futuras en lugar de un solo paso, minimizando la frecuencia de errores reactivos y asegurando una ejecución más fluida.

Link to this sectionImplementación práctica con visión artificial#

En la práctica, la clonación conductual depende de una base sólida de percepción para extraer estados ambientales antes de pasarlos a la red de políticas. Usando la Ultralytics Platform para gestionar conjuntos de datos, los desarrolladores suelen combinar modelos de object detection de alta velocidad con bibliotecas de redes neuronales como PyTorch o paquetes de control especializados como TorchRL.

El siguiente fragmento de Python demuestra cómo Ultralytics YOLO26 puede servir como la capa de percepción, extrayendo coordenadas espaciales para alimentar una política básica de clonación conductual de PyTorch que predice una acción de dirección.

import torch
import torch.nn as nn
from ultralytics import YOLO

# Load an Ultralytics YOLO26 model as the perception layer
perception_model = YOLO("yolo26n.pt")
results = perception_model("robot_camera_feed.jpg")

# Extract the bounding box center to define the current environmental state
if len(results[0].boxes) > 0:
    box = results[0].boxes[0].xywh.squeeze()
    state = torch.tensor([box[0], box[1]])  # x, y center coordinates

    # A simplified PyTorch Behavioral Cloning policy mapping states to actions
    bc_policy = nn.Linear(in_features=2, out_features=1)

    # Predict the expert-cloned action (e.g., a steering angle)
    predicted_action = bc_policy(state)
    print(f"Predicted cloned action: {predicted_action.item()}")

A medida que la investigación de organizaciones como OpenAI y Anthropic avanza hacia modelos base para la inteligencia física, la clonación conductual seguirá siendo una piedra angular para enseñar a las máquinas a interpretar y navegar en entornos complejos del mundo real.

Explore solutions

Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.

Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.

Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.

Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.

Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.

Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.

Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.

Más información
Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.

Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.

Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.

Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.

Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.

Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.

Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.

Más información
Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.

Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.

Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.

Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.

Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.

Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.

Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.

Más información

¡Construyamos juntos el futuro de la IA!

Comienza tu viaje con el futuro del aprendizaje automático