Conoce YOLO26: IA de visión de nueva generación.
Ultralytics
Volver al glosario de Ultralytics

Action Chunking

Aprende cómo el "action chunking" mejora la precisión robótica y el aprendizaje por imitación. Descubre cómo usar YOLO26 de Ultralytics para reducir errores acumulativos en agentes de IA.

El action chunking es una técnica avanzada de deep learning, muy utilizada en robótica y aprendizaje por imitación, en la que un modelo predice una secuencia (o "bloque") de acciones futuras en lugar de una sola acción en cada paso temporal. Al pronosticar una trayectoria de varios pasos, el action chunking permite que los AI agents realicen tareas complejas y de largo horizonte con mayor fluidez y fiabilidad. Este enfoque ha ganado una gran tracción tras la introducción de Action Chunking with Transformers (ACT), una arquitectura de modelo que combina la previsión temporal con entradas de computer vision de alta dimensionalidad.

Link to this sectionMitigación de errores acumulativos#

En la clonación conductual tradicional, un modelo predice el siguiente paso inmediato basándose en el estado actual. Sin embargo, durante la real-time inference, pequeñas imprecisiones en la predicción desplazan al sistema hacia estados no observados. Estos errores se multiplican rápidamente, lo que lleva al fallo de la tarea, un fenómeno conocido como errores acumulativos.

El action chunking aborda directamente esta limitación. Al predecir múltiples acciones simultáneamente (por ejemplo, 50 movimientos conjuntos que cubren 1 segundo de movimiento), el horizonte de control efectivo se reduce. El sistema se compromete a un plan coherente a corto plazo basado en una única observación visual fiable, lo que reduce enormemente la frecuencia de errores reactivos. Al integrar backbones de visión como Ultralytics YOLO26 para la percepción espacial y la localización de bounding box, las predicciones resultantes se vuelven increíblemente estables frente al ruido del proceso.

Link to this sectionAplicaciones en el mundo real#

El action chunking ha desbloqueado nuevas capacidades en la automatización física, especialmente cuando se despliega en hardware de edge AI optimizado por marcos como Intel Edge:

  • Manipulación robótica de grano fino: En la automatización industrial, los robots utilizan predicciones en bloques para ejecutar tareas ricas en contacto que requieren alta precisión, como enhebrar cables, insertar baterías o manipular artículos rastreados por package segmentation datasets. Generar secuencias de acción cohesivas evita los movimientos bruscos e inconsistentes típicos del imitation learning de un solo paso.
  • Navegación autónoma: En la conducción autónoma y el vuelo de drones, pronosticar un bloque de comandos de control (como la dirección y la aceleración) permite una planificación de trayectoria más fluida, un concepto ampliamente explorado en recientes IEEE robotics papers. Junto con el object tracking continuo y la depth estimation, los vehículos pueden navegar de forma segura por entornos dinámicos complejos.

Link to this sectionDistinguir conceptos relacionados#

Para entender mejor cómo encaja esta técnica en el ecosistema más amplio de la artificial intelligence, resulta útil diferenciarla de términos similares:

  • Action Chunking vs. Action Recognition: Mientras que el action chunking genera una secuencia de comandos futuros para que una máquina los ejecute, el action recognition es el proceso analítico de identificar actividades que ocurren dentro de un flujo de vídeo.
  • Action Chunking vs. Modelos Secuencia a Secuencia: Las arquitecturas secuencia a secuencia mapean una secuencia de entrada a una de salida y se utilizan ampliamente en la machine translation. El action chunking utiliza en gran medida estas arquitecturas —específicamente Transformers—, pero restringe la salida puramente a controles de motor de bajo nivel y cinemática en lugar de texto.
  • Action Chunking vs. Reinforcement Learning: El reinforcement learning se basa en señales de recompensa para enseñar a un agente mediante ensayo y error. Por el contrario, el action chunking se despliega principalmente en la clonación conductual supervisada, donde el modelo aprende directamente de demostraciones humanas sin maximización explícita de la recompensa.

Link to this sectionImplementación de Action Chunking#

En la práctica, un sistema de visión evalúa el entorno y un decodificador de secuencia genera la trayectoria en bloques. El siguiente fragmento de Python demuestra un módulo conceptual de PyTorch (una alternativa a TensorFlow) que acepta un estado del entorno —como uno derivado de un paso de object detection— y genera una secuencia de acciones futuras.

import torch
import torch.nn as nn


class ActionChunker(nn.Module):
    def __init__(self, state_dim, action_dim, chunk_size):
        super().__init__()
        # Maps the current state to a sequence of future actions
        self.decoder = nn.Linear(state_dim, chunk_size * action_dim)
        self.chunk_size = chunk_size
        self.action_dim = action_dim

    def forward(self, state):
        # Predict the entire action chunk at once
        chunk = self.decoder(state)
        return chunk.view(-1, self.chunk_size, self.action_dim)


# Example: 128-dim state, 6 degrees of freedom, 50-step chunk
model = ActionChunker(state_dim=128, action_dim=6, chunk_size=50)

# Generate a 50-step action trajectory from a single observation
current_state = torch.randn(1, 128)
action_trajectory = model(current_state)

print(f"Action Chunk Shape: {action_trajectory.shape}")

La gestión de los enormes datasets necesarios para entrenar estas políticas robóticas requiere muchos recursos. Líderes del sector como OpenAI y Anthropic son pioneros en modelos a gran escala, pero los desarrolladores cotidianos dependen de herramientas accesibles. Ultralytics Platform optimiza el ciclo de vida de los datos para entradas visuales, ofreciendo data annotation automatizada y capacidades de model training sin interrupciones. A medida que los modelos evolucionan hacia arquitecturas unificadas de Visión-Lenguaje-Acción (VLA), combinar sistemas de visión eficientes con un robusto action chunking seguirá definiendo la próxima generación de automatización inteligente.

Explore solutions

Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.

Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.

Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.

Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.

Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.

Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.

Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.

Más información
Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.

Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.

Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.

Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.

Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.

Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.

Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.

Más información
Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.

Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.

Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.

Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.

Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.

Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.

Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.

Más información

¡Construyamos juntos el futuro de la IA!

Comienza tu viaje con el futuro del aprendizaje automático