Conheça o YOLO26: IA de visão de próxima geração.
Ultralytics
Voltar para o Glossário da Ultralytics

Action Chunking

Aprende como o "action chunking" melhora a precisão robótica e o aprendizado por imitação. Descobre como usar o Ultralytics YOLO26 para reduzir erros cumulativos em agentes de IA.

Action chunking é uma técnica avançada de deep learning, amplamente utilizada em robótica e aprendizagem por imitação, onde um modelo prevê uma sequência (ou "chunk") de ações futuras em vez de uma única ação em cada timestep. Ao prever uma trajetória de múltiplas etapas, o action chunking permite que AI agents realizem tarefas complexas e de longo horizonte com maior suavidade e confiabilidade. Esta abordagem ganhou força significativa após a introdução do Action Chunking with Transformers (ACT), uma arquitetura de modelo que combina previsão temporal com entradas de computer vision de alta dimensão.

Link to this sectionMitigando Erros Compostos#

Na clonagem comportamental tradicional, um modelo prevê o próximo passo imediato com base no estado atual. No entanto, durante a real-time inference, pequenas imprecisões de previsão deslocam o sistema para estados não observados. Esses erros multiplicam-se rapidamente, levando à falha da tarefa — um fenômeno conhecido como erros compostos.

O action chunking aborda diretamente essa limitação. Ao prever múltiplas ações simultaneamente (por exemplo, 50 movimentos articulares cobrindo 1 segundo de movimento), o horizonte de controle efetivo é reduzido. O sistema compromete-se com um plano coerente de curto prazo baseado em uma única observação visual confiável, reduzindo vastamente a frequência de erros reativos. Ao integrar backbones de visão como Ultralytics YOLO26 para consciência espacial e localização de bounding box, as previsões resultantes tornam-se incrivelmente estáveis contra ruído de processo.

Link to this sectionAplicações no Mundo Real#

O action chunking desbloqueou novas capacidades na automação física, particularmente quando implantado em hardware de edge AI otimizado por frameworks como Intel Edge:

  • Manipulação Robótica de Alta Precisão: Na automação industrial, robôs usam previsões em chunk para executar tarefas ricas em contato que exigem alta precisão, como passar fios, encaixar baterias ou manipular itens rastreados por package segmentation datasets. Gerar sequências de ação coesas evita os movimentos bruscos e inconsistentes típicos da imitation learning de passo único.
  • Navegação Autônoma: Na condução autônoma e voo de drones, prever um bloco de comandos de controle (como direção e aceleração) permite um planejamento de trajetória mais suave, um conceito amplamente explorado em recentes IEEE robotics papers. Juntamente com object tracking contínuo e depth estimation, veículos podem navegar com segurança em ambientes dinâmicos complexos.

Link to this sectionDistinguindo Conceitos Relacionados#

Para entender melhor como esta técnica se encaixa no ecossistema mais amplo de artificial intelligence, é útil diferenciá-la de termos semelhantes:

  • Action Chunking vs. Action Recognition: Enquanto o action chunking gera uma sequência de comandos futuros para uma máquina executar, o action recognition é o processo analítico de identificar atividades que ocorrem dentro de um feed de vídeo.
  • Action Chunking vs. Modelos Sequence-to-Sequence: Arquiteturas sequence-to-sequence mapeiam uma sequência de entrada para uma sequência de saída e são amplamente utilizadas em machine translation. O action chunking utiliza pesadamente essas arquiteturas — especificamente Transformers — mas restringe a saída puramente a controles motores de baixo nível e cinemática, em vez de texto.
  • Action Chunking vs. Reinforcement Learning: O reinforcement learning baseia-se em sinais de recompensa para ensinar um agente por tentativa e erro. Por outro lado, o action chunking é implantado principalmente na clonagem comportamental supervisionada, onde o modelo aprende diretamente a partir de demonstrações humanas sem maximização explícita de recompensa.

Link to this sectionImplementando o Action Chunking#

Na prática, um sistema de visão avalia o ambiente e um decodificador de sequência gera a trajetória em chunk. O seguinte snippet de Python demonstra um módulo conceitual de PyTorch (uma alternativa ao TensorFlow) que aceita um estado do ambiente — como aquele derivado de uma passagem de object detection — e produz uma sequência de ações futuras.

import torch
import torch.nn as nn


class ActionChunker(nn.Module):
    def __init__(self, state_dim, action_dim, chunk_size):
        super().__init__()
        # Maps the current state to a sequence of future actions
        self.decoder = nn.Linear(state_dim, chunk_size * action_dim)
        self.chunk_size = chunk_size
        self.action_dim = action_dim

    def forward(self, state):
        # Predict the entire action chunk at once
        chunk = self.decoder(state)
        return chunk.view(-1, self.chunk_size, self.action_dim)


# Example: 128-dim state, 6 degrees of freedom, 50-step chunk
model = ActionChunker(state_dim=128, action_dim=6, chunk_size=50)

# Generate a 50-step action trajectory from a single observation
current_state = torch.randn(1, 128)
action_trajectory = model(current_state)

print(f"Action Chunk Shape: {action_trajectory.shape}")

Gerenciar os conjuntos de dados massivos necessários para treinar essas políticas robóticas consome muitos recursos. Líderes da indústria como OpenAI e Anthropic são pioneiros em modelos de grande escala, mas desenvolvedores comuns dependem de ferramentas acessíveis. A Ultralytics Platform simplifica o ciclo de vida de dados para entradas visuais, oferecendo data annotation automatizada e capacidades contínuas de model training. À medida que os modelos evoluem para arquiteturas unificadas de Visão-Linguagem-Ação (VLA), combinar sistemas de visão eficientes com um action chunking robusto continuará a definir a próxima geração de automação inteligente.

Explore solutions

Real-time AI that works with your team

IA em robótica

Potencialize máquinas mais inteligentes com modelos Ultralytics YOLO. A IA de visão em robótica impulsiona a navegação autônoma, percepção, rastreamento de objetos e controle em tempo real.

Sabe mais
Real-time AI that works with your team

IA na Logística

Otimize a logística com modelos Ultralytics YOLO. A IA de visão permite a inspeção de pacotes, triagem, rastreamento de veículos e monitoramento de segurança em armazéns em tempo real.

Sabe mais
Real-time AI that works with your team

IA no varejo

Reinvente o varejo com modelos Ultralytics YOLO. A IA de visão impulsiona o rastreamento de inventário, monitoramento de prateleiras, gerenciamento de filas e percepções mais inteligentes sobre o cliente.

Sabe mais
Real-time AI that works with your team

IA na Saúde

Constrói soluções de saúde com modelos Ultralytics YOLO. A visão AI na saúde impulsiona imagens médicas mais rápidas, diagnósticos mais inteligentes e monitorização do paciente.

Sabe mais
Real-time AI that works with your team

IA na Fabricação

Otimize a fabricação com modelos Ultralytics YOLO. A IA de visão impulsiona o controle de qualidade, detecção de defeitos, conformidade com EPI e automação de linhas de montagem.

Sabe mais
Real-time AI that works with your operation

IA no Setor Automóvel

Aplica visão computacional no setor automóvel com modelos Ultralytics YOLO. A visão AI eleva a segurança rodoviária, a assistência ao condutor e a automação de veículos para estradas mais inteligentes.

Sabe mais
Real-time AI tailored to your operation

IA na Agricultura

Leva a visão AI para a agricultura inteligente com os modelos Ultralytics YOLO. Potencia a monitorização de culturas, o seguimento de gado e a agricultura de precisão para colheitas maiores e mais inteligentes.

Sabe mais
Real-time AI that works with your team

IA em robótica

Potencialize máquinas mais inteligentes com modelos Ultralytics YOLO. A IA de visão em robótica impulsiona a navegação autônoma, percepção, rastreamento de objetos e controle em tempo real.

Sabe mais
Real-time AI that works with your team

IA na Logística

Otimize a logística com modelos Ultralytics YOLO. A IA de visão permite a inspeção de pacotes, triagem, rastreamento de veículos e monitoramento de segurança em armazéns em tempo real.

Sabe mais
Real-time AI that works with your team

IA no varejo

Reinvente o varejo com modelos Ultralytics YOLO. A IA de visão impulsiona o rastreamento de inventário, monitoramento de prateleiras, gerenciamento de filas e percepções mais inteligentes sobre o cliente.

Sabe mais
Real-time AI that works with your team

IA na Saúde

Constrói soluções de saúde com modelos Ultralytics YOLO. A visão AI na saúde impulsiona imagens médicas mais rápidas, diagnósticos mais inteligentes e monitorização do paciente.

Sabe mais
Real-time AI that works with your team

IA na Fabricação

Otimize a fabricação com modelos Ultralytics YOLO. A IA de visão impulsiona o controle de qualidade, detecção de defeitos, conformidade com EPI e automação de linhas de montagem.

Sabe mais
Real-time AI that works with your operation

IA no Setor Automóvel

Aplica visão computacional no setor automóvel com modelos Ultralytics YOLO. A visão AI eleva a segurança rodoviária, a assistência ao condutor e a automação de veículos para estradas mais inteligentes.

Sabe mais
Real-time AI tailored to your operation

IA na Agricultura

Leva a visão AI para a agricultura inteligente com os modelos Ultralytics YOLO. Potencia a monitorização de culturas, o seguimento de gado e a agricultura de precisão para colheitas maiores e mais inteligentes.

Sabe mais
Real-time AI that works with your team

IA em robótica

Potencialize máquinas mais inteligentes com modelos Ultralytics YOLO. A IA de visão em robótica impulsiona a navegação autônoma, percepção, rastreamento de objetos e controle em tempo real.

Sabe mais
Real-time AI that works with your team

IA na Logística

Otimize a logística com modelos Ultralytics YOLO. A IA de visão permite a inspeção de pacotes, triagem, rastreamento de veículos e monitoramento de segurança em armazéns em tempo real.

Sabe mais
Real-time AI that works with your team

IA no varejo

Reinvente o varejo com modelos Ultralytics YOLO. A IA de visão impulsiona o rastreamento de inventário, monitoramento de prateleiras, gerenciamento de filas e percepções mais inteligentes sobre o cliente.

Sabe mais
Real-time AI that works with your team

IA na Saúde

Constrói soluções de saúde com modelos Ultralytics YOLO. A visão AI na saúde impulsiona imagens médicas mais rápidas, diagnósticos mais inteligentes e monitorização do paciente.

Sabe mais
Real-time AI that works with your team

IA na Fabricação

Otimize a fabricação com modelos Ultralytics YOLO. A IA de visão impulsiona o controle de qualidade, detecção de defeitos, conformidade com EPI e automação de linhas de montagem.

Sabe mais
Real-time AI that works with your operation

IA no Setor Automóvel

Aplica visão computacional no setor automóvel com modelos Ultralytics YOLO. A visão AI eleva a segurança rodoviária, a assistência ao condutor e a automação de veículos para estradas mais inteligentes.

Sabe mais
Real-time AI tailored to your operation

IA na Agricultura

Leva a visão AI para a agricultura inteligente com os modelos Ultralytics YOLO. Potencia a monitorização de culturas, o seguimento de gado e a agricultura de precisão para colheitas maiores e mais inteligentes.

Sabe mais

Vamos construir o futuro da IA juntos!

Começa a tua jornada com o futuro da aprendizagem automática