YOLO26 소개: 차세대 비전 AI입니다.
Ultralytics
Ultralytics 용어집으로 돌아가기

Action Chunking

액션 청킹(Action Chunking)이 로봇 정밀도와 모방 학습을 어떻게 향상하는지 알아보십시오. Ultralytics YOLO26을 사용하여 AI 에이전트의 복합 오류를 줄이는 방법을 확인해 보십시오.

Action chunking is an advanced deep learning technique, heavily utilized in robotics and imitation learning, where a model predicts a sequence (or "chunk") of future actions rather than a single action at each timestep. By forecasting a multi-step trajectory, action chunking allows AI agents to perform complex, long-horizon tasks with greater smoothness and reliability. This approach has gained significant traction following the introduction of Action Chunking with Transformers (ACT), a model architecture that combines temporal forecasting with high-dimensional computer vision inputs.

Link to this section누적 오차 완화#

기존의 행동 복제(behavioral cloning) 방식에서 모델은 현재 상태를 기반으로 바로 다음 단계를 예측합니다. 그러나 실시간 추론 과정에서 아주 작은 예측 오류가 시스템을 관찰되지 않은 상태로 밀어넣을 수 있습니다. 이러한 실수가 빠르게 증폭되면서 작업 실패로 이어지는데, 이를 누적 오차(compounding errors)라고 합니다.

Action chunking은 이러한 한계를 직접적으로 해결합니다. 여러 동작을 동시에 예측함으로써(예: 1초간의 움직임을 포함하는 50개의 관절 동작) 효과적인 제어 구간이 줄어듭니다. 시스템은 단일의 신뢰할 수 있는 시각적 관찰을 바탕으로 일관된 단기 계획을 수립하며, 이를 통해 반응성 오류의 빈도를 크게 줄입니다. 공간 인식을 위해 Ultralytics YOLO26과 같은 비전 백본을 통합하고 바운딩 박스 위치 추정을 수행하면, 결과적으로 예측값이 프로세스 노이즈에 대해 매우 안정적이게 됩니다.

Link to this section실제 애플리케이션 사례#

Action chunking has unlocked new capabilities in physical automation, particularly when deployed on edge AI hardware optimized by frameworks like Intel Edge:

  • 정밀 로봇 조작: 산업 자동화에서 로봇은 청크 단위의 예측을 사용하여 케이블 스레딩, 배터리 슬롯 삽입 또는 패키지 세그멘테이션 데이터셋으로 추적된 품목 처리와 같이 높은 정밀도가 요구되는 접촉 중심 작업을 수행합니다. 응집력 있는 동작 시퀀스를 생성하면 단일 단계 모방 학습에서 흔히 발생하는 끊어지거나 일관성 없는 움직임을 방지할 수 있습니다.
  • 자율 주행: 자율 주행 및 드론 비행 분야에서 제어 명령 블록(조향 및 가속 등)을 예측하면 더 부드러운 궤적 계획이 가능해지며, 이는 최근 IEEE 로봇 공학 논문에서 활발히 연구되는 개념입니다. 지속적인 객체 추적깊이 추정과 결합하여 차량은 복잡하고 역동적인 환경을 안전하게 주행할 수 있습니다.

Link to this section관련 개념 구분#

이 기법이 더 넓은 인공지능 생태계에 어떻게 부합하는지 이해하려면 유사한 용어들과 구별하는 것이 도움이 됩니다:

  • Action Chunking vs. 행동 인식: action chunking은 기계가 실행할 미래 명령 시퀀스를 생성하는 반면, 행동 인식은 비디오 피드 내에서 발생하는 활동을 식별하는 분석 과정입니다.
  • Action Chunking vs. 시퀀스-투-시퀀스 모델: 시퀀스-투-시퀀스 아키텍처는 입력 시퀀스를 출력 시퀀스로 매핑하며 기계 번역에 널리 사용됩니다. Action chunking은 이러한 아키텍처, 특히 Transformers를 많이 활용하지만 출력을 텍스트가 아닌 저수준의 모터 제어 및 운동학적 데이터로 제한합니다.
  • Action Chunking vs. 강화 학습: 강화 학습은 보상 신호에 의존하여 시행착오를 통해 에이전트를 학습시킵니다. 반대로 action chunking은 주로 지도 행동 복제(supervised behavioral cloning)에 배포되며, 모델은 명시적인 보상 극대화 없이 인간의 시연으로부터 직접 학습합니다.

Link to this sectionAction Chunking 구현하기#

In practice, a vision system evaluates the environment, and a sequence decoder generates the chunked trajectory. The following Python snippet demonstrates a conceptual PyTorch module (an alternative to TensorFlow) that accepts an environment state—such as one derived from an object detection pass—and outputs a sequence of future actions.

import torch
import torch.nn as nn


class ActionChunker(nn.Module):
    def __init__(self, state_dim, action_dim, chunk_size):
        super().__init__()
        # Maps the current state to a sequence of future actions
        self.decoder = nn.Linear(state_dim, chunk_size * action_dim)
        self.chunk_size = chunk_size
        self.action_dim = action_dim

    def forward(self, state):
        # Predict the entire action chunk at once
        chunk = self.decoder(state)
        return chunk.view(-1, self.chunk_size, self.action_dim)


# Example: 128-dim state, 6 degrees of freedom, 50-step chunk
model = ActionChunker(state_dim=128, action_dim=6, chunk_size=50)

# Generate a 50-step action trajectory from a single observation
current_state = torch.randn(1, 128)
action_trajectory = model(current_state)

print(f"Action Chunk Shape: {action_trajectory.shape}")

이러한 로봇 정책을 학습시키는 데 필요한 방대한 데이터셋을 관리하는 것은 자원 집약적입니다. OpenAIAnthropic과 같은 업계 리더들은 대규모 모델을 선도하지만, 일반 개발자들은 접근 가능한 도구에 의존합니다. Ultralytics Platform은 자동화된 데이터 어노테이션 및 원활한 모델 학습 기능을 제공하여 시각적 입력 데이터 수명 주기를 간소화합니다. 모델이 통합 Vision-Language-Action (VLA) 아키텍처로 진화함에 따라, 효율적인 비전 시스템과 강력한 action chunking을 결합하는 방식은 차세대 지능형 자동화를 정의할 것입니다.

Explore solutions

Real-time AI that works with your team

로봇 공학에서의 AI

Ultralytics YOLO 모델로 더 스마트한 기기를 구동하십시오. 로봇 공학의 비전 AI는 자율 주행, 인식, 객체 추적 및 실시간 제어를 촉진합니다.

더 알아보기
Real-time AI that works with your team

물류 분야의 AI

Ultralytics YOLO 모델로 물류 프로세스를 간소화하십시오. 비전 AI를 통해 패키지 검사, 분류, 차량 추적 및 실시간 창고 안전 모니터링이 가능합니다.

더 알아보기
Real-time AI that works with your team

소매업에서의 AI

Ultralytics YOLO 모델로 소매업을 재구상하십시오. 비전 AI는 재고 추적, 선반 모니터링, 대기열 관리 및 더 스마트한 고객 인사이트를 지원합니다.

더 알아보기
Real-time AI that works with your team

의료 분야의 AI

Ultralytics YOLO 모델로 의료 솔루션을 구축하십시오. 의료 분야의 비전 AI는 더 빠른 의료 영상 분석, 더 스마트한 진단 및 환자 모니터링을 지원합니다.

더 알아보기
Real-time AI that works with your team

제조 분야의 AI

Ultralytics YOLO 모델로 제조 공정을 최적화하십시오. 비전 AI는 품질 관리, 결함 탐지, PPE 규정 준수 및 조립 라인 자동화를 주도합니다.

더 알아보기
Real-time AI that works with your operation

자동차 분야의 AI

Ultralytics YOLO 모델을 통해 자동차 분야에 컴퓨터 비전을 적용하십시오. 비전 AI는 도로 안전, 운전자 보조 및 차량 자동화를 향상하여 더 스마트한 도로를 만듭니다.

더 알아보기
Real-time AI tailored to your operation

농업 분야의 AI

Ultralytics YOLO 모델을 통해 스마트 농업에 비전 AI를 도입하십시오. 작물 모니터링, 가축 추적 및 정밀 농업을 강화하여 더 높고 스마트한 생산량을 달성하십시오.

더 알아보기
Real-time AI that works with your team

로봇 공학에서의 AI

Ultralytics YOLO 모델로 더 스마트한 기기를 구동하십시오. 로봇 공학의 비전 AI는 자율 주행, 인식, 객체 추적 및 실시간 제어를 촉진합니다.

더 알아보기
Real-time AI that works with your team

물류 분야의 AI

Ultralytics YOLO 모델로 물류 프로세스를 간소화하십시오. 비전 AI를 통해 패키지 검사, 분류, 차량 추적 및 실시간 창고 안전 모니터링이 가능합니다.

더 알아보기
Real-time AI that works with your team

소매업에서의 AI

Ultralytics YOLO 모델로 소매업을 재구상하십시오. 비전 AI는 재고 추적, 선반 모니터링, 대기열 관리 및 더 스마트한 고객 인사이트를 지원합니다.

더 알아보기
Real-time AI that works with your team

의료 분야의 AI

Ultralytics YOLO 모델로 의료 솔루션을 구축하십시오. 의료 분야의 비전 AI는 더 빠른 의료 영상 분석, 더 스마트한 진단 및 환자 모니터링을 지원합니다.

더 알아보기
Real-time AI that works with your team

제조 분야의 AI

Ultralytics YOLO 모델로 제조 공정을 최적화하십시오. 비전 AI는 품질 관리, 결함 탐지, PPE 규정 준수 및 조립 라인 자동화를 주도합니다.

더 알아보기
Real-time AI that works with your operation

자동차 분야의 AI

Ultralytics YOLO 모델을 통해 자동차 분야에 컴퓨터 비전을 적용하십시오. 비전 AI는 도로 안전, 운전자 보조 및 차량 자동화를 향상하여 더 스마트한 도로를 만듭니다.

더 알아보기
Real-time AI tailored to your operation

농업 분야의 AI

Ultralytics YOLO 모델을 통해 스마트 농업에 비전 AI를 도입하십시오. 작물 모니터링, 가축 추적 및 정밀 농업을 강화하여 더 높고 스마트한 생산량을 달성하십시오.

더 알아보기
Real-time AI that works with your team

로봇 공학에서의 AI

Ultralytics YOLO 모델로 더 스마트한 기기를 구동하십시오. 로봇 공학의 비전 AI는 자율 주행, 인식, 객체 추적 및 실시간 제어를 촉진합니다.

더 알아보기
Real-time AI that works with your team

물류 분야의 AI

Ultralytics YOLO 모델로 물류 프로세스를 간소화하십시오. 비전 AI를 통해 패키지 검사, 분류, 차량 추적 및 실시간 창고 안전 모니터링이 가능합니다.

더 알아보기
Real-time AI that works with your team

소매업에서의 AI

Ultralytics YOLO 모델로 소매업을 재구상하십시오. 비전 AI는 재고 추적, 선반 모니터링, 대기열 관리 및 더 스마트한 고객 인사이트를 지원합니다.

더 알아보기
Real-time AI that works with your team

의료 분야의 AI

Ultralytics YOLO 모델로 의료 솔루션을 구축하십시오. 의료 분야의 비전 AI는 더 빠른 의료 영상 분석, 더 스마트한 진단 및 환자 모니터링을 지원합니다.

더 알아보기
Real-time AI that works with your team

제조 분야의 AI

Ultralytics YOLO 모델로 제조 공정을 최적화하십시오. 비전 AI는 품질 관리, 결함 탐지, PPE 규정 준수 및 조립 라인 자동화를 주도합니다.

더 알아보기
Real-time AI that works with your operation

자동차 분야의 AI

Ultralytics YOLO 모델을 통해 자동차 분야에 컴퓨터 비전을 적용하십시오. 비전 AI는 도로 안전, 운전자 보조 및 차량 자동화를 향상하여 더 스마트한 도로를 만듭니다.

더 알아보기
Real-time AI tailored to your operation

농업 분야의 AI

Ultralytics YOLO 모델을 통해 스마트 농업에 비전 AI를 도입하십시오. 작물 모니터링, 가축 추적 및 정밀 농업을 강화하여 더 높고 스마트한 생산량을 달성하십시오.

더 알아보기

미래의 AI를 함께 구축합시다!

머신 러닝의 미래와 함께 여정을 시작하십시오.