YOLO26の紹介: 次世代のビジョンAI。
Ultralytics
Ultralytics用語集に戻る

Action Chunking

アクションチャンキングがロボットの精度と模倣学習をどのように向上させるかを学びます。AIエージェントにおける累積誤差を減らすためにUltralytics YOLO26を使用する方法を発見しましょう。

Action chunking is an advanced deep learning technique, heavily utilized in robotics and imitation learning, where a model predicts a sequence (or "chunk") of future actions rather than a single action at each timestep. By forecasting a multi-step trajectory, action chunking allows AI agents to perform complex, long-horizon tasks with greater smoothness and reliability. This approach has gained significant traction following the introduction of Action Chunking with Transformers (ACT), a model architecture that combines temporal forecasting with high-dimensional computer vision inputs.

Link to this section累積誤差の緩和#

従来の行動クローニングでは、モデルは現在の状態に基づいて直後のステップを予測します。しかし、real-time inference中には、わずかな予測の不正確さがシステムを未知の状態へとずらしてしまいます。これらのミスが急速に増幅され、タスクの失敗につながります。これが累積誤差として知られる現象です。

Action chunkingはこの制限に直接対処します。複数のアクションを同時に予測する(例えば、1秒間の動作をカバーする50の関節運動など)ことで、実効的な制御ホライズンが短縮されます。システムは単一の信頼できる視覚的観測に基づいて一貫した短期計画を実行するため、反応的なエラーの発生頻度が大幅に減少します。空間認識のためにUltralytics YOLO26のようなビジョンバックボーンを統合し、bounding boxによるローカリゼーションを行うと、予測結果はプロセスノイズに対して非常に安定したものとなります。

Link to this section実社会での応用#

Action chunking has unlocked new capabilities in physical automation, particularly when deployed on edge AI hardware optimized by frameworks like Intel Edge:

  • 高精度なロボット操作: 産業オートメーションにおいて、ロボットはチャンク化された予測を使用して、ケーブルの通し作業、バッテリーの挿入、package segmentation datasetsで追跡されるアイテムの取り扱いなど、高い精度を必要とする接触を伴うタスクを実行します。一貫したアクションシーケンスを生成することで、単一ステップのimitation learningにありがちな、ぎこちなく不自然な動きを防ぐことができます。
  • 自律航法: 自律走行やドローン飛行において、制御コマンド(ステアリングや加速など)のブロックを予測することで、よりスムーズな軌道計画が可能になります。これは最近のIEEE robotics papersでも深く研究されている概念です。継続的なobject trackingdepth estimationと組み合わせることで、車両は複雑で動的な環境でも安全にナビゲートできます。

Link to this section関連概念の区別#

この技術がより広範なartificial intelligenceのエコシステムにどのように適合するかを理解するために、類似の用語との違いを確認しておくと役立ちます。

  • Action ChunkingとAction Recognitionの比較: Action chunkingが機械が実行するための将来のコマンドシーケンスを生成するのに対し、action recognitionはビデオフィード内で発生しているアクティビティを識別する分析プロセスです。
  • Action ChunkingとSequence-to-Sequenceモデルの比較: Sequence-to-sequenceアーキテクチャは入力シーケンスを出力シーケンスにマッピングするもので、machine translationなどで広く使用されています。Action chunkingはこのアーキテクチャ、特にTransformersを多用しますが、出力をテキストではなく、低レベルのモーター制御やキネマティクスに限定しています。
  • Action ChunkingとReinforcement Learningの比較: Reinforcement learningは、報酬信号に依存して試行錯誤を通じてエージェントを学習させます。対照的に、action chunkingは主に教師あり行動クローニングで使用され、明示的な報酬最大化を行わずに、人間のデモンストレーションから直接モデルが学習します。

Link to this sectionAction Chunkingの実装#

In practice, a vision system evaluates the environment, and a sequence decoder generates the chunked trajectory. The following Python snippet demonstrates a conceptual PyTorch module (an alternative to TensorFlow) that accepts an environment state—such as one derived from an object detection pass—and outputs a sequence of future actions.

import torch
import torch.nn as nn


class ActionChunker(nn.Module):
    def __init__(self, state_dim, action_dim, chunk_size):
        super().__init__()
        # Maps the current state to a sequence of future actions
        self.decoder = nn.Linear(state_dim, chunk_size * action_dim)
        self.chunk_size = chunk_size
        self.action_dim = action_dim

    def forward(self, state):
        # Predict the entire action chunk at once
        chunk = self.decoder(state)
        return chunk.view(-1, self.chunk_size, self.action_dim)


# Example: 128-dim state, 6 degrees of freedom, 50-step chunk
model = ActionChunker(state_dim=128, action_dim=6, chunk_size=50)

# Generate a 50-step action trajectory from a single observation
current_state = torch.randn(1, 128)
action_trajectory = model(current_state)

print(f"Action Chunk Shape: {action_trajectory.shape}")

これらのロボットポリシーの学習に必要な膨大なデータセットの管理は、リソースを大量に消費します。OpenAIAnthropicのような業界リーダーは大規模モデルを先駆けて開発していますが、日常的な開発者は利用しやすいツールに頼っています。Ultralytics Platformは、自動化されたdata annotationやシームレスなmodel training機能を提供し、視覚入力のためのデータライフサイクルを効率化します。モデルが統合型のVision-Language-Action (VLA) アーキテクチャへと進化するにつれ、効率的なビジョンシステムと堅牢なaction chunkingの組み合わせが、次世代のインテリジェントオートメーションを定義していくことでしょう。

Explore solutions

Real-time AI that works with your team

ロボティクスにおけるAI

Ultralytics YOLOモデルで、よりスマートなマシンを実現しましょう。ロボティクスにおけるビジョンAIは、自律航行、認識、物体追跡、リアルタイム制御を推進します。

詳細はこちら
Real-time AI that works with your team

物流におけるAI

Ultralytics YOLOモデルで物流を効率化しましょう。ビジョンAIにより、荷物の検査、仕分け、車両追跡、リアルタイムの倉庫安全モニタリングが可能になります。

詳細はこちら
Real-time AI that works with your team

小売業界におけるAI

Ultralytics YOLOモデルで小売を再定義しましょう。ビジョンAIは、在庫追跡、棚のモニタリング、キュー管理、そしてより賢明な顧客インサイトを促進します。

詳細はこちら
Real-time AI that works with your team

ヘルスケアにおけるAI

Ultralytics YOLOモデルを使用してヘルスケアソリューションを構築しましょう。ヘルスケア分野におけるビジョンAIは、より高速な医療画像診断、よりスマートな診断、患者モニタリングを推進します。

詳細はこちら
Real-time AI that works with your team

製造におけるAI

Ultralytics YOLOモデルで製造を最適化しましょう。ビジョンAIは、品質管理、欠陥検出、PPEコンプライアンス、組立ラインの自動化を促進します。

詳細はこちら
Real-time AI that works with your operation

自動車におけるAI

Ultralytics YOLOモデルを使用して、自動車分野にコンピュータビジョンを適用しましょう。ビジョンAIは、道路の安全性、運転支援、車両の自動化を向上させ、よりスマートな道路を実現します。

詳細はこちら
Real-time AI tailored to your operation

農業におけるAI

Ultralytics YOLOモデルを使用して、スマート農業にビジョンAIを導入しましょう。作物モニタリング、家畜のトラッキング、精密農業を強化し、より高くスマートな収穫を実現します。

詳細はこちら
Real-time AI that works with your team

ロボティクスにおけるAI

Ultralytics YOLOモデルで、よりスマートなマシンを実現しましょう。ロボティクスにおけるビジョンAIは、自律航行、認識、物体追跡、リアルタイム制御を推進します。

詳細はこちら
Real-time AI that works with your team

物流におけるAI

Ultralytics YOLOモデルで物流を効率化しましょう。ビジョンAIにより、荷物の検査、仕分け、車両追跡、リアルタイムの倉庫安全モニタリングが可能になります。

詳細はこちら
Real-time AI that works with your team

小売業界におけるAI

Ultralytics YOLOモデルで小売を再定義しましょう。ビジョンAIは、在庫追跡、棚のモニタリング、キュー管理、そしてより賢明な顧客インサイトを促進します。

詳細はこちら
Real-time AI that works with your team

ヘルスケアにおけるAI

Ultralytics YOLOモデルを使用してヘルスケアソリューションを構築しましょう。ヘルスケア分野におけるビジョンAIは、より高速な医療画像診断、よりスマートな診断、患者モニタリングを推進します。

詳細はこちら
Real-time AI that works with your team

製造におけるAI

Ultralytics YOLOモデルで製造を最適化しましょう。ビジョンAIは、品質管理、欠陥検出、PPEコンプライアンス、組立ラインの自動化を促進します。

詳細はこちら
Real-time AI that works with your operation

自動車におけるAI

Ultralytics YOLOモデルを使用して、自動車分野にコンピュータビジョンを適用しましょう。ビジョンAIは、道路の安全性、運転支援、車両の自動化を向上させ、よりスマートな道路を実現します。

詳細はこちら
Real-time AI tailored to your operation

農業におけるAI

Ultralytics YOLOモデルを使用して、スマート農業にビジョンAIを導入しましょう。作物モニタリング、家畜のトラッキング、精密農業を強化し、より高くスマートな収穫を実現します。

詳細はこちら
Real-time AI that works with your team

ロボティクスにおけるAI

Ultralytics YOLOモデルで、よりスマートなマシンを実現しましょう。ロボティクスにおけるビジョンAIは、自律航行、認識、物体追跡、リアルタイム制御を推進します。

詳細はこちら
Real-time AI that works with your team

物流におけるAI

Ultralytics YOLOモデルで物流を効率化しましょう。ビジョンAIにより、荷物の検査、仕分け、車両追跡、リアルタイムの倉庫安全モニタリングが可能になります。

詳細はこちら
Real-time AI that works with your team

小売業界におけるAI

Ultralytics YOLOモデルで小売を再定義しましょう。ビジョンAIは、在庫追跡、棚のモニタリング、キュー管理、そしてより賢明な顧客インサイトを促進します。

詳細はこちら
Real-time AI that works with your team

ヘルスケアにおけるAI

Ultralytics YOLOモデルを使用してヘルスケアソリューションを構築しましょう。ヘルスケア分野におけるビジョンAIは、より高速な医療画像診断、よりスマートな診断、患者モニタリングを推進します。

詳細はこちら
Real-time AI that works with your team

製造におけるAI

Ultralytics YOLOモデルで製造を最適化しましょう。ビジョンAIは、品質管理、欠陥検出、PPEコンプライアンス、組立ラインの自動化を促進します。

詳細はこちら
Real-time AI that works with your operation

自動車におけるAI

Ultralytics YOLOモデルを使用して、自動車分野にコンピュータビジョンを適用しましょう。ビジョンAIは、道路の安全性、運転支援、車両の自動化を向上させ、よりスマートな道路を実現します。

詳細はこちら
Real-time AI tailored to your operation

農業におけるAI

Ultralytics YOLOモデルを使用して、スマート農業にビジョンAIを導入しましょう。作物モニタリング、家畜のトラッキング、精密農業を強化し、より高くスマートな収穫を実現します。

詳細はこちら

AIの未来を共に築き上げましょう!

機械学習の未来とともに旅を始めましょう