Action Chunking
تعرف على كيفية تحسين تجميع الإجراءات (Action Chunking) لدقة الروبوتات والتعلم بالتقليد. اكتشف كيفية استخدام Ultralytics YOLO26 لتقليل الأخطاء التراكمية في وكلاء الذكاء الاصطناعي.
تجميع الإجراءات (Action Chunking) هو تقنية متقدمة في التعلم العميق، تُستخدم بكثافة في الروبوتات والتعلم بالتقليد، حيث يتنبأ النموذج بتسلسل (أو "مجموعة") من الإجراءات المستقبلية بدلاً من إجراء واحد في كل خطوة زمنية. من خلال التنبؤ بمسار متعدد الخطوات، يسمح تجميع الإجراءات لـ وكلاء الذكاء الاصطناعي بتنفيذ مهام معقدة وطويلة الأمد بمزيد من السلاسة والموثوقية. اكتسب هذا النهج أهمية كبيرة بعد تقديم تجميع الإجراءات باستخدام محولات ACT، وهي بنية نموذجية تجمع بين التنبؤ الزمني ومدخلات الرؤية الحاسوبية عالية الأبعاد.
Link to this sectionتخفيف الأخطاء التراكمية#
في الاستنساخ السلوكي التقليدي، يتنبأ النموذج بالخطوة التالية المباشرة بناءً على الحالة الحالية. ومع ذلك، أثناء الاستنتاد في الوقت الفعلي، تؤدي عدم دقة التنبؤات الصغيرة إلى تحويل النظام إلى حالات غير مرصودة. تتضاعف هذه الأخطاء بسرعة، مما يؤدي إلى فشل المهمة - وهي ظاهرة تُعرف بالأخطاء التراكمية.
يعالج تجميع الإجراءات هذا القيد مباشرة. فمن خلال التنبؤ بإجراءات متعددة في وقت واحد (مثل 50 حركة مفصلية تغطي ثانية واحدة من الحركة)، يتم تقليل أفق التحكم الفعلي. يلتزم النظام بخطة قصيرة المدى متماسكة بناءً على ملاحظة بصرية واحدة موثوقة، مما يقلل بشكل كبير من وتيرة الأخطاء التفاعلية. عند دمج هياكل الرؤية مثل Ultralytics YOLO26 للوعي المكاني وتحديد مواقع مربع الإحاطة، تصبح التنبؤات الناتجة مستقرة بشكل لا يصدق ضد ضوضاء العمليات.
Link to this sectionتطبيقات العالم الحقيقي#
لقد فتح تجميع الإجراءات إمكانات جديدة في الأتمتة المادية، خاصة عند نشره على أجهزة الذكاء الاصطناعي الطرفي المحسّنة بواسطة أطر عمل مثل Intel Edge:
- التحكم الروبوتي الدقيق: في الأتمتة الصناعية، تستخدم الروبوتات تنبؤات مجمعة لتنفيذ المهام الغنية بالتلامس التي تتطلب دقة عالية، مثل تمرير الكابلات، أو تركيب البطاريات، أو التعامل مع العناصر التي يتم تتبعها بواسطة مجموعات بيانات تجزئة الحزم. يؤدي إنشاء تسلسلات إجراءات متماسكة إلى منع الحركات المتقطعة وغير المتسقة الشائعة في التعلم بالتقليد أحادي الخطوة.
- الملاحة الذاتية: في القيادة الذاتية وطيران الطائرات بدون طيار، يتيح التنبؤ بكتلة من أوامر التحكم (مثل التوجيه والتسارع) تخطيط مسار أكثر سلاسة، وهو مفهوم تم استكشافه بكثافة في أوراق بحث الروبوتات من IEEE الأخيرة. وبالاقتران مع تتبع الكائنات المستمر وتقدير العمق، يمكن للمركبات التنقل بأمان في بيئات ديناميكية معقدة.
Link to this sectionالتمييز بين المفاهيم ذات الصلة#
لفهم كيفية ملاءمة هذه التقنية للنظام البيئي الأوسع لـ الذكاء الاصطناعي، من المفيد تمييزها عن المصطلحات المشابهة:
- تجميع الإجراءات مقابل التعرف على الإجراءات: بينما يُنشئ تجميع الإجراءات تسلسلاً للأوامر المستقبلية لآلة ما لتنفيذها، فإن التعرف على الإجراءات هو العملية التحليلية لـ تحديد الأنشطة التي تحدث داخل بث الفيديو.
- تجميع الإجراءات مقابل نماذج التسلسل إلى التسلسل: تربط بنى التسلسل إلى التسلسل بين تسلسل الإدخال وتسلسل الإخراج، وتُستخدم على نطاق واسع في الترجمة الآلية. يستخدم تجميع الإجراءات هذه البنى بكثافة - وتحديداً المحولات - ولكنه يقيد الإخراج بشكل بحت على ضوابط الحركة منخفضة المستوى والحركية بدلاً من النص.
- تجميع الإجراءات مقابل التعلم التعزيزي: يعتمد التعلم التعزيزي على إشارات المكافأة لتعليم الوكيل من خلال التجربة والخطأ. وعلى العكس من ذلك، يتم نشر تجميع الإجراءات بشكل أساسي في الاستنساخ السلوكي الخاضع للإشراف، حيث يتعلم النموذج مباشرة من العروض البشرية دون تعظيم صريح للمكافأة.
Link to this sectionتنفيذ تجميع الإجراءات#
من الناحية العملية، يقوم نظام الرؤية بتقييم البيئة، ويقوم مفكك تشفير التسلسل بإنشاء المسار المجمع. يوضح مقتطف Python التالي وحدة PyTorch مفاهيمية (بديلة لـ TensorFlow) تقبل حالة بيئية - مثل تلك المشتقة من تمريرة كشف الكائنات - وتخرج تسلسلاً من الإجراءات المستقبلية.
import torch
import torch.nn as nn
class ActionChunker(nn.Module):
def __init__(self, state_dim, action_dim, chunk_size):
super().__init__()
# Maps the current state to a sequence of future actions
self.decoder = nn.Linear(state_dim, chunk_size * action_dim)
self.chunk_size = chunk_size
self.action_dim = action_dim
def forward(self, state):
# Predict the entire action chunk at once
chunk = self.decoder(state)
return chunk.view(-1, self.chunk_size, self.action_dim)
# Example: 128-dim state, 6 degrees of freedom, 50-step chunk
model = ActionChunker(state_dim=128, action_dim=6, chunk_size=50)
# Generate a 50-step action trajectory from a single observation
current_state = torch.randn(1, 128)
action_trajectory = model(current_state)
print(f"Action Chunk Shape: {action_trajectory.shape}")إن إدارة مجموعات البيانات الضخمة المطلوبة لتدريب هذه السياسات الروبوتية تستهلك الكثير من الموارد. يقود قادة الصناعة مثل OpenAI وAnthropic النماذج واسعة النطاق، لكن المطورين العاديين يعتمدون على أدوات يسهل الوصول إليها. تعمل منصة Ultralytics على تبسيط دورة حياة البيانات للمدخلات البصرية، حيث توفر تعليقاً توضيحياً للبيانات آلياً وإمكانات تدريب نماذج سلسة. مع تطور النماذج نحو بنى الرؤية واللغة والعمل (VLA) الموحدة، سيستمر الجمع بين أنظمة الرؤية الفعالة وتجميع الإجراءات القوي في تحديد الجيل القادم من الأتمتة الذكية.






