Task Arithmetic
اكتشف كيف يستخدم حساب المهام (task arithmetic) تحديثات الأوزان لتعديل سلوك النموذج. تعلم دمج المهام أو إلغاء تعلم الميزات في Ultralytics YOLO26 دون إعادة تدريب كاملة.
يعد حساب المهام تقنية متقدمة في تعلم الآلة تتضمن تعديل سلوك الشبكات العصبية المدربة مسبقاً عن طريق إضافة أو طرح تحديثات محددة للأوزان. بدلاً من إعادة تدريب النموذج بالكامل من الصفر، يمكن للممارسين عزل الاختلافات التي تم تعلمها بين نموذج أساسي ونموذج تم ضبطه بدقة. هذه الاختلافات هي في جوهرها تحديثات اتجاهية تجسد قدرة أو سلوكاً معيناً. ومن خلال تطبيق عمليات رياضية أساسية مثل الجمع والطرح على هذه التحديثات، يمكن للمطورين تعديل أنظمة التعلم العميق بشكل ديناميكي. لقد اكتسب هذا النموذج زخماً كبيراً في أبحاث arXiv الأخيرة حول حساب المهام، مما يوفر طريقة خفيفة وفعالة حسابياً لتكييف النماذج واسعة النطاق مع المتطلبات الجديدة.
Link to this sectionكيف يعمل المفهوم#
يعتمد أساس هذه التقنية على حساب الفرق في أوزان النموذج بين نموذج أساسي مدرب مسبقاً ونسخة خضعت لـ ضبط دقيق على مجموعة بيانات معينة. يصبح هذا الفرق المعزول تمثيلاً محلياً للمهارة الجديدة. من خلال معالجة قواميس حالة PyTorch مباشرة أو استخدام منهجيات تدريب TensorFlow، يمكن للمهندسين قياس ودمج فروق الأوزان هذه. على سبيل المثال، يمكن أن يؤدي طرح تحديث معين للوزن إلى إجبار النموذج على "نسيان" سلوك تم تعلمه، وهو مفهوم تم استكشافه بكثافة في أبحاث Anthropic حول سلامة النماذج.
Link to this sectionتطبيقات العالم الحقيقي#
يفتح حساب المهام العديد من سير العمل عالية الكفاءة في خطوط أنابيب الرؤية الحاسوبية ومعالجة اللغات الطبيعية الحديثة:
- دمج قدرات المهام المتعددة: يمكن للمهندسين تدريب نموذج أساسي من Ultralytics YOLO26 على مجموعتي بيانات منفصلتين بشكل مستقل - واحدة لـ اكتشاف الكائنات المتخصصة والأخرى لـ تصنيف الصور. ومن خلال حساب فروق الأوزان لكلا المهمتين وإضافتها مرة أخرى إلى النموذج الأساسي، يمكن للشبكة الناتجة تنفيذ كلتا المهمتين في وقت واحد دون التعرض للنسيان الكارثي.
- التعلم المستهدف لسلامة الذكاء الاصطناعي: إذا تعلم نموذج رؤية ميزات متحيزة عن غير قصد من بيانات تدريبه، فيمكن للباحثين ضبط نسخة دقيقة على البيانات المتحيزة، واستخراج فروق الأوزان المحددة، وطرحها من النموذج الأصلي. وكما لوحظ في العديد من اكتشافات Google DeepMind، فإن هذا يمحو السلوك غير المرغوب فيه بفعالية مع الحفاظ على قدرات الذكاء الاصطناعي العامة للنموذج.
Link to this sectionالتمييز بين المفاهيم ذات الصلة#
أثناء تصفح أرشيفات IEEE Xplore أو مكتبة ACM الرقمية، من السهل الخلط بين حساب المهام والمنهجيات ذات الصلة:
- متجهات المهام: هذه هي الموترات الرياضية الفعلية (فروق الأوزان المحسوبة) المستخدمة أثناء عملية الحساب. حساب المهام هو الإطار الشامل لإضافة أو طرح هذه المتجهات.
- دمج النماذج: هذا مصطلح أوسع لدمج نماذج متعددة. في حين أن الحساب هو إحدى طرق دمج النماذج، يمكن أن يتضمن الدمج أيضاً شبكات توجيه معقدة أو تجميع نماذج.
- التعلم بالنقل: وفقاً لـ مفاهيم التعلم بالنقل على Wikipedia، يتضمن ذلك استخدام المعرفة من مهمة واحدة كنقطة انطلاق لأخرى، وهو ما يتطلب عادةً دورات تدريبية إضافية. يقوم حساب المهام بتعديل السلوكيات محض من خلال حسابات الأوزان المباشرة دون دورات تدريبية إضافية.
Link to this sectionتنفيذ العمليات الحسابية#
يتطلب تطبيق استراتيجيات تحسين النماذج هذه عملياً إدارة دقيقة للحالة الداخلية للنموذج. فيما يلي مثال لحساب وتطبيق تحديث باستخدام PyTorch، وهي تقنية تُناقش بشكل متكرر في أوراق الرؤية الحاسوبية الحديثة.
import torch
# Load the state dictionaries of the pre-trained base and fine-tuned models
base_weights = torch.load("yolo26_base.pt")
tuned_weights = torch.load("yolo26_tuned.pt")
# Calculate the task vector and add it back to the base model with a scaling factor
scaling_factor = 0.5
for key in base_weights.keys():
task_vector = tuned_weights[key] - base_weights[key]
base_weights[key] += scaling_factor * task_vectorبالنسبة للفرق التي تدير خطوط أنابيب تعليق البيانات المعقدة وإصدارات متعددة من النماذج التي تم ضبطها بدقة، توفر منصة Ultralytics بيئة انسيابية للإشراف على التدريب السحابي والنشر السلس، مما يجعل إدارة تحسينات النماذج التكرارية أكثر كفاءة بكثير.






