Task Vectors
تعرف على كيفية تُمكّن متجهات المهام (task vectors) من دمج النماذج وتوجيه السلوك بكفاءة. اكتشف كيفية معالجة أوزان Ultralytics YOLO26 للقيام بمهام متعددة بدون أمثلة (zero-shot).
تمثل متجهات المهام التغييرات المحددة التي تم إجراؤها على أوزان الشبكة العصبية أثناء الضبط الدقيق لتحقيق قدرة جديدة. من خلال طرح معلمات نموذج أساسي تأسيسي من معلمات نموذج تم ضبطه بدقة، يمكن للباحثين عزل متجه اتجاهي في مساحة الأوزان يغلف السلوك المكتسب لتلك المهمة المحددة. يسمح هذا النهج للمطورين بتطبيق عمليات حسابية بسيطة على معلمات النموذج لتوجيه أو تعديل أو دمج سلوكيات النموذج دون الحاجة إلى موارد حوسبة إضافية للتدريب.
كيف تختلف متجهات المهام عن التعلم بنقل المعرفة
بينما يتضمن مفهوم التعلم بنقل المعرفة تدريب نموذج بشكل تسلسلي على مجموعة بيانات جديدة لتكييف معرفته الحالية، تعمل متجهات المهام مباشرة على الأوزان الهيكلية للنموذج بعد التدريب. بدلاً من إعادة تدريب التدرجات لتعلم نطاق جديد، يسمح استيفاء مساحة الوزن باستخدام متجهات المهام للممارسين بدمج فروق الأوزان خطياً من نماذج متعددة تم تدريبها بشكل مستقل. يتيح ذلك دمج النماذج بدون تدريب مسبق (zero-shot)، مما يسمح لنموذج واحد بوراثة قدرات متعددة في وقت واحد دون العبء الحسابي المعتاد أثناء التدريب.
تطبيقات العالم الحقيقي
أدت القدرة على معالجة نماذج التعلم العميق جبرياً إلى العديد من التطبيقات المؤثرة عبر خطوط أنابيب الذكاء الاصطناعي الحديثة:
- دمج نماذج المهام المتعددة: يمكن للمهندسين دمج متجه مهمة تم تحسينه لـ كشف الأشياء مع متجه آخر تم تدريبه لـ تجزئة الصور. عند تطبيقه على نموذج أساسي من Ultralytics YOLO26، يخلق هذا بنية مزدوجة الغرض تتفوق في كلتا المهمتين في وقت واحد، مع الحفاظ على نقاط القوة لكل ضبط دقيق أصلي.
- إلغاء التعلم الآلي وسلامة الذكاء الاصطناعي: إذا كان النموذج يظهر مخرجات متحيزة أو خطيرة، يمكن للباحثين حساب متجه مهمة يمثل هذا السلوك غير المرغوب فيه تحديداً. ومن خلال طرح هذا المتجه من أوزان النموذج، يمكنهم "محو" السلوك بفعالية، مما يساهم بشكل كبير في تحسين معايير سلامة الذكاء الاصطناعي وأخلاقيات الذكاء الاصطناعي القوية.
- تكييف النطاق في رؤية الحاسوب: عند تكييف النماذج لبيئات محددة - مثل الانتقال من الاستنتاج في الوقت الفعلي أثناء النهار إلى الليل - تسمح متجهات المهام للمستخدمين بتوسيع نطاق التكييف. يمكن أن يؤدي تطبيق جزء من المتجه (على سبيل المثال، عامل تحجيم قدره 0.5) إلى إنتاج نموذج متوازن يعمل بشكل جيد في كلا النطاقين.
العمل باستخدام متجهات المهام في PyTorch
يتطلب إنشاء وتطبيق متجه مهمة الوصول إلى قاموس حالة PyTorch ومعالجته. يوضح المثال التالي كيفية استخراج متجه مهمة من نموذج YOLO26 تم ضبطه بدقة وتطبيقه مرة أخرى على النموذج الأساسي باستخدام عامل تحجيم محدد.
from ultralytics import YOLO
# Load the state dictionaries for the base and fine-tuned models
base_weights = YOLO("yolo26n.pt").model.state_dict()
tuned_weights = YOLO("yolo26n-custom.pt").model.state_dict()
# Calculate the task vector (tuned weights minus base weights)
task_vector = {k: tuned_weights[k] - base_weights[k] for k in base_weights.keys()}
# Apply the task vector to the base model using a 0.5 scaling factor
for k in base_weights.keys():
base_weights[k] += 0.5 * task_vector[k]مستقبل معالجة الأوزان
مع نمو بنى مثل نماذج اللغة الكبيرة ومحولات الرؤية الضخمة في عدد المعلمات، يصبح إعادة تدريبها لكل تعديل بسيط غير مجدٍ اقتصادياً. توفر متجهات المهام بديلاً أنيقاً رياضياً لـ تحسين النموذج بعد التدريب. من خلال مشاركة متجهات مهام خفيفة الوزن بدلاً من نماذج كاملة بحجم جيجابايت، يمكن لمجتمع الذكاء الاصطناعي تسريع التعاون مفتوح المصدر في الذكاء الاصطناعي. بمجرد صقل متجهات المهام المخصصة الخاصة بك، فإن استخدام منصة Ultralytics يبسط عمليات نشر النموذج والمراقبة اللاحقة، مما يضمن ترجمة أوزانك المحسنة مباشرة إلى نقاط نهاية جاهزة للإنتاج.






