Model Soups
اكتشف كيف تعمل تقنية Model Soups على تحسين الدقة والقوة من خلال حساب متوسط أوزان نماذج Ultralytics YOLO. تعلم كيفية تعزيز الأداء دون زيادة زمن الانتقال.
تشير تقنية Model Soups إلى أسلوب تعلم آلي يتم فيه حساب متوسط أوزان شبكات عصبية متعددة، تم ضبطها بدقة من نفس النموذج الأساسي المدرب مسبقاً باستخدام معلمات تشعبية مختلفة، لإنشاء نموذج واحد أكثر قوة. يسمح هذا النهج للمطورين بتحسين الدقة العامة والتعميم دون زيادة التكلفة الحسابية أثناء الاستدلال.
عند ضبط نموذج بدقة، يقوم الممارسون عادةً بإجراء بحث واسع لـ ضبط المعلمات التشعبية للعثور على أفضل تكوين أداء. تقليدياً، يتم اختيار أفضل نموذج واحد ويتم التخلص من الباقي. ومع ذلك، فإن إنشاء نموذج soup يستفيد من الميزات المتنوعة التي تعلمتها جميع النماذج في البحث. من خلال حساب متوسط أوزان النموذج الخاصة بها مباشرة، غالباً ما يتفوق النموذج الناتج على أفضل نموذج فردي، مما يجمع بين نقاط قوتها بفعالية مع تقليل الإفراط في التجهيز. هذه العملية فعالة للغاية ويمكن إدارتها بسهولة داخل بيئات تعاونية مثل Ultralytics Platform.
Link to this sectionالتطبيقات الواقعية#
تعتبر تقنية Model Soups فعالة للغاية في السيناريوهات التي تكون فيها الموارد الحسابية مقيدة، ولكن هناك حاجة إلى دقة عالية وقوة متانة.
- رؤية المركبات ذاتية القيادة: عند نشر أنظمة اكتشاف الكائنات في السيارات ذاتية القيادة، يجب أن تتمتع النماذج بالقدرة على التعميم عبر ظروف الإضاءة والطقس المتنوعة. من خلال حساب متوسط نماذج متعددة تم تدريبها بزيادات بيانات ومعدلات تعلم متنوعة، ينشئ المهندسون soup قوية للغاية تحافظ على انخفاض زمن انتقال الاستدلال. وهذا يضمن بقاء سرعات المعالجة في الوقت الفعلي الضرورية لـ الملاحة الذاتية دون تأثر.
- التشخيص الطبي عبر الهاتف المحمول: في تطبيقات الذكاء الاصطناعي على الحافة، مثل تشغيل تصنيف الصور على الهواتف الذكية للفحص الجلدي الأولي، تكون الطاقة الحسابية محدودة للغاية. يوفر نموذج soup الدقة المعززة اللازمة للموثوقية السريرية مع ضمان ملاءمة البصمة النهائية بسهولة على أجهزة الحافة المحمولة دون استنزاف البطارية أو الحاجة إلى اتصال بالسحابة.
Link to this sectionالتمييز بين المفاهيم ذات الصلة#
للتنقل في مشهد تحسين التعلم العميق، من المهم التمييز بين Model Soups والتقنيات المماثلة:
- تجميع النماذج: يجمع التجميع بين توقعات (مخرجات) نماذج مستقلة متعددة. وبينما يحسن هذا الدقة، فإنه يتطلب تشغيل كل نموذج أثناء الاستدلال، مما يضاعف التكلفة الحسابية. تقوم تقنية Model Soups بحساب متوسط الأوزان قبل الاستدلال، مما يجعل التكلفة الحسابية مطابقة لنموذج واحد.
- دمج النماذج: هذا مصطلح أوسع لدمج النماذج التي ربما تم تدريبها على مهام أو مجموعات بيانات مختلفة تماماً. تُعد تقنية Model Soups مجموعة فرعية محددة من الدمج حيث تنشأ جميع النماذج من نفس البنية الأساسية المدربة مسبقاً بالضبط ويتم ضبطها بدقة على نفس المهمة المستهدفة.
Link to this sectionمثال على التنفيذ#
يتضمن إنشاء نموذج soup موحد الوصول إلى قاموس حالة PyTorch لنماذج مدربة متعددة وحساب متوسط موتراتها رياضياً. فيما يلي مثال موجز لكيفية تحقيق ذلك باستخدام سير عمل Ultralytics YOLO26 المدعوم أصلاً بواسطة إطار عمل PyTorch.
import torch
# Load the PyTorch state dictionaries from two fine-tuned YOLO26 models
model1 = torch.load("yolo26_run1.pt")["model"].state_dict()
model2 = torch.load("yolo26_run2.pt")["model"].state_dict()
# Create a uniform model soup by averaging the model weights
soup_dict = {key: (model1[key] + model2[key]) / 2.0 for key in model1.keys()}
# The resulting soup_dict can now be loaded into a new YOLO26 instanceمن خلال الاستفادة من هذه التقنية، يمكن لممارسي الرؤية الحاسوبية تعزيز مقاييس الأداء بسهولة مثل قدرات التعلم الصفرى والقوة العامة دون التضحية بسرعة النشر المطلوبة لهندسة الذكاء الاصطناعي الحديثة القائمة على الحافة.






