تجميع النماذج هو نهج للتعلم الآلي (ML) حيث يتم الجمع بين عدة نماذج فردية بشكل استراتيجي لإنتاج مخرجات تنبؤية واحدة، غالباً ما تكون متفوقة. فبدلاً من الاعتماد على نموذج واحد، تستفيد المجموعة من الذكاء الجماعي للعديد من النماذج، بهدف تحسين الأداء العام وتعزيز المتانة وتقليل احتمالية إجراء تنبؤات ضعيفة بسبب نقاط الضعف في أي نموذج واحد. تُعد هذه التقنية حجر الزاوية في الذكاء الاصطناعي الحديث ويتم تطبيقها على نطاق واسع في مجالات مختلفة، بما في ذلك الرؤية الحاسوبية. يندرج تجميع النماذج تحت فئة أوسع من أساليب التجميع.
كيفية عمل المجموعات النموذجية
تكمن الفكرة الأساسية وراء تجميع النماذج في أنه من خلال الجمع بين نماذج متنوعة - نماذج مدربة بشكل مختلف أو باستخدام خوارزميات مختلفة - قد تلغي الأخطاء الفردية التي ارتكبتها كل منها الأخرى، مما يؤدي إلى تنبؤ نهائي أكثر دقة وموثوقية. تتضمن الاستراتيجيات الشائعة للجمع بين مخرجات النماذج ما يلي:
- حساب المتوسط/التصويت: بالنسبة لمهام الانحدار، يتم حساب متوسط التنبؤات من النماذج الفردية. بالنسبة لمهام التصنيف، يتم تحديد التنبؤ النهائي عن طريق التصويت بالأغلبية (التصويت الصعب) أو عن طريق حساب متوسط الاحتمالات المتوقعة (التصويت الناعم).
- التجميع (تجميع التمهيد): يتم تدريب نماذج متعددة من نفس النموذج الأساسي(أشجار القرار، على سبيل المثال) بشكل مستقل على مجموعات فرعية عشوائية مختلفة من بيانات التدريب. تعد خوارزمية الغابة العشوائية مثالاً كلاسيكيًا على التجميع.
- التعزيز: يتم تدريب النماذج بالتتابع، حيث يركز كل نموذج جديد على تصحيح الأخطاء التي ارتكبتها النماذج السابقة. ومن الأمثلة على ذلك AdaBoost و Gradient Boosting و XGBoost.
- التكديس: تُستخدم التنبؤات من عدة نماذج أساسية مختلفة (على سبيل المثال، نموذج SVM، وشبكة عصبية، ونموذج k-Nearest Neighbours ) كميّزات مدخلات ل "نموذج تلوي" نهائي (غالباً ما يكون نموذجاً أبسط مثل الانحدار اللوجستي) يتعلم كيفية الجمع بين هذه التنبؤات على أفضل وجه.
في سياق التعلّم العميق، قد تتضمن المجموعات الجمع بين النماذج ذات البنى المختلفة (مثل CNN وViT Transformer (ViT))، أو النماذج المدرّبة باستخدام معلمات فائقة مختلفة، أو النماذج المدرّبة على مجموعات فرعية مختلفة من البيانات. كما يمكن أن تكون تقنيات مثل حفظ نقاط التحقق من النماذج في مراحل زمنية مختلفة وتجميعها (تجميع اللقطات) فعالة أيضًا.
تجميع النماذج مقابل طرق التجميع
وعلى الرغم من ارتباط هذه المصطلحات ببعضها البعض بشكل وثيق، إلا أن لها فروقاً دقيقة مختلفة قليلاً.
- أساليب التجميع: يشير هذا إلى الفئة العريضة من التقنيات أو الخوارزميات (مثل التجميع والتعزيز والتكديس) المستخدمة لإنشاء ودمج نماذج متعددة. إنها المنهجية
- مجموعة النماذج: يشير هذا عادةً إلى المجموعة المحددة من النماذج التي تم دمجها باستخدام طريقة التجميع. وهو النموذج المركب الناتج نفسه.
بشكل أساسي، أنت تستخدم طرق المجموعة لإنشاء مجموعة نماذج.
الفوائد والاعتبارات
يوفر استخدام مجموعات النماذج مزايا كبيرة:
- تحسين الأداء: غالبًا ما تحقق التجميعات دقة أعلى وتعميمًا أفضل من أي نموذج مكوّن منفرد، وكثيرًا ما تفوز بمسابقات التعلم الآلي.
- زيادة المتانة: من خلال حساب متوسط انحيازات أو أخطاء النماذج الفردية، تكون المجموعات أقل حساسية للقيم المتطرفة أو الضوضاء في البيانات وأقل عرضة للإفراط في التكييف.
- الحد من الأخطاء: يساعد الجمع بين نماذج متنوعة على التخفيف من مخاطر الاعتماد على نموذج واحد معيب.
ومع ذلك، هناك اعتبارات:
- زيادة التعقيد: إن تدريب وإدارة ونشر نماذج متعددة أكثر تعقيداً بطبيعته من التعامل مع نموذج واحد. يصبح نشر النموذج أكثر تعقيداً.
- تكلفة حسابية أعلى: يتطلب تدريب نماذج متعددة موارد حاسوبية أكثر (CPU/GPU) والوقت. يمكن أن يكون الاستدلال أبطأ أيضًا حيث يجب حساب التنبؤات من جميع النماذج الأساسية ودمجها.
- قابلية التفسير: قد يكون فهم سبب قيام المجموعة بتنبؤ معين أكثر صعوبة من تفسير نموذج واحد أبسط، على الرغم من أن تقنيات الذكاء الاصطناعي القابل للتفسير (XAI) آخذة في التطور.
يمكن أن تساعد المنصات مثل Ultralytics HUB في إدارة تعقيدات التدريب وتتبع النماذج المتعددة، مما قد يسهل إنشاء مجموعات فعالة.
التطبيقات الواقعية
تُستخدم مجموعات النماذج على نطاق واسع في مختلف المجالات:
- اكتشاف الأجسام في الرؤية الحاسوبية: في مهام مثل القيادة الذاتية أو المراقبة الأمنية، نماذج مختلفة للكشف عن الأجسام (على سبيل المثال، إصدارات مختلفة من Ultralytics YOLO مثل YOLOv8 و YOLOv10، أو نماذج مثل RT-DETR) يمكن تجميعها. على سبيل المثال، يمكن أن يؤدي الجمع بين النماذج التي تم تدريبها على تعزيزات مختلفة أو في مراحل مختلفة من التدريب( يمكن اعتبارتعزيز وقت الاختبار شكلاً من أشكال التجميع) إلى تحسين دقة الكشف ومتانته في الظروف الصعبةYOLOv5 دليل تجميع نماذجYOLOv5 ).
- التشخيص الطبي: يمكن للمجموعات أن تجمع بين تنبؤات من نماذج مختلفة تحلل الصور الطبية (مثل الأشعة السينية أو التصوير بالرنين المغناطيسي) أو بيانات المريض. قد يتفوق أحد النماذج في اكتشاف حالات شاذة معينة، بينما يتفوق نموذج آخر في نماذج مختلفة. يمكن أن يؤدي تجميعها إلى أداة تشخيصية أكثر موثوقية، وهو أمر بالغ الأهمية لتطبيقات مثل الكشف عن الأورام.
- التنبؤ المالي: غالبًا ما ينطوي التنبؤ بأسعار الأسهم أو مخاطر الائتمان على درجة عالية من عدم اليقين. يمكن أن يوفر تجميع النماذج المدربة على نوافذ بيانات تاريخية مختلفة أو باستخدام مؤشرات اقتصادية مختلفة تنبؤات أكثر استقرارًا ودقة من أي نموذج تنبؤي واحد. استكشف المزيد عن الذكاء الاصطناعي في المجال المالي.
- مراقبة جودة التصنيع: يمكن أن يؤدي الجمع بين النماذج التي تفحص المنتجات من زوايا مختلفة أو تركز على أنواع مختلفة من العيوب إلى إنشاء نظام فحص جودة أكثر شمولاً من نموذج رؤية واحد(الرؤية الحاسوبية في التصنيع).
يعد تجميع النماذج أسلوبًا قويًا لدفع حدود أداء أنظمة تعلّم الآلة، مما يجعلها أداة قيّمة في مجموعة أدوات مطوري الذكاء الاصطناعي.