Yolo فيجن شنتشن
شنتشن
انضم الآن
مسرد المصطلحات

تجميع النماذج

عزز دقة النموذج وقوته باستخدام مجموعات النماذج. استكشف تقنيات مثل التجميع والتعزيز والتراص والتطبيقات الواقعية.

مجموعة النماذج هي تقنية متطورة في التعلم الآلي (ML) حيث يتم دمج تنبؤات من عدة نماذج مستقلة لتوليد مخرجات نهائية واحدة متفوقة. بدلاً من الاعتماد على على قدرة خوارزمية واحدة على اتخاذ القرار، تستفيد المجموعة من مبدأ "حكمة الجمهور" من أجل لتحسين الدقة والاستقرار بشكل عام. من خلال تجميع نتائج النماذج المتنوعة، يمكن للمهندسين أن يقللوا بشكل كبير من مخاطر الإفراط في ملاءمة مجموعة التدريب وإنشاء أنظمة أكثر قوة ضد الضوضاء في بيانات التدريب. كثيراً ما يُستخدم هذا النهج في لتحقيق أحدث النتائج في البيئات التنافسية مثل مسابقات Kaggle.

آليات التعلم الجماعي

تتوقف فعالية مجموعة النماذج على تنوع الأجزاء المكونة لها. إذا كانت جميع النماذج متشابهة متطابقة، فإن الجمع بينها لا يقدم أي تحسن. لذلك، غالباً ما يقوم الممارسون بإدخال التنوع من خلال تنويع بنية الشبكة العصبية، باستخدام مختلفة من البيانات، أو تطبيق استراتيجيات استراتيجيات مختلفة لزيادة البيانات.

هناك ثلاث طرق أساسية لبناء المجموعات:

  • التجميع (تجميع التمهيد): يتضمن ذلك تدريب إصدارات متعددة من نفس النموذج، مثل مثل شجرة القرارات، على عينات عشوائية مختلفة من عشوائية مختلفة من مجموعة البيانات. المثال الكلاسيكي هو خوارزمية الغابة العشوائية، والتي تقوم بتجميع متوسط تنبؤات العديد من الأشجار لتخفيف التباين، كما هو مفصّل في وثائق وثائق مجموعة Scikit-learn.
  • التعزيز: في هذه التقنية التكرارية، يتم تدريب النماذج بالتتابع. يركز كل نموذج جديد على تصحيح الأخطاء التي ارتكبتها النماذج السابقة. التطبيقات الشائعة مثل XGBoost و LightGBM تستخدم هذه الطريقة لتحويل المتعلمين الضعفاء إلى نموذج مركب عالي الدقة.
  • التكديس: يقوم هذا النهج المتقدم بتدريب "المتعلم الفوقي" على الجمع بين تنبؤات العديد من النماذج الأساسية المختلفة، مثل الجمع بين آلة دعم المتجهات الداعمة (SVM) مع نموذج نموذج تعلّم عميق. يقوم المتعلم الفوقي بتحسين كيفية ترجيح رأي كل خبير لتقليل دالة الخسارة النهائية دالة الخسارة النهائية.

تطبيقات واقعية

تُعد مجموعات النماذج محورية في الصناعات التي تكون فيها الدقة حاسمة وتكلفة الخطأ عالية.

  1. تحليل الصور الطبية: يتطلب تشخيص الحالات المعقدة في كثير من الأحيان تحليل الأنماط الدقيقة في في بيانات التصوير. قد يستخدم النظام التشخيصي مجموعة نماذج تجمع بين الشبكة العصبية التلافيفية (CNN) المتخصصة في تحليل النسيج مع محول الرؤية (ViT) الذي يتفوق في في فهم السياق العالمي. يساعد هذا المزيج في الكشف عن الأورام في التصوير الطبي بحساسية أعلى مما يمكن أن تحققه أي بنية منفردة.
  2. الأنظمة المستقلة: بالنسبة لـ المركبات ذاتية القيادة، يجب أن تكون أنظمة الإدراك أن تكون آمنة من الفشل. غالباً ما يقوم المهندسون بتشغيل مجموعة من من نماذج اكتشاف الأجسام - على سبيل المثال، دمج قدرات عالية السرعة من YOLO11 مع الدقة القائمة على المحولات RT-DETR. وهذا يضمن أن اكتشاف المشاة أو العوائق حتى إذا كان أحد النماذج يعاني من إضاءة أو انسداد معين.

المجموعة مقابل خليط الخبراء (MoE)

من المهم التفريق بين مجموعة النماذج القياسية و خليط الخبراء (MoE). بينما يستخدم كلاهما نماذج فرعية متعددة، إلا أنهما يعملان بشكل مختلف أثناء الاستدلال:

  • مجموعة النماذج: عادةً ما تستعلم عن كل نموذج في المجموعة لكل مدخلات وتدمج النتائج. هذا يزيد من الدقة ولكن يزيد من زمن الاستنتاج والتكلفة الحسابية.
  • مزيج من الخبراء: يستخدم شبكة بوابات لتوجيه البيانات إلى عدد قليل من "الخبراء" المحددين فقط (النماذج الفرعية) الأنسب للمدخلات الحالية. يسمح ذلك بقابلية التوسع الهائل في نماذج الأساس مثل محولات التبديل دون العقوبة الحسابية لتشغيل كل معلمة لكل رمز.

تنفيذ المجموعات مع Ultralytics

في حين أن المكتبات مثل PyTorch تسمح بتجميع معقد المعقدة، يمكنك تحقيق مجموعة أساسية للاستدلال ببساطة عن طريق تحميل نماذج متعددة ومعالجة نفس المدخلات. يوضّح المثال التالي كيفية تحميل نموذجين مختلفين من نماذج YOLO باستخدام ultralytics الحزمة.

from ultralytics import YOLO

# Load two different model variants to create a diverse ensemble
model_a = YOLO("yolo11n.pt")  # Nano model
model_b = YOLO("yolo11s.pt")  # Small model

# Perform inference on an image with both models
# In a production ensemble, you would merge these results (e.g., via NMS)
results_a = model_a("https://ultralytics.com/images/bus.jpg")
results_b = model_b("https://ultralytics.com/images/bus.jpg")

print(f"Model A detections: {len(results_a[0].boxes)}")
print(f"Model B detections: {len(results_b[0].boxes)}")

يتطلب تنفيذ المجموعات دراسة متأنية لـ موارد MLOps، حيث أن نشر نماذج متعددة يزيد من استخدام الذاكرة. ومع ذلك، بالنسبة للمهام التي تتطلب أعلى أداء ممكن في رؤية الكمبيوتر (CV)، غالبًا ما تكون المفاضلة مبررة.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن