عزز دقة النموذج وقوته باستخدام مجموعات النماذج. استكشف تقنيات مثل التجميع والتعزيز والتراص والتطبيقات الواقعية.
مجموعة النماذج هي تقنية متطورة في التعلم الآلي (ML) حيث يتم دمج تنبؤات من عدة نماذج مستقلة لتوليد مخرجات نهائية واحدة متفوقة. بدلاً من الاعتماد على على قدرة خوارزمية واحدة على اتخاذ القرار، تستفيد المجموعة من مبدأ "حكمة الجمهور" من أجل لتحسين الدقة والاستقرار بشكل عام. من خلال تجميع نتائج النماذج المتنوعة، يمكن للمهندسين أن يقللوا بشكل كبير من مخاطر الإفراط في ملاءمة مجموعة التدريب وإنشاء أنظمة أكثر قوة ضد الضوضاء في بيانات التدريب. كثيراً ما يُستخدم هذا النهج في لتحقيق أحدث النتائج في البيئات التنافسية مثل مسابقات Kaggle.
تتوقف فعالية مجموعة النماذج على تنوع الأجزاء المكونة لها. إذا كانت جميع النماذج متشابهة متطابقة، فإن الجمع بينها لا يقدم أي تحسن. لذلك، غالباً ما يقوم الممارسون بإدخال التنوع من خلال تنويع بنية الشبكة العصبية، باستخدام مختلفة من البيانات، أو تطبيق استراتيجيات استراتيجيات مختلفة لزيادة البيانات.
هناك ثلاث طرق أساسية لبناء المجموعات:
تُعد مجموعات النماذج محورية في الصناعات التي تكون فيها الدقة حاسمة وتكلفة الخطأ عالية.
من المهم التفريق بين مجموعة النماذج القياسية و خليط الخبراء (MoE). بينما يستخدم كلاهما نماذج فرعية متعددة، إلا أنهما يعملان بشكل مختلف أثناء الاستدلال:
في حين أن المكتبات مثل PyTorch تسمح بتجميع معقد
المعقدة، يمكنك تحقيق مجموعة أساسية للاستدلال ببساطة عن طريق تحميل نماذج متعددة ومعالجة
نفس المدخلات. يوضّح المثال التالي كيفية تحميل نموذجين مختلفين من نماذج YOLO باستخدام
ultralytics الحزمة.
from ultralytics import YOLO
# Load two different model variants to create a diverse ensemble
model_a = YOLO("yolo11n.pt") # Nano model
model_b = YOLO("yolo11s.pt") # Small model
# Perform inference on an image with both models
# In a production ensemble, you would merge these results (e.g., via NMS)
results_a = model_a("https://ultralytics.com/images/bus.jpg")
results_b = model_b("https://ultralytics.com/images/bus.jpg")
print(f"Model A detections: {len(results_a[0].boxes)}")
print(f"Model B detections: {len(results_b[0].boxes)}")
يتطلب تنفيذ المجموعات دراسة متأنية لـ موارد MLOps، حيث أن نشر نماذج متعددة يزيد من استخدام الذاكرة. ومع ذلك، بالنسبة للمهام التي تتطلب أعلى أداء ممكن في رؤية الكمبيوتر (CV)، غالبًا ما تكون المفاضلة مبررة.