استعدوا لـ YOLO Vision 2025!
25 سبتمبر، 2025
10:00 — 18:00 بتوقيت بريطانيا الصيفي
حدث هجين
مؤتمر Yolo Vision 2024
مسرد المصطلحات

التحقق المتبادل

اكتشف قوة التحقق المتبادل (cross-validation) في تعلم الآلة لتحسين دقة النموذج ومنع فرط التخصيص (overfitting) وضمان أداء قوي.

التحقق التقاطعي (Cross-Validation) هو أسلوب قوي لتقييم النماذج في التعلم الآلي (ML) يُستخدم لتقدير مدى تعميم نتائج التحليل الإحصائي على مجموعة بيانات مستقلة. وهو إجراء لإعادة الت sampling يُستخدم لتقييم نماذج التعلم الآلي على عينة بيانات محدودة. الهدف الأساسي هو منع التجاوز في التوفيق (overfitting)، حيث يتعلم النموذج بيانات التدريب جيدًا لدرجة أنه يؤدي أداءً ضعيفًا على بيانات جديدة غير مرئية. من خلال محاكاة كيفية أداء النموذج في العالم الحقيقي، يوفر التحقق التقاطعي تقديرًا أكثر قوة وموثوقية لأداء النموذج.

كيف يعمل التحقق المتبادل (Cross-Validation)؟

الطريقة الأكثر شيوعًا للتحقق المتبادل هي التحقق المتبادل K-Fold. تتضمن هذه العملية تقسيم مجموعة بيانات واحدة إلى أجزاء متعددة:

  1. تقسيم البيانات: يتم تقسيم مجموعة بيانات التدريب بأكملها عشوائيًا إلى 'k' من المجموعات الفرعية متساوية الحجم، أو "طيات".
  2. التدريب والتحقق التكراري: يتم تدريب النموذج 'k' مرة. في كل تكرار، يتم الاحتفاظ بأحد الطيات كمجموعة تحقق، ويتم تدريب النموذج على الطيات المتبقية k-1.
  3. تقييم الأداء: يتم تقييم أداء النموذج على الجزء المحجوز. يتم تسجيل المقاييس الرئيسية، مثل الدقة أو متوسط الدقة المتوسطة (mAP)، لكل تكرار.
  4. متوسط النتائج: بعد إكمال جميع التكرارات 'k'، يتم حساب متوسط مقاييس الأداء لإنتاج تقدير واحد أكثر استقرارًا لفعالية النموذج.

يضمن هذا النهج وجود كل نقطة بيانات في مجموعة التحقق مرة واحدة بالضبط وفي مجموعة التدريب k-1 مرة. يمكن العثور على دليل مفصل حول التنفيذ في دليل Ultralytics للتحقق المتقاطع K-Fold.

التحقق التقاطعي مقابل تقسيم التحقق البسيط

في مشروع تعلم آلي (ML) نموذجي، يتم تقسيم البيانات إلى مجموعات تدريب وتقييم واختبار.

قد يكون تقسيم التدريب/التحقق البسيط مضللاً في بعض الأحيان إذا كانت مجموعة التحقق، عن طريق الصدفة، تحتوي على عينات سهلة أو صعبة بشكل خاص. يتغلب التحقق المتبادل على ذلك باستخدام كل جزء من مجموعة البيانات لكل من التدريب والتحقق، مما يوفر مقياسًا أكثر موثوقية لقدرة النموذج على التعميم. وهذا يجعله مفيدًا بشكل خاص عندما تكون كمية البيانات المتاحة محدودة. توفر الأطر الشائعة مثل Scikit-learn عمليات تنفيذ قوية لتقنيات التحقق المتبادل.

تطبيقات واقعية

لا غنى عن التحقق المتبادل في بناء أنظمة ذكاء اصطناعي يمكن الاعتماد عليها عبر مختلف المجالات:

  1. تحليل الصور الطبية: عند تطوير شبكة عصبية تلافيفية (CNN) لتحليل الصور الطبية، مثل اكتشاف الأورام في فحوصات الدماغ باستخدام مجموعات بيانات مثل مجموعة بيانات أورام الدماغ، يتم استخدام التحقق المتبادل (CV) لتقييم دقة التشخيص وتعميم النموذج بدقة عبر بيانات المرضى المتنوعة. هذا التقييم القوي أمر بالغ الأهمية قبل التفكير في التجارب السريرية أو الحصول على الموافقة التنظيمية من هيئات مثل إدارة الغذاء والدواء (FDA).
  2. المركبات ذاتية القيادة: بالنسبة إلى نماذج اكتشاف الأجسام مثل Ultralytics YOLO المستخدمة في المركبات ذاتية القيادة، تساعد الرؤية الحاسوبية (CV) في ضمان أداء موثوق به في اكتشاف المشاة وراكبي الدراجات والمركبات الأخرى عبر الظروف البيئية المختلفة. يُعد هذا التحقق من الصحة على مجموعات البيانات المعقدة مثل Argoverse أمرًا بالغ الأهمية قبل نشر النموذج في الأنظمة بالغة الأهمية للسلامة مثل تلك الموجودة في حلول الذكاء الاصطناعي في مجال السيارات.

تشمل التطبيقات الأخرى تقييم النماذج لـ تجزئة الصور، ومهام معالجة اللغة الطبيعية (NLP) مثل تحليل المشاعر، وتقييم المخاطر في النماذج المالية. يمكن أن تساعد منصات مثل Ultralytics HUB في إدارة التجارب والنتائج التي تم إنتاجها أثناء تقنيات التقييم هذه، مما يبسط دورة حياة التطوير.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن
تم نسخ الرابط إلى الحافظة