مسرد المصطلحات

التحقق التبادلي

اكتشف قوة التحقق التبادلي في التعلم الآلي لتعزيز دقة النموذج، ومنع الإفراط في التخصيص، وضمان الأداء القوي.

التحقق التبادلي هو أسلوب قوي لتقييم النماذج في التعلّم الآلي (ML) يُستخدم لتقييم كيفية تعميم نتائج التحليل الإحصائي على مجموعة بيانات مستقلة. وهو عبارة عن إجراء إعادة أخذ عينات تُستخدم لتقييم نماذج التعلّم الآلي على عينة بيانات محدودة. والهدف الأساسي من ذلك هو منع الإفراط في التكييف، حيث يتعلم النموذج بيانات التدريب بشكل جيد لدرجة أن أداءه ضعيف على البيانات الجديدة غير المرئية. من خلال محاكاة كيفية أداء النموذج في العالم الحقيقي، يوفر التحقق المتقاطع تقديرًا أكثر قوة وموثوقية لأداء النموذج.

كيفية عمل التحقق التبادلي

الطريقة الأكثر شيوعًا للتحقق التبادلي هي عملية التحقق التبادلي K-Fold Cross-Validation. تتضمن هذه العملية تقسيم مجموعة بيانات واحدة إلى أجزاء متعددة:

  1. تقسيم البيانات: يتم تقسيم مجموعة بيانات التدريب بالكامل عشوائيًا إلى مجموعات فرعية متساوية الحجم "k" أو "طيّات".
  2. التدريب والتحقق التكراري: يتم تدريب النموذج 'k' مرات. في كل تكرار، يتم الاحتفاظ بواحدة من الطيات كمجموعة التحقق من الصحة، ويتم تدريب النموذج على الطيات المتبقية k-1.
  3. تقييم الأداء: يتم تقييم أداء النموذج على الطية المحتجزة. يتم تسجيل المقاييس الرئيسية، مثل الدقة أو متوسط متوسط الدقة (mAP)، لكل تكرار.
  4. حساب متوسط النتائج: بعد الانتهاء من جميع التكرارات "k"، يتم حساب متوسط مقاييس الأداء لإنتاج تقدير واحد أكثر استقرارًا لفعالية النموذج.

يضمن هذا النهج أن تكون كل نقطة بيانات في مجموعة التحقق من الصحة مرة واحدة بالضبط وفي مجموعة التدريب k-1 مرات. يمكن العثور على دليل مفصّل حول التنفيذ في دليل التحقق التبادلي K-Fold Cross-Validation الخاص بـ Ultralytics.

التحقق التبادلي مقابل التقسيم البسيط للتحقق البسيط

في مشروع نموذجي لتعلّم الآلة يتم تقسيم البيانات في مشروع نموذجي لتعلّم الآلة إلى مجموعات تدريب وتحقق واختبار.

يمكن أن يكون التقسيم البسيط للتدريب/التحقق من الصحة مضللاً في بعض الأحيان إذا كانت مجموعة التحقق من الصحة تحتوي بالصدفة على عينات سهلة أو صعبة بشكل خاص. تتغلب عملية التحقق التبادلي على هذا الأمر باستخدام كل جزء من مجموعة البيانات للتدريب والتحقق من الصحة، مما يوفر مقياسًا أكثر موثوقية لقدرة النموذج على التعميم. وهذا يجعله مفيدًا بشكل خاص عندما تكون كمية البيانات المتاحة محدودة. توفر أطر العمل الشائعة مثل Scikit-learn تطبيقات قوية لتقنيات التحقق التبادلي.

التطبيقات الواقعية

لا غنى عن التحقق المتبادل في بناء أنظمة ذكاء اصطناعي يمكن الاعتماد عليها في مختلف المجالات:

  1. تحليل الصور الطبية: عند تطوير الشبكة العصبية التلافيفية (CNN) لتحليل الصور الطبية، مثل الكشف عن الأورام في فحوصات الدماغ باستخدام مجموعات بيانات مثل مجموعة بيانات أورام الدماغ، تُستخدم السيرة الذاتية لتقييم دقة تشخيص النموذج وتعميمه بدقة عبر بيانات المرضى المتنوعة. هذا التقييم القوي أمر بالغ الأهمية قبل التفكير في إجراء تجارب سريرية أو السعي للحصول على موافقة الجهات التنظيمية مثل إدارة الغذاء والدواء الأمريكية.
  2. المركبات ذاتية القيادة: بالنسبة لنماذج الكشف عن الأجسام مثل Ultralytics YOLO المستخدمة في المركبات ذاتية القيادة، تساعد السيرة الذاتية على ضمان الأداء الموثوق به في اكتشاف المشاة وراكبي الدراجات والمركبات الأخرى في مختلف الظروف البيئية. يعد هذا التحقق من الصحة على مجموعات البيانات المعقدة مثل Argoverse أمرًا بالغ الأهمية قبل نشر النموذج في الأنظمة ذات الأهمية الحرجة للسلامة مثل تلك الموجودة في حلول الذكاء الاصطناعي في السيارات.

وتشمل التطبيقات الأخرى تقييم النماذج لتجزئة الصور، ومهام معالجة اللغة الطبيعية (NLP) مثل تحليل المشاعر، وتقييم المخاطر في النمذجة المالية. يمكن أن تساعد المنصات مثل Ultralytics HUB في إدارة التجارب والقطع الأثرية التي يتم إنتاجها أثناء تقنيات التقييم هذه، مما يؤدي إلى تبسيط دورة حياة التطوير.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون ونمو مع المبتكرين العالميين

انضم الآن
تم نسخ الرابط إلى الحافظة