حسّن نماذج تعلم الآلة ببيانات التحقق لمنع التجاوز، وضبط المعلمات الفائقة، وضمان أداء قوي في العالم الحقيقي.
بيانات التحقق هي عينة من البيانات المحجوزة من عملية التدريب والتي تستخدم لتقديم تقييم غير متحيز لملاءمة النموذج أثناء ضبط المعلمات الفائقة الخاصة به. الدور الأساسي لمجموعة التحقق هو توجيه تطوير نموذج التعلم الآلي (ML) من خلال تقديم تقييم مستقل ومتكرر لأدائه. حلقة التغذية الراجعة هذه ضرورية لبناء نماذج لا تعمل بشكل جيد فقط على البيانات التي رأتها ولكنها تعمم أيضًا بشكل فعال على البيانات الجديدة غير المرئية، وهو مفهوم أساسي لإنشاء أنظمة الذكاء الاصطناعي (AI) القوية.
الغرض الرئيسي من بيانات التحقق هو منع الإفراط في التخصيص. يحدث الإفراط في التخصيص عندما يتعلم النموذج بيانات التدريب بشكل جيد للغاية، ويلتقط الضوضاء والتفاصيل التي لا تنطبق على البيانات الجديدة، وبالتالي يضر بأدائه. من خلال اختبار النموذج مقابل مجموعة التحقق على فترات منتظمة (على سبيل المثال، بعد كل حقبة (epoch))، يمكن للمطورين مراقبة خطأ التعميم الخاص به. إذا استمر الأداء في بيانات التدريب في التحسن بينما توقف الأداء في بيانات التحقق أو تدهور، فهذه علامة واضحة على الإفراط في التخصيص.
تعتبر عملية التقييم هذه ضرورية لـ ضبط المعلمات الفائقة (hyperparameter tuning). المعلمات الفائقة هي إعدادات التكوين الخارجية للنموذج، مثل معدل التعلم (learning rate) أو حجم الدفعة (batch size)، والتي لا يتم تعلمها من البيانات. تسمح مجموعة التحقق بالتجربة مع مجموعات مختلفة من المعلمات الفائقة للعثور على المجموعة التي تحقق أفضل أداء. هذه العملية التكرارية هي جزء أساسي من اختيار النموذج (model selection) وتحسينه.
في مشروع ML نموذجي، يتم تقسيم مجموعة البيانات إلى ثلاث مجموعات فرعية، وفهم أدوارها المتميزة أمر أساسي. يتمثل أحد الأساليب الشائعة لتقسيم البيانات في تخصيص 70٪ للتدريب و 15٪ للتحقق و 15٪ للاختبار.
يُعد الحفاظ على فصل صارم، خاصة بين مجموعات التحقق والاختبار، أمرًا بالغ الأهمية لتقييم قدرات النموذج بدقة وتجنب المفاضلة بين التحيز والتباين.
عندما تكون كمية البيانات المتاحة محدودة، غالبًا ما يتم استخدام تقنية تسمى التحقق المتبادل (تحديدًا التحقق المتبادل K-Fold). هنا، يتم تقسيم بيانات التدريب إلى مجموعات فرعية 'K' (طيات). يتم تدريب النموذج K مرة، وفي كل مرة يتم استخدام K-1 طية للتدريب والطية المتبقية كمجموعة التحقق. ثم يتم حساب متوسط الأداء عبر جميع عمليات التشغيل K. يوفر هذا تقديرًا أكثر قوة لأداء النموذج ويستفيد بشكل أفضل من البيانات المحدودة، كما هو موضح في موارد مثل وثائق scikit-learn و دليل Ultralytics K-Fold Cross-Validation.
باختصار، بيانات التحقق هي حجر الزاوية في بناء نماذج ذكاء اصطناعي موثوقة وعالية الأداء باستخدام أطر عمل مثل PyTorch و TensorFlow. فهو يتيح الضبط الفعال للمعلمات الفائقة واختيار النموذج ومنع التجاوز، مما يضمن تعميم النماذج بشكل جيد بما يتجاوز البيانات التي تم تدريبها عليها. تقدم منصات مثل Ultralytics HUB أدوات متكاملة لإدارة مجموعات البيانات هذه بفعالية.