تعرّف على الحقب الزمنية في التعلم الآلي - كيف تؤثر على تدريب النموذج، وتمنع الإفراط في التركيب، وتحسّن الأداء باستخدام Ultralytics YOLO.
في التعلم الآلي (ML)، تمثل الحقبة (epoch) مرورًا كاملاً واحدًا لمجموعة بيانات التدريب بأكملها عبر خوارزمية التعلم. إنه مفهوم أساسي في العملية التكرارية لتدريب الشبكات العصبونية (NN)، حيث تتعلم النماذج من خلال رؤية أمثلة من البيانات بشكل متكرر. عدد الحقب هو معلمة رئيسية تحدد عدد المرات التي سيتعلم فيها النموذج من المجموعة الكاملة من معلومات التدريب، مما يؤثر بشكل مباشر على الأداء والجودة النهائية للنموذج.
الهدف الأساسي من تدريب النموذج هو تمكين النموذج من تعلم الأنماط من البيانات. يتم تحقيق ذلك عن طريق تعديل المعلمات الداخلية للنموذج، والمعروفة باسم أوزان النموذج، لتقليل دالة الخسارة، التي تحدد كميًا الخطأ بين تنبؤات النموذج والحقيقة الأساسية الفعلية. خلال حقبة واحدة، يعالج النموذج كل عينة بيانات، وتقوم خوارزمية التحسين مثل هبوط التدرج العشوائي (SGD) بتحديث هذه الأوزان.
يتيح تدريب نموذج لعدة حقب تحسين معاييره بشكل متكرر. مع كل تمريرة، يجب أن يصبح النموذج، من الناحية النظرية، أفضل في مهمته، سواء كان تصنيف الصور أو اكتشاف الكائنات. تتم إدارة هذه العملية باستخدام أطر التعلم العميق الشائعة مثل PyTorch أو TensorFlow.
في حين أنها ذات صلة، إلا أن هذه المصطلحات تصف جوانب مختلفة من عملية التدريب وغالبًا ما يتم الخلط بينها.
على سبيل المثال، إذا كانت مجموعة البيانات تحتوي على 10000 صورة وكان حجم الدفعة 100، فسوف تتكون حقبة واحدة من 100 تكرار (10000 صورة / 100 صورة لكل دفعة).
يُعد اختيار العدد الصحيح للتكرارات (epochs) جزءًا بالغ الأهمية من ضبط المعلمات الفائقة (hyperparameter tuning). وهو ينطوي على إيجاد توازن لتجنب مشكلتين شائعتين:
تتمثل إحدى التقنيات الشائعة لمكافحة التجاوز في التوقف المبكر، حيث يتم إيقاف التدريب بمجرد توقف أداء النموذج على مجموعة التحقق من التحسن. يمكن مراقبة التقدم باستخدام أدوات مثل TensorBoard أو من خلال منصات مثل Ultralytics HUB، مما يساعد على تصور مقاييس التدريب عبر العصور.
إن مفهوم العصور شامل في تطبيقات التعلم العميق.
القيادة الذاتية: يتم تدريب نموذج اكتشاف الكائنات لـ مركبة ذاتية القيادة على مجموعة بيانات ضخمة مثل Argoverse. يمكن تدريب النموذج، مثل Ultralytics YOLO11، لمدة 50-100 حقبة. بعد كل حقبة، يتم قياس أدائها على مجموعة التحقق باستخدام مقاييس مثل متوسط الدقة المتوسطة (mAP). سيختار المهندسون النموذج من الحقبة التي توفر أفضل توازن بين السرعة والدقة قبل النشر.
تحليل الصور الطبية: يتم تدريب نموذج للكشف عن الأورام في فحوصات الدماغ على تصوير طبي متخصص. بالنظر إلى أن مجموعات البيانات هذه يمكن أن تكون صغيرة، فقد يتم تدريب النموذج لعدة مئات من الحقب. لمنع التجاوز في الملاءمة، يتم استخدام تقنيات مثل توسيع البيانات، ويتم مراقبة خسارة التحقق عن كثب بعد كل حقبة. يضمن هذا أن النموذج النهائي يعمم بشكل جيد على الفحوصات من مرضى جدد. يعد اتباع نصائح تدريب النموذج المعمول بها أمرًا بالغ الأهمية لتحقيق النجاح في مثل هذه التطبيقات الحيوية.