مسرد المصطلحات

الحقبة الزمنية

تعرّف على الحقب الزمنية في التعلم الآلي - كيف تؤثر على تدريب النموذج، وتمنع الإفراط في التركيب، وتحسّن الأداء باستخدام Ultralytics YOLO.

في التعلّم الآلي (ML)، تمثل الحقبة الزمنية تمريرة واحدة كاملة لمجموعة بيانات التدريب بأكملها من خلال خوارزمية التعلّم. وهو مفهوم أساسي في العملية التكرارية لتدريب الشبكات العصبية (NN)، حيث تتعلم النماذج من خلال رؤية أمثلة متكررة من البيانات. ويُعد عدد الدورات الزمنية معلمة أساسية تحدد عدد المرات التي سيتعلم فيها النموذج من مجموعة كاملة من معلومات التدريب، مما يؤثر بشكل مباشر على الأداء النهائي وجودة النموذج.

دور الحقب في التدريب النموذجي

الهدف الأساسي من تدريب النموذج هو تمكين النموذج من تعلّم الأنماط من البيانات. يتم تحقيق ذلك من خلال تعديل المعلمات الداخلية للنموذج، والمعروفة باسم أوزان النموذج، لتقليل دالة الخسارة إلى الحد الأدنى، والتي تحدد الخطأ بين تنبؤات النموذج والحقيقة الفعلية على أرض الواقع. خلال حقبة زمنية واحدة، يعالج النموذج كل عينة من البيانات، وتقوم خوارزمية تحسين مثل Stochastic Gradient Descent Descent (SGD) بتحديث هذه الأوزان.

يسمح تدريب النموذج لعدة دورات تدريبية بتحسين معاييره بشكل متكرر. مع كل تمريرة، يجب أن يصبح النموذج، نظرياً، أفضل في مهمته، سواءً كان تصنيف الصور أو اكتشاف الأجسام. تتم إدارة هذه العملية باستخدام أطر التعلم العميق الشائعة مثل PyTorch أو TensorFlow.

الحقب الزمنية مقابل التكرارات مقابل الدفعات

على الرغم من ارتباط هذه المصطلحات ببعضها البعض، إلا أنها تصف جوانب مختلفة من عملية التدريب وغالباً ما يتم الخلط بينها.

  • دورة واحدة كاملة: دورة واحدة كاملة شاهد فيها النموذج مجموعة بيانات التدريب بأكملها.
  • حجم الدفعة: عدد عينات التدريب المستخدمة في تكرار واحد. نظرًا للقيود المفروضة على الذاكرة، غالبًا ما يكون من غير العملي معالجة مجموعة البيانات بأكملها مرة واحدة.
  • التكرار: تحديث واحد لأوزان النموذج. ويتضمن التكرار معالجة دفعة واحدة من البيانات وإجراء تمرير أمامي وخلفي(الترحيل العكسي).

على سبيل المثال، إذا كانت مجموعة البيانات تحتوي على 10,000 صورة وكان حجم الدفعة 100 صورة، فستتألف الحلقة الواحدة من 100 تكرار (10,000 صورة / 100 صورة لكل دفعة).

تحديد العدد المناسب من الحقب الزمنية

يعد اختيار العدد الصحيح من الحقب الزمنية جزءًا مهمًا من ضبط البارامتر الفائق. وهو ينطوي على إيجاد توازن لتجنب مشكلتين شائعتين:

  • غير ملائمة: يحدث هذا عندما لا يتم تدريب النموذج على عدد كافٍ من الحقب الزمنية. يفشل النموذج في تعلم الأنماط الأساسية في البيانات ويكون أداؤه ضعيفًا في كل من بيانات التدريب والاختبار.
  • الإفراط في التركيب: يحدث هذا عندما يتم تدريب النموذج لعدد كبير جدًا من الحقب الزمنية. حيث يبدأ النموذج في "حفظ" بيانات التدريب، بما في ذلك الضوضاء التي يسببها، ويفقد قدرته على التعميم على البيانات الجديدة غير المرئية. في حين أنه قد يتمتع بدقة ممتازة على مجموعة التدريب، إلا أن أداءه على بيانات التحقق من الصحة سيكون ضعيفًا.

من الأساليب الشائعة لمكافحة الإفراط في الملاءمة التوقف المبكر، حيث يتم إيقاف التدريب بمجرد أن يتوقف أداء النموذج على مجموعة التحقق من الصحة عن التحسن. يمكن مراقبة التقدم المحرز باستخدام أدوات مثل TensorBoard أو من خلال منصات مثل Ultralytics HUB، والتي تساعد على تصور مقاييس التدريب على مدى الحقب الزمنية.

أمثلة من العالم الحقيقي

يعد مفهوم الحلقات الزمنية مفهومًا عالميًا في تطبيقات التعلم العميق.

  1. القيادة الذاتية: يتم تدريب نموذج اكتشاف الأجسام للمركبة ذاتية القيادة على مجموعة بيانات ضخمة مثل Argoverse. قد يتم تدريب النموذج، مثل Ultralytics YOLO11، على 50-100 حلقة تدريبية. بعد كل حقبة، يتم قياس أدائه على مجموعة التحقق من الصحة باستخدام مقاييس مثل متوسط متوسط الدقة (mAP). سيختار المهندسون النموذج من الحلقة التي تقدم أفضل توازن بين السرعة والدقة قبل النشر.

  2. تحليل الصور الطبية: يتم تدريب نموذج للكشف عن الأورام في فحوصات الدماغ على مجموعة بيانات تصوير طبي متخصصة. وبالنظر إلى أن مجموعات البيانات هذه قد تكون صغيرة، فقد يتم تدريب النموذج لعدة مئات من الحلقات. وللحيلولة دون الإفراط في التجهيز، يتم استخدام تقنيات مثل زيادة البيانات، ويتم مراقبة خسارة التحقق من الصحة عن كثب بعد كل حلقة تدريبية. وهذا يضمن تعميم النموذج النهائي بشكل جيد على فحوصات المرضى الجدد. يعد اتباع نصائح تدريب النماذج المعمول بها أمرًا بالغ الأهمية للنجاح في مثل هذه التطبيقات الهامة.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون ونمو مع المبتكرين العالميين

انضم الآن
تم نسخ الرابط إلى الحافظة