Yolo فيجن شنتشن
شنتشن
انضم الآن
مسرد المصطلحات

حجم الدفعة

اكتشف تأثير حجم الدفعة على التعلم العميق. قم بتحسين سرعة التدريب واستخدام الذاكرة وأداء النموذج بكفاءة.

يعد حجم الدُفعات معيارًا محوريًا محوريًا في في مجال التعلم الآلي الذي يحدد عدد عدد عينات بيانات التدريب المعالجة قبل أن يقوم يقوم النموذج بتحديث معلماته الداخلية. بدلًا من تحليل مجموعة بيانات كاملة دفعة واحدة - وهو أمر مستحيل حسابيًا في كثير من الأحيان مستحيل حسابيًا بسبب قيود الذاكرة، تقوم أطرالتعلمالعميق تقسم أطر العمل البيانات إلى مجموعات أصغر تسمى دفعات. يحكم هذا التقسيم استقرار عملية التعلّم وسرعة الحوسبة ومقدار الذاكرة التي تتطلبها عملية التعلّم، وسرعة الحوسبة ومقدار الذاكرة التي تتطلبها GPU أثناء التدريب. يعمل اختيار حجم الدُفعات الصحيح كعملية موازنة بين الكفاءة الحسابية وجودة التقارب.

التأثير على ديناميكيات التدريب

يؤدي اختيار حجم الدفعة إلى تغيير جذري في كيفية تعلم تتعلم الشبكة العصبية. عندما يتم تعيين حجم الدفعة إلى قيمة أقل، يقوم النموذج بتحديث أوزان النموذج الخاص به بشكل متكرر، مما يؤدي إلى إدخال ضوضاء في عملية نزول التدرج. يمكن أن يكون هذا التشويش مفيدًا، وغالبًا ما يساعد خوارزمية التحسين على الهروب من الصغرى المحلية وإيجاد حلول أكثر قوة، مما يساعد على على منع الإفراط في التركيب. على العكس، أحجام الدفعات الأكبر توفر تقديرًا أكثر دقة للتدرج، مما يؤدي إلى تحديثات أكثر سلاسة وثباتًا، على الرغم من أنها تتطلب ذاكرة أجهزة أكثر بكثير ويمكن أن تؤدي في بعض الأحيان إلى "فجوة تعميم"، حيث يؤدي النموذج أداءً جيدًا على بيانات التدريب ولكن بفعالية أقل على البيانات غير المرئية.

غالبًا ما تملي قدرات الأجهزة الحد الأعلى لهذه المعلمة. مسرّعات الأجهزة الحديثة، مثل تلك المفصلة في دليل أداء التعلم العميق الخاص بNVIDIA تعتمد على الحوسبة المتوازية لمعالجة كتل كبيرة من كبيرة من البيانات في وقت واحد. لذلك، فإن استخدام حجم دُفعات يتوافق مع بنية المعالج - عادةً ما تكون قوى من اثنين مثل 32 أو 64 أو 128 - يمكن أن يزيد من الإنتاجية ويقلل من إجمالي وقت التدريب لكل لكل حقبة.

تطبيقات واقعية

يعد فهم كيفية ضبط هذه المعلمة أمرًا ضروريًا لنشر حلول الذكاء الاصطناعي الفعالة في مختلف الصناعات المختلفة.

  1. التصوير الطبي عالي الدقة: في الذكاء الاصطناعي في مجال الرعاية الصحية، غالبًا ما يتم تكليف النماذج تحليل صور الأشعة المقطعية التفصيلية أو التصوير بالرنين المغناطيسي لتحديد الحالات الشاذة مثل الأورام. هذه الصور ضخمة من حيث حجم الملف. إن محاولة معالجة العديد منها في وقت واحد قد تتجاوز ذاكرة الفيديو (VRAM) لأقوى أجهزة الأجهزة. وبالتالي، يستخدم الممارسون حجم دُفعات صغير جدًا (على سبيل المثال، 1 أو 2) لتسهيل تحليل الصور الطبية دون تعطل النظام، مع إعطاء الأولوية للقدرة على التعامل مع البيانات عالية الدقة على سرعة التدريب الأولية.
  2. فحص التصنيع في الوقت الحقيقي: على العكس، في بيئات التصنيع الذكية، تكون السرعة حاسمة. قد يلتقط نظام الفحص البصري الآلي على حزام ناقل آلاف الصور للوحات الدارات الكهربائية اللوحات الإلكترونية في الساعة. أثناء مرحلة الاستدلال (الكشف عن العيوب في الإنتاج)، قد تستخدم الأنظمة الاستدلال على دفعات تجميع الصور الواردة ومعالجتها بالتوازي. وهذا يزيد من إنتاجية نظام نظام الرؤية الحاسوبية، مما يضمن مواكبة مع خط الإنتاج السريع.

تكوين حجم الدفعة مع Ultralytics

عند استخدام حزمة Ultralytics Python، فإن تكوين الدفعة حجم الدُفعة مباشرة. إن batch تسمح لك الوسيطة بتحديد عدد الصور التي يجب أن يراها النموذج قبل تحديث الأوزان. إذا تم ضبطها على -1، يمكن للمكتبة أيضًا استخدام ميزة الدُفعات التلقائية لتحديد الحد الأقصى لحجم الدفعة التي يمكن أن تدعمها أجهزتك.

from ultralytics import YOLO

# Load the latest YOLO11 model
model = YOLO("yolo11n.pt")

# Train the model on the COCO8 dataset with a specific batch size
# A batch size of 32 balances speed and memory usage for most standard GPUs
results = model.train(data="coco8.yaml", epochs=50, batch=32)

التمييز بين المفاهيم ذات الصلة

من المهم للممارسين التمييز بين "حجم الدفعة" والمصطلحات المماثلة الموجودة في أطر التعلم العميق.

  • حجم الدفعة مقابل الفترة الزمنية: تمثل الحقبة الزمنية مرورًا واحدًا كاملًا عبر مجموعة بيانات مجموعة بيانات التدريب بأكملها. يحدد حجم الدُفعة عدد عدد الأجزاء التي يتم تقسيم البيانات إليها ضمن تلك الحقبة الزمنية الواحدة. على سبيل المثال، إذا كان لديك 1,000 عينة و وحجم الدفعة 100، فسوف يستغرق الأمر 10 تكرارات لإكمال دورة تدريبية واحدة.
  • حجم الدفعة مقابل تطبيع الدفعة: بينما يشتركان في الاسم, فإن تطبيع الدُفعات هو تقنية محددة للطبقة محددة تستخدم لتطبيع مدخلات الطبقة لتحسين الاستقرار. بينما يمكن أن تعتمد فعالية تطبيع الدُفعات تعتمد على حجم الدُفعة (تتطلب دفعة كبيرة بما فيه الكفاية لحساب إحصائيات دقيقة)، فهي مكون هيكلي في بنية الشبكة، وليس مجرد إعداد تدريبي.
  • التدريب مقابل تجميع الاستدلال: أثناء التدريب، يكون الهدف هو تعلم الأوزان. أثناء الاستدلال، فإن التجميع هو مجرد تحسين للسرعة. بالنسبة للتطبيقات الحساسة لوقت الاستجابة مثل المركبات ذاتية القيادة، فإن حجم الدفعة 1 هو غالبًا للحصول على استجابة فورية، في حين أن قد تستخدم مهام تحليلات البيانات دفعات كبيرة من أجل لمعالجة لقطات الفيديو التاريخية بين عشية وضحاها.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن