التسوية
امنع فرط التخصيص وحسّن تعميم النموذج باستخدام تقنيات التسوية مثل L1 و L2 والتسرب والتوقف المبكر. تعلم المزيد!
التنظيم هو مجموعة حاسمة من الاستراتيجيات في
التعلم الآلي (ML) المصممة لتعزيز
قدرة النموذج على التعميم على البيانات الجديدة غير المرئية. هدفها الأساسي هو منع
الإفراط في التخصيص، وهي ظاهرة شائعة حيث يتعلم النموذج
الضجيج والتفاصيل المحددة لبيانات
بيانات التدريب على حساب أدائه على حساب
المدخلات الصحيحة. من خلال إدخال معلومات أو قيود إضافية - غالبًا ما تكون على شكل شرط جزائي يضاف إلى
دالة الخسارة-التنظيميثني النموذج
من أن يصبح معقدًا بشكل مفرط. ينتج عن هذا نظام أكثر قوة يحافظ على دقة عالية
دقة عالية على كل من التدريب و
وبيانات التحقق من الصحة.
تقنيات التنظيم الشائعة
هناك العديد من الطرق المتعارف عليها لتطبيق التنظيم، يستهدف كل منها جوانب مختلفة من تعقيد النموذج
وديناميكيات التدريب:
-
تنظيم L1 و L2: هذه هي الأشكال الأكثر تقليدية. يضيف التنظيم L1 (Lasso) عقوبة مساوية للقيمة المطلقة لمعاملات
المعاملات، والتي يمكن أن تدفع بعض الأوزان إلى الصفر، مما يؤدي بشكل فعال إلى اختيار الميزة. تنظيم L2
(ريدج)، المستخدم على نطاق واسع في التعلّم العميق (DL)، يضيف
عقوبة مساوية لمربع مقدار المعاملات، مما يشجّع على استخدام أوزان أصغر وأكثر انتشارًا
أوزان نموذجية أصغر وأكثر انتشارًا.
-
طبقة التسرب: مصممة خصيصًا لـ
للشبكات العصبية (NN)، حيث تقوم طبقة التسرب بشكل عشوائي
يعطل جزءًا من الخلايا العصبية بشكل عشوائي أثناء كل خطوة تدريب. هذا يجبر الشبكة على تعلم
ويمنع الاعتماد على مسارات محددة للخلايا العصبية، وهو مفهوم مفصل في
ورقة بحث التسرب الأصلية.
-
زيادة البيانات: بدلاً من تعديل بنية النموذج، تقوم هذه التقنية بتوسيع مجموعة التدريب عن طريق إنشاء نسخ معدلة من
من الصور أو نقاط البيانات الموجودة. تساعد التحويلات مثل التدوير، والقياس، والتقليب النموذج
أن يصبح ثابتًا لهذه التغييرات. يمكنك استكشاف
تقنيات زيادة بياناتYOLO لمعرفة
كيف يتم تطبيق ذلك عمليًا.
-
التوقف المبكر: يتضمن هذا النهج العملي مراقبة أداء النموذج على مجموعة التحقق من الصحة أثناء التدريب. إذا توقفت
توقفت خسارة التحقق من الصحة عن التحسن أو بدأت في الزيادة، يتم إيقاف عملية التدريب
تتوقف عملية التدريب على الفور. هذا يمنع النموذج
النموذج من الاستمرار في تعلم الضوضاء في المراحل اللاحقة من التدريب.
-
تنعيم الملصق: تقوم هذه التقنية بتعديل التسميات المستهدفة أثناء التدريب بحيث لا يضطر النموذج إلى التنبؤ بنسبة 100% من
(على سبيل المثال، احتمال 1.0). من خلال تليين الأهداف (على سبيل المثال، إلى 0.9)، يمنع تجانس التسمية الشبكة
من أن تصبح مفرطة الثقة، وهو أمر مفيد لمهام مثل
تصنيف الصور.
تنفيذ التنظيم في Python
تعمل المكتبات الحديثة مثل Ultralytics على تسهيل تطبيق هذه التقنيات من خلال وسيطات التدريب. يوضح المثال
يوضح المثال التالي كيفية تدريب YOLO11 نموذج
مع تنظيم L2 (يتم التحكم فيه بواسطة weight_decay) والتسرب لضمان وجود نموذج قوي.
from ultralytics import YOLO
# Load a pre-trained YOLO11 model
model = YOLO("yolo11n.pt")
# Train the model with specific regularization parameters
# 'weight_decay' applies L2 regularization
# 'dropout' applies a dropout layer with a 10% probability
results = model.train(data="coco8.yaml", epochs=50, weight_decay=0.0005, dropout=0.1)
تطبيقات واقعية
لا غنى عن التنظيم في نشر أنظمة ذكاء اصطناعي موثوقة في مختلف الصناعات.
-
القيادة الذاتية: في
الذكاء الاصطناعي لحلول السيارات، يجب على نماذج الرؤية الحاسوبية
أن detect نماذج الرؤية الحاسوبية المشاة وإشارات المرور في ظل ظروف جوية متنوعة. بدون التنظيم، قد يحفظ النموذج
قد يحفظ ظروف إضاءة معينة من مجموعة التدريب ويفشل في العالم الحقيقي. تضمن تقنيات مثل
اضمحلال الوزن لضمان تعميم نظام الكشف بشكل جيد على
المطر، أو الضباب، أو الوهج.
-
التصوير الطبي: عند إجراء
تحليل الصور الطبية، غالبًا ما تكون مجموعات البيانات
محدودة الحجم. يمثل الإفراط في التركيب خطرًا كبيرًا هنا. تساعد طرق التنظيم، خاصةً
زيادة البيانات والتوقف المبكر، تساعد النماذج المدربة على
النماذج المدربة على detect الحالات الشاذة في صور الأشعة السينية أو التصوير بالرنين المغناطيسي على أن تظل دقيقة على بيانات المرضى الجدد، مما يدعم
نتائج تشخيصية أفضل.
التنظيم مقابل المفاهيم ذات الصلة
من المفيد التمييز بين التنظيم ومصطلحات التحسين والمعالجة المسبقة الأخرى:
-
التسوية مقابل التطبيع: يتضمن التطبيع قياس البيانات المدخلة إلى نطاق قياسي لتسريع التقارب. في حين أن تقنيات مثل
التطبيع الدفعي يمكن أن يكون لها
تأثيرًا تنظيميًا طفيفًا، فإن الغرض الأساسي منها هو تثبيت ديناميكيات التعلم، في حين أن التسوية
يعاقب التعقيد صراحةً.
-
الانتظام مقابل.
ضبط المعامل الفائق: معلمات التنظيم (مثل معدل التسرب أو عقوبة L2) هي في حد ذاتها معلمات مفرطة. الضبط
هي العملية الأوسع نطاقًا للبحث عن القيم المثلى لهذه الإعدادات، وغالبًا ما تستخدم أدوات مثل
أداة الضبطUltralytics .
-
التنظيم مقابل التعلّم التجميعي: تجمع طرق التجميع بين التنبؤات من نماذج متعددة لتقليل التباين وتحسين التعميم. بينما
هذا يحقق هدفًا مشابهًا للتنظيم، إلا أنه يحقق ذلك من خلال تجميع نماذج متنوعة بدلاً من تقييد
تعلم نموذج واحد.