اكتشف كيف تمنع الطبقات المنسحبة الإفراط في تركيب الشبكات العصبية من خلال تحسين التعميم والمتانة وأداء النموذج.
طبقة التسرب هي تقنية تنظيم قوية وبسيطة في الوقت نفسه تُستخدم في الشبكات العصبية (NN) لمكافحة الإفراط في التكييف. ويحدث الإفراط في التركيب عندما يتعلم النموذج بيانات التدريب بشكل جيد للغاية، بما في ذلك الضوضاء والخصوصيات، مما يضر بقدرته على التعميم على البيانات الجديدة غير المرئية. الفكرة الأساسية وراء التسرب، التي قدمها جيفري هينتون وزملاؤه في ورقة بحثية رائدة عام 2014، هي "التسرب" العشوائي - أو إزالة الخلايا العصبية واتصالاتها مؤقتاً خلال كل خطوة تدريب. وهذا يمنع الخلايا العصبية من الاعتماد بشكل مفرط على بعضها البعض، مما يجبر الشبكة على تعلم تمثيلات أكثر قوة وتكرارًا.
أثناء عملية تدريب النموذج، تقوم طبقة التسرب بتعيين تنشيط جزء من الخلايا العصبية في الطبقة السابقة إلى الصفر بشكل عشوائي. "معدل التسرب" هو معيار مفرط يحدد احتمالية إسقاط الخلية العصبية. على سبيل المثال، معدل التسرب البالغ 0.5 يعني أن كل خلية عصبية لديها فرصة بنسبة 50% أن يتم تجاهلها خلال تكرار تدريب معين. يمكن اعتبار هذه العملية بمثابة تدريب عدد كبير من الشبكات الضعيفة التي تشترك في الأوزان.
من خلال تغيير بنية الشبكة باستمرار، يمنع التسرب من التكيف المشترك المعقد، حيث يعتمد ناتج الخلية العصبية بشكل كبير على وجود عدد قليل من الخلايا العصبية الأخرى المحددة. وبدلاً من ذلك، يتم تشجيع كل خلية عصبية على أن تكون كاشفاً أكثر فائدة بشكل مستقل. أثناء مرحلة الاختبار أو الاستدلال، يتم إيقاف تشغيل طبقة التسرب، ويتم استخدام جميع الخلايا العصبية. وللتعويض عن حقيقة أن عدد الخلايا العصبية النشطة أكثر مما كانت عليه أثناء التدريب، يتم تحجيم مخرجات الطبقة بمعدل التسرب. وهذا يضمن بقاء المخرجات المتوقعة من كل خلية عصبية متسقة بين التدريب والاختبار. تتعامل أطر العمل مثل PyTorch و TensorFlow مع هذا القياس تلقائيًا في تطبيقات طبقة التسرب الخاصة بهم.
يُستخدم التسرب على نطاق واسع في مختلف مجالات الذكاء الاصطناعي (AI) والتعلم الآلي (ML):
التسرب هو أحد الأساليب العديدة المستخدمة للتنظيم في التعلم العميق. وتشمل التقنيات الأخرى:
باختصار، تُعد طبقة التسرب تقنية تنظيم بسيطة لكنها قوية وضرورية لتدريب نماذج التعلم العميق القوية في مختلف التطبيقات، بدءًا من الرؤية الحاسوبية المتقدمة إلى البرمجة اللغوية العصبية.