مسرد المصطلحات

الشبكات المتبقية (ResNet)

اكتشف كيف تُحدث شبكات ResNets ثورة في التعلُّم العميق من خلال حل التدرجات المتلاشية وتمكين الشبكات فائقة العمق لتحليل الصور والبرمجة اللغوية العصبية وغيرها.

الشبكات المتبقية، والمعروفة باسم ResNet، هي نوع رائد من بنية الشبكات العصبية (NN) التي كان لها تأثير عميق على مجال التعلم العميق. تم تقديمها من قبل Kaiming He et al. في ورقتهم البحثية لعام 2015 بعنوان"التعلم العميق المتبقي للتعرف على الصور"، وقد أتاحت ResNet إمكانية تدريب شبكات عصبية عميقة للغاية بشكل فعال، مع مئات أو حتى آلاف الطبقات. وقد تم تحقيق ذلك من خلال تقديم "الكتل المتبقية" مع "تخطي الوصلات"، وهو مفهوم بسيط ولكنه قوي يخفف من مشكلة التدرج المتلاشي، والتي عادة ما تصيب الشبكات العميقة جدًا.

كيف تعمل ResNet

الابتكار الأساسي لشبكة ResNet هو استخدام وصلات التخطي أو الاختصارات. في الشبكة العصبية التلافيفية التقليدية (CNN)، تقوم كل طبقة بتغذية مخرجاتها مباشرةً إلى الطبقة التالية بالتسلسل. وكلما تعمقت الشبكة، يصبح من الصعب على الشبكة أن تتعلم وأن تتكاثر التدرجات أثناء التدريب. يمكن أن يؤدي ذلك إلى حالة تؤدي فيها إضافة المزيد من الطبقات إلى تدهور أداء النموذج.

تعالج ResNet هذا الأمر من خلال السماح بإضافة مدخلات طبقة (أو كتلة من الطبقات) إلى مخرجاتها. يخلق هذا الاتصال التخطي مسارًا بديلًا لتدفق التدرج من خلاله، مما يضمن إمكانية تدريب حتى الشبكات العميقة جدًا بشكل فعال. تسمح هذه البنية للشبكة بتعلم الدوال المتبقية - أي أن الطبقات تحتاج فقط إلى تعلم التغييرات أو البقايا من المدخلات، بدلاً من التحويل بأكمله. إذا كانت إحدى الطبقات غير مفيدة، يمكن للشبكة أن تتعلم بسهولة تجاهلها من خلال توجيه أوزانها نحو الصفر، مما يسمح بتمرير التحويل الهوياتي من خلال اتصال التخطي.

شبكة ريزنت مقابل البنى الأخرى

  • شبكات CNN القياسية: على عكس الشبكات الشبكية المتسلسلة القياسية، يمكن أن تنمو الشبكات الشبكية المتسلسلة بشكل أعمق بكثير دون خسارة في الأداء، وذلك بفضل التعلم المتبقي. يسمح لها هذا العمق بتعلم ميزات أكثر تعقيدًا وتحقيق دقة أعلى في المهام الصعبة.
  • U-Net: بينما تستخدم U-Net أيضاً وصلات التخطي، فإن الغرض منها مختلف. ففي شبكة U-Net، تربط وصلات التخطي الطبقات من مسار أخذ العينات من الأسفل إلى مسار أخذ العينات من الأعلى لاستعادة المعلومات المكانية لتجزئة الصورة بدقة. في ResNet، عادةً ما تكون الوصلات أقصر ومصممة لتحسين تدفق التدرج وتمكين البنى الأعمق.

التطبيقات الواقعية

تجعل قدرات ResNet القوية لاستخراج الميزات من ResNet خيارًا شائعًا كعمود فقري للعديد من مهام الرؤية الحاسوبية المعقدة.

  • تحليل الصور الطبية: في مجال الذكاء الاصطناعي للرعاية الصحية، تُستخدم هياكل ResNet لتحليل الفحوصات الطبية مثل الأشعة السينية والتصوير المقطعي المحوسب والتصوير بالرنين المغناطيسي. على سبيل المثال، يمكن تدريب نموذج قائم على ResNet على مجموعة بيانات من فحوصات الدماغ لمساعدة أخصائيي الأشعة في الكشف المبكر عن الأورام، مما يحسن دقة التشخيص وسرعته.
  • القيادة الذاتية: تعتمد الأنظمة في السيارات ذاتية القيادة على أنظمة خلفية قوية للإدراك في الوقت الحقيقي. وغالباً ما تُستخدم شبكة ريسنيت لمعالجة مدخلات الكاميرا للكشف عن الأجسام وتحديد المشاة والمركبات وإشارات المرور، وهو أمر بالغ الأهمية لأنظمة الملاحة الآمنة التي طورتها شركات مثل Waymo.

الأدوات والتنفيذ

تُنفذ بنى ResNet على نطاق واسع في أطر التعلم العميق الرئيسية مثل PyTorch و TensorFlow. تتوفر النماذج المدربة مسبقًا، والتي غالبًا ما يتم تدريبها على مجموعة بيانات ImageNet واسعة النطاق، بسهولة من خلال مكتبات مثل torchvision، مما يسهل التعلم الفعال للتطبيقات المخصصة. تُمكِّن منصات مثل Ultralytics HUB المستخدمين من الاستفادة من البنى المختلفة، بما في ذلك النماذج القائمة على ResNet، لتدريب نماذج مخصصة لاحتياجاتهم الخاصة. وبينما وضعت ResNet خط أساس قوي للأداء، فقد تم تطوير بنيات أحدث مثل EfficientNet منذ ذلك الحين لتقديم كفاءة أفضل. يمكنك العثور على المزيد من الموارد التعليمية حول CNNs في دورة CS231n في جامعة ستانفورد أو من خلال الدورات التدريبية من مزودي خدمات مثل DeepLearning.AI.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون ونمو مع المبتكرين العالميين

انضم الآن
تم نسخ الرابط إلى الحافظة