Yolo فيجن شنتشن
شنتشن
انضم الآن
مسرد المصطلحات

الشبكات المتبقية (ResNet)

اكتشف كيف أحدثت ResNets ثورة في التعلم العميق من خلال حل مشكلة التدرجات المتلاشية، وتمكين الشبكات فائقة العمق لتحليل الصور، والبرمجة اللغوية العصبية، والمزيد.

تمثل الشبكات المتبقية، المعروفة على نطاق واسع باسم الشبكات المتبقية، تقدمًا محوريًا في مجال الذكاء الاصطناعي (AI) و والرؤية الحاسوبية. تم تقديمها في عام 2015 من قبل باحثون في Microsoft للأبحاث، وقد عالجت هذه البنية تحديًا كبيرًا في التعلم العميق (DL) المعروف باسم مشكلة التدرج المتلاشي. قبل ظهور ResNet، كانت زيادة عمق الشبكة العصبية (NN) غالبًا ما يؤدي إلى تناقص حيث تؤدي إضافة المزيد من الطبقات إلى زيادة أخطاء التدريب. حلّت ResNet هذه المشكلة من خلال تقديم "تخطي "، مما يتيح التدريب الناجح للشبكات شبكات ذات مئات أو حتى آلاف الطبقات مع الحفاظ على دقة عالية عالية الدقة.

الابتكار الأساسي: الكتل المتبقية

السمة المميزة لشبكة ResNet هي الكتلة المتبقية. في شبكة عصبية الشبكة العصبية التلافيفية التقليدية (CNN)، يتم تكديس الطبقات بالتتابع، وتحاول كل طبقة تعلّم التعيين من المدخلات إلى المخرجات مباشرةً. ومع ذلك، عندما تصبح الشبكات أعمق، يمكن أن تتدهور الإشارة من بيانات المدخلات قبل الوصول إلى نهاية الشبكة.

تقدم ResNet "اختصارًا" أو اتصال تخطي يسمح بإضافة مدخلات الطبقة مباشرةً إلى إلى مخرجاتها مباشرةً. تخبر هذه الآلية الشبكة بشكل أساسي أن تتعلم "المتبقي" (الفرق) بين المدخلات والمخرجات المثلى، بدلاً من تعلم التحويل بأكمله من الصفر. هذه البنية هذه البنية تحافظ على تدفق المعلومات وتسهل استخراج الميزات بشكل أفضل، مما يسمح للنموذج بالتقاط أنماط معقدة مثل القوام والأشكال دون فقدان بيانات الإدخال الأصلية. يمكنك قراءة النسخة الأصلية البحث الأصلي للتعلم العميق المتبقي للتعرف على الصور لفهم الأساس الرياضي.

أهمية شبكة ريس نت في التعلم الآلي

تعتبر ResNet العمود الفقري التأسيسي للعديد من أنظمة الرؤية الحديثة. تسمح قدرتها على تدريب شبكات عميقة للغاية بإنشاء نماذج قوية للغاية يمكن أن تؤدي بشكل جيد على مجموعات بيانات واسعة النطاق مثل يمكن أن تؤدي بشكل جيد على مجموعات بيانات واسعة النطاق مثل ImageNet.

تعتبر البنية مهمة بشكل خاص بالنسبة لـ نقل التعلّم. لأن نماذج ResNet المدربة مسبقًا قد تعلمت النماذج خرائط ميزات غنية من من البيانات، يمكن ضبطها لمهام محددة بمجموعات بيانات صغيرة نسبيًا. هذا التنوع يجعل من ResNet خيارًا قياسيًا لمهام تتراوح بين تصنيف الصور إلى تحليل الفيديو المعقد المعقدة.

تطبيقات واقعية

وقد مكّن الاستقرار والعمق اللذان توفرهما شبكة ResNet من استخدامها في البيئات الحرجة عالية المخاطر.

  • التشخيص الطبي: في مجال الذكاء الاصطناعي في مجال الرعاية الصحية، تُستخدم بنيات شبكة ريسنت كثيراً ما تُستخدم في تحليل الصور الطبية. على سبيل المثال, يستخدم الباحثون نماذج شبكة ريس نت العميقة لتحليل فحوصات التصوير بالرنين المغناطيسي أو الأشعة السينية من أجل للكشف عن الأورام, حيث يجب على النموذج تحديد الشذوذات الدقيقة في هياكل الأنسجة التي قد تغفلها الشبكات الضحلة.
  • القيادة الذاتية: تعتمد المركبات ذاتية القيادة على أنظمة الإدراك في الوقت الحقيقي للتنقل بأمان. وغالبًا ما تعمل متغيرات ResNet كمستخرج للميزات من أجل أنظمة الكشف عن الأجسام التي تحدد المشاة وإشارات المرور والمركبات الأخرى. يضمن عمق الشبكة قدرة السيارة على التعرف على الأجسام في ظروف الإضاءة والظروف الجوية المختلفة، وهو عنصر أساسي من عناصر الذكاء الاصطناعي في سلامة السيارات.

ResNet مقابل Architectures الأخرى

من المفيد تمييز ResNet عن البنى الشائعة الأخرى الموجودة في مكتبات التعلم العميق مثل PyTorch أو TensorFlow:

  • شبكة ResNet مقابل VGG: كانت شبكات VGG (مجموعة الهندسة البصرية) شائعة بسبب بساطتها، باستخدام 3×3 طبقات من التلافيف. ومع ذلك، فإن نماذج VGG ثقيلة من الناحية الحسابية وتكافح من أجل التدريب بفعالية أكثر من 19 طبقة. تستخدم ResNet وصلات التخطي للتعمق أكثر (على سبيل المثال، 50 أو 101 أو 152 طبقة) مع انخفاض استدلال أقل مقارنةً بعمقها.
  • شبكة ResNet مقابل YOLO11: في حين أن شبكة ResNet هي في المقام الأول عمود فقري مصنف, YOLO11 هو أحدث كاشف للكائنات. ومع ذلك, تتضمّن أجهزة الكشف الحديثة مثل YOLO11 مفاهيم معمارية تطوّرت من ResNet، مثل لضمان تدفق التدرجات بكفاءة أثناء التدريب.

التنفيذ باستخدام Ultralytics

يمكنك الاستفادة بسهولة من نماذج ResNet لمهام التصنيف باستخدام ultralytics حزمة Python . يتيح لك هذا تسمح لك بالوصول إلى الأوزان المدرّبة مسبقًا وإجراء الاستدلال بأقل قدر من التعليمات البرمجية.

from ultralytics import YOLO

# Load a pre-trained ResNet50 model capable of classifying images
model = YOLO("resnet50.pt")  # Downloads the model weights automatically

# Perform inference on an image URL
results = model("https://ultralytics.com/images/bus.jpg")

# Display the top classification result
print(f"Top class: {results[0].names[results[0].probs.top1]}")

بالنسبة للمهتمين بفهم النظرية الأعمق، توفر دورات مثل CS231n في جامعة ستانفورد موارد أكاديمية ممتازة حول هندسة CNN. سواءً كنت تبني مصنفاً بسيطاً أو نظاماً معقداً من أجل للتصنيع الذكي، فإن فهم ريس نت ضروري لإتقان الرؤية الحاسوبية الحديثة.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن