Yolo فيجن شنتشن
شنتشن
انضم الآن
مسرد المصطلحات

العمود الفقري

اكتشف دور الهياكل الأساسية في التعلم العميق، واستكشف أفضل التصميمات مثل ResNet وViT، وتعرّف على تطبيقاتها الواقعية في الذكاء الاصطناعي.

العمود الفقري هو مكون أساسي في نموذج نموذج التعلم العميق، خاصة في الرؤية الحاسوبية (CV). وهو يعمل كشبكة شبكة استخراج الميزات الأساسية، مصممة أخذ بيانات المدخلات الأولية مثل الصورة وتحويلها إلى مجموعة من الميزات عالية المستوى. هذه خرائط الميزات هذه تلتقط الأنماط الأساسية مثل الحواف والأنسجة والأشكال. ثم يتم استخدام هذا التمثيل الغني من قبل الأجزاء اللاحقة من الشبكة لأداء مهام مثل اكتشاف الأجسام أو تجزئة الصورة، أو أو تصنيف الصور. العمود الفقري هو أساس الشبكة العصبية (NN) التي تتعلم أن "رؤية" العناصر البصرية الأساسية داخل الصورة.

كيف تعمل الهياكل الأساسية (Backbones)؟

عادةً ما يكون العمود الفقري عبارة عن شبكة عصبية تلافيفية عميقة (CNN) التي تم تدريبها مسبقًا على مجموعة بيانات تصنيف واسعة النطاق، مثل ImageNet. هذا التدريب المسبق، وهو شكل من أشكال نقل التعلم، يمكّن الشبكة من تعلم مكتبة واسعة من الميزات البصرية العامة. عند تطوير نموذج لمهمة جديدة ومحددة، غالبًا ما يستخدم المطورون نموذجًا العمود الفقري المدرب مسبقاً بدلاً من البدء من الصفر. يقلل هذا النهج بشكل كبير من الوقت اللازم لتدريب النماذج المخصصة وتقليل متطلبات البيانات، مما مما يؤدي إلى أداء أفضل. ثم يتم تمرير الميزات المستخرجة بواسطة العمود الفقري إلى "عنق" و "رأس" الشبكة، والتي تقوم بإجراء المزيد من التنقيح وتوليد المخرجات النهائية. غالبًا ما يكون اختيار العمود الفقري غالبًا ما يكون مفاضلة بين الدقة وحجم النموذج و والكمون في الاستدلال، وهو عامل حاسم في تحقيق الأداء في الوقت الحقيقي.

يوضّح الرمز التالي كيف يمكن أن يوضّح الرمز التالي كيفية تدريب Ultralytics YOLO11 الذي يحتوي على فعال، يمكن تحميله واستخدامه للاستدلال على صورة ما.

from ultralytics import YOLO

# Load a pre-trained YOLO11 model. Its architecture includes a powerful backbone.
model = YOLO("yolo11n.pt")

# Run inference. The backbone processes the image to extract features for detection.
results = model("https://ultralytics.com/images/bus.jpg")

# Display the detection results
results[0].show()

البنى الأساسية الشائعة

لقد تطور تصميم العمود الفقري بشكل كبير، حيث تقدم كل بنية جديدة تحسينات في الأداء والكفاءة. والكفاءة. وتشمل بعض أكثر البنى الأساسية تأثيراً ما يلي:

  • الشبكات المتبقية (ResNet): تستخدم نماذج ResNet، التي قدمتها Microsoft للأبحاث،"اتصالات التخطي "وصلات التخطي" لتمكين تدريب شبكات أعمق بكثير من خلال التخفيف من مشكلة تلاشي التدرج مشكلة التدرج المتلاشي.
  • EfficientNet: تم تطوير هذه المجموعة من النماذج بواسطة Google للذكاء الاصطناعي، وتستخدم هذه المجموعة من النماذج تستخدم طريقة تحجيم مركّبة توازن بين عمق الشبكة وعرضها ودقتها بشكل موحد لإنشاء نماذج عالية الدقة والفعالية الحسابية على حد سواء.
  • محول الرؤية (ViT): تقوم هذه البنية بتكييف نموذج الناجح للغاية من نموذج المحول من معالجة اللغة الطبيعية (NLP) لمهام الرؤية. يعالج VTs الصور كتسلسل من البقع ويستخدم الانتباه الذاتي لالتقاط السياق العالمي، وهو الابتعاد عن المجالات الاستقبالية المحلية لشبكات CNN التقليدية.
  • شبكة CSPNet (الشبكة الجزئية العابرة للمرحلة): كما هو مفصل في تعمل هذه البنية على تحسين كفاءة التعلّم من خلال تقسيم خرائط الميزات لتقليل الاختناقات الحسابية. وهي مكون رئيسي في العديد من نماذج Ultralytics YOLO Ultralytics.

العمود الفقري مقابل الرأس والرقبة

في البنى الحديثة الحديثة للكشف عن الكائنات، فإن ينقسم النموذج عادةً إلى ثلاثة أجزاء رئيسية:

  1. العمود الفقري: كأساس، يتمثل دوره في استخراج خرائط الملامح بمقاييس مختلفة من مدخلات الصورة.
  2. الرقبة: يربط هذا المكون العمود الفقري بالرأس. يقوم بتنقيح وتجميع الميزات من العمود الفقري، وغالبًا ما يجمع المعلومات من طبقات مختلفة لإنشاء تمثيل أكثر ثراءً. مثال شائع هو الشبكة الهرمية للميزات (FPN).
  3. رأس الكشف: هذا هو الجزء الأخير الجزء الأخير من الشبكة. وهو يأخذ الميزات المكررة من الرقبة وينفذ المهمة الرئيسية، مثل التنبؤ بـ المربعات المحددة، وتسميات الفئات، ودرجات الثقة لكل كائن.

وبالتالي فإن العمود الفقري هو اللبنة الأساسية للنموذج بأكمله. يمكنك استكشاف مجموعة متنوعة من مقارنات نموذجYOLO لمعرفة كيف تؤثر الخيارات المعمارية المختلفة المختلفة على الأداء.

تطبيقات واقعية

تُعد العمود الفقري من المكونات الأساسية في عدد لا يحصى من تطبيقات الذكاء الاصطناعي في مختلف الصناعات:

  1. المركبات ذاتية القيادة: في السيارات ذاتية القيادة، تعالج الشبكات الخلفية القوية مثل ResNet أو متغيرات EfficientNet تعالج الصور من الكاميرات detect classify المركبات الأخرى والمشاة و وإشارات المرور. هذا الاستخراج للميزات أمر بالغ الأهمية للملاحة واتخاذ القرار في السيارة، كما هو موضح في في الأنظمة التي طورتها شركات مثل Waymo.
  2. تحليل الصور الطبية: في حلول الذكاء الاصطناعي في مجال الرعاية الصحية، تُستخدم العمود الفقري لتحليل الفحوصات الطبية مثل الأشعة السينية والتصوير بالرنين المغناطيسي. على سبيل المثال، يمكن للعمود الفقري استخراج الميزات من الأشعة السينية للصدر للمساعدة في تحديد علامات الالتهاب الرئوي أو من الأشعة المقطعية للعثور على الأورام المحتملة، كما هو موضح في بحث من طب الأشعة: الذكاء الاصطناعي. وهذا يساعد أخصائيي الأشعة في في إجراء تشخيصات أسرع وأكثر دقة، ويمكن ضبط نماذج مثل YOLO11 للمهام المتخصصة مثل الكشف عن الأورام.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن