مسرد المصطلحات

العمود الفقري

اكتشف دور العمود الفقري في التعلُّم العميق، واستكشف أفضل البنى مثل ResNet وViT، وتعرّف على تطبيقات الذكاء الاصطناعي في العالم الحقيقي.

العمود الفقري هو مكوّن أساسي لنموذج التعلّم العميق، خاصةً في الرؤية الحاسوبية. وهو بمثابة شبكة استخراج السمات الأساسية. وتتمثل مهمتها الرئيسية في أخذ بيانات المدخلات الأولية، مثل الصورة، وتحويلها إلى مجموعة من الميزات عالية المستوى، أو خرائط الميزات، التي يمكن استخدامها في المهام النهائية مثل اكتشاف الكائنات أو تجزئة الصور أو تصنيفها. يمكنك التفكير في العمود الفقري على أنه جزء من الشبكة العصبية (NN) الذي يتعلم "رؤية" وفهم الأنماط الأساسية - مثل الحواف والأنسجة والأشكال والأجسام - داخل الصورة.

كيف يعمل العمود الفقري

وعادةً ما يكون العمود الفقري عبارة عن شبكة عصبية تلافيفية عميقة (CNN) تم تدريبها مسبقًا على مجموعة بيانات تصنيف الصور على نطاق واسع، مثل ImageNet. تقوم عملية التدريب المسبق هذه، وهي شكل من أشكال التعلّم المنقول، بتعليم الشبكة التعرف على مكتبة واسعة من الميزات المرئية العامة. عند بناء نموذج لمهمة جديدة، غالبًا ما يستخدم المطورون هذه العمود الفقري المدرب مسبقًا بدلاً من البدء من الصفر. يقلل هذا النهج بشكل كبير من وقت التدريب وكمية البيانات المصنفة المطلوبة، مع تحسين أداء النموذج في كثير من الأحيان. يتم بعد ذلك تمرير الميزات المستخرجة بواسطة العمود الفقري إلى "عنق" و"رأس" الشبكة، والتي تقوم بإجراء المزيد من المعالجة وتوليد المخرجات النهائية. وغالبًا ما ينطوي اختيار العمود الفقري على مفاضلة بين الدقة وحجم النموذج وزمن الاستنتاج، وهو أمر بالغ الأهمية لتحقيق الأداء في الوقت الحقيقي.

هياكل العمود الفقري الشائعة

لقد تطور تصميم العمود الفقري على مر السنين، حيث تقدم كل بنية جديدة تحسينات في الكفاءة والأداء. وتشمل بعض أكثر البنى الأساسية تأثيراً ما يلي:

  • الشبكات المتبقية (ResNet): تستخدم نماذج ResNet، التي قدمتها Microsoft Research،"اتصالات التخطي" للسماح للشبكة بتعلم الوظائف المتبقية. وقد أتاح هذا الابتكار إمكانية تدريب شبكات أعمق بكثير دون المعاناة من مشكلة تلاشي التدرج.
  • EfficientNet: تم تطوير هذه المجموعة من النماذج بواسطة Google AI، وتستخدم هذه المجموعة من النماذج طريقة تحجيم مركّبة لتحقيق التوازن بين عمق الشبكة وعرضها ودقتها بشكل موحد. ينتج عن ذلك نماذج دقيقة للغاية وفعالة من الناحية الحسابية.
  • محول الرؤية (ViT): من خلال تكييف بنية المحول الناجحة من البرمجة اللغوية العصبية اللغوية إلى الرؤية، تتعامل محولات الرؤية الافتراضية مع الصورة كسلسلة من الرقع وتستخدم الانتباه الذاتي لالتقاط السياق العالمي، مما يوفر نهجًا مختلفًا مقارنةً بمجالات الاستقبال المحلية لشبكات CNN.
  • CSPNet (الشبكة الجزئية عبر المراحل): تعمل هذه البنية، الموصوفة في ورقتها البحثية الأصلية، على تحسين التعلم من خلال دمج خرائط السمات من بداية ونهاية مرحلة الشبكة، مما يعزز انتشار التدرج ويقلل من الاختناقات الحسابية. وهي مكوّن رئيسي في العديد من نماذج Ultralytics YOLO.

العمود الفقري مقابل الرأس والرقبة

في بنية الكشف عن الأجسام النموذجية، يتكون النموذج من ثلاثة أجزاء رئيسية:

  1. العمود الفقري: ويتمثل دوره في إجراء استخراج الميزة من صورة الإدخال، وإنشاء خرائط ميزات بمقاييس مختلفة.
  2. الرقبة: يقع هذا المكون بين العمود الفقري والرأس. يقوم بتنقيح وتجميع خرائط الميزات من العمود الفقري، وغالبًا ما يجمع بين ميزات من طبقات مختلفة لبناء تمثيل أكثر ثراءً. ومن الأمثلة الشائعة على ذلك شبكة هرم الميزات (FPN).
  3. رأس الاكتشاف: هذا هو الجزء الأخير من الشبكة، والذي يأخذ الميزات المكررة من الرقبة ويقوم بمهمة الاكتشاف الفعلي. وهو يتنبأ بالمربعات المحيطة، وتسميات الفئات، ودرجات الثقة للأجسام في الصورة.

وبالتالي، فإن العمود الفقري هو الأساس الذي يُبنى عليه باقي نموذج الكشف. تدمج نماذج مثل YOLOv8 و YOLO11 العمود الفقري القوي لضمان استخراج ميزات عالية الجودة، وهو أمر ضروري لأدائها المتطور في مختلف المهام. يمكنك استكشاف مقارنات نماذج YOLO المختلفة لمعرفة كيف تؤثر الخيارات المعمارية على الأداء.

التطبيقات الواقعية

العمود الفقري هي مكونات أساسية في عدد لا يحصى من تطبيقات الذكاء الاصطناعي:

  1. القيادة الذاتية: تعتمد الأنظمة في السيارات ذاتية القيادة اعتماداً كبيراً على العمود الفقري القوي (على سبيل المثال، متغيرات ResNet أو EfficientNet) لمعالجة المدخلات من الكاميرات ومستشعرات LiDAR. تمكّن الميزات المستخرجة من اكتشاف وتصنيف المركبات والمشاة وإشارات المرور وخطوط المسارات، وهو أمر بالغ الأهمية للملاحة الآمنة واتخاذ القرارات، كما رأينا في الأنظمة التي طورتها شركات مثل Waymo.
  2. تحليل الصور الطبية: في حلول الذكاء الاصطناعي في مجال الرعاية الصحية، تُستخدم العمود الفقري لتحليل الفحوصات الطبية مثل الأشعة السينية أو الأشعة المقطعية أو التصوير بالرنين المغناطيسي. على سبيل المثال، قد يستخرج العمود الفقري مثل DenseNet ميزات من الأشعة السينية للصدر للمساعدة في اكتشاف علامات الالتهاب الرئوي أو من الأشعة المقطعية لتحديد الأورام المحتملة(الأبحاث ذات الصلة في طب الأشعة: الذكاء الاصطناعي). وهذا يساعد أخصائيي الأشعة في التشخيص وتخطيط العلاج. يمكن تكييف نماذج التحليلات فوق الصوتية مثل YOLO11 لمهام مثل الكشف عن الأورام من خلال الاستفادة من العمود الفقري القوي.

يُمكنك تبسيط عملية استخدام العمود الفقري القوي لمشاريعك الخاصة باستخدام منصات مثل Ultralytics HUB، التي تُبسّط إدارة مجموعات البيانات وتدريب النماذج المخصصة.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون ونمو مع المبتكرين العالميين

انضم الآن
تم نسخ الرابط إلى الحافظة