استعدوا لـ YOLO Vision 2025!
25 سبتمبر، 2025
10:00 — 18:00 بتوقيت بريطانيا الصيفي
حدث هجين
مؤتمر Yolo Vision 2024
مسرد المصطلحات

شبكة الميزات الهرمية (FPN)

تعرّف على كيفية تمكين شبكات هرم الميّزات (FPN) من تعزيز دقة اكتشاف الأجسام متعددة المقاييس للأجسام الصغيرة والكبيرة في YOLO11 وأنظمة السيرة الذاتية الحديثة.

شبكة هرم السمات (FPN) هي مكوّن ضمن نماذج التعلّم العميق، وخاصةً بُنى اكتشاف الأجسام، وهي مصممة لتحسين اكتشاف الأجسام بمقاييس مختلفة. في أي صورة معينة، يمكن أن تظهر الأجسام في أي صورة كبيرة أو صغيرة اعتمادًا على حجمها ومسافتها من الكاميرا. تعالج FPN هذا التحدي من خلال إنشاء تمثيل متعدد المقاييس للميزات بكفاءة، مما يسمح للنموذج بالتعرف على سيارة صغيرة بعيدة وشاحنة كبيرة قريبة بدقة عالية في نفس الوقت. وهو يعمل كجسر، أو "عنق" بين مستخرج السمات الرئيسي ومكون التنبؤ النهائي للشبكة.

كيف تعمل شبكة هرم الميزات

تعمل شبكة FPN من خلال الجمع بين ميزات منخفضة الدقة وقوية دلالياً مع ميزات عالية الدقة وضعيفة دلالياً. وتتحقق هذه العملية عادةً من خلال بنية ذات مسارين واتصالات جانبية.

  1. المسار التصاعدي من الأسفل إلى الأعلى: هذا هو الممر الأمامي القياسي للشبكة العصبية التلافيفية (CNN)، والذي يعمل بمثابة العمود الفقري للنموذج. ومع مرور الصورة عبر الطبقات المتتالية، تنخفض خرائط السمات الناتجة من حيث الحجم المكاني ولكنها تزداد في العمق الدلالي، مما يعني أنها تلتقط مفاهيم أكثر تجريداً.
  2. المسار من أعلى إلى أسفل: تأخذ الشبكة بعد ذلك خريطة السمات من الطبقة الأعمق (وهي صغيرة ولكنها غنية بالمعلومات) وتبدأ في رفعها.
  3. الروابط الجانبية: عندما يعيد المسار من أعلى إلى أسفل بناء خرائط ميزات أكبر، فإنه يدمجها مع خرائط الميزات المقابلة من المسار من أسفل إلى أعلى. يعمل هذا الدمج على إثراء الطبقات التي تم أخذ عينات منها بتفاصيل أدق وأكثر محلية من الطبقات السابقة. والنتيجة هي "هرم" من خرائط الميزات، كل منها غني بالدلالات والتفاصيل المكانية على حد سواء، والتي يتم تغذيتها بعد ذلك إلى رأس الكشف للتنبؤ. تقدم ورقة بحث FPN الأصلية شرحاً تقنياً مفصلاً لهذه العملية.

دور FPN في الكشف عن الكائنات

في نموذج نموذجي للكشف عن الأجسام، تنقسم البنية إلى عمود فقري وعنق ورأس. يعد FPN خيارًا شائعًا لمكون الرقبة. يتمثل دوره الأساسي في تجميع الميزات المستخرجة من العمود الفقري قبل استخدامها في مهمة الكشف النهائي. من خلال توفير تمثيل غني ومتعدد المقاييس للميزات، تُمكِّن النماذج مثل YOLO11 من الأداء القوي عبر مجموعة واسعة من أحجام الكائنات. يُعد هذا النهج أكثر كفاءة من الناحية الحسابية من معالجة الصورة بدقة متعددة بشكل منفصل، حيث إنه يعيد استخدام الميزات المحسوبة في التمرير الأمامي الوحيد للعمود الفقري. تستفيد العديد من النماذج المتطورة من هذا المفهوم، كما رأينا في مقارنات نماذج YOLO المختلفة.

تطبيقات واقعية

تُعد الشبكات النطاقات الضوئية الحرة جزءًا لا يتجزأ من العديد من تطبيقات الرؤية الحاسوبية الحديثة حيث يكون اكتشاف الأجسام متعددة النطاقات أمرًا بالغ الأهمية.

  • السيارات ذاتية القيادة: يجب أن تكتشف السيارات ذاتية القيادة المشاة والمركبات وإشارات المرور وعلامات الحارات على مسافات مختلفة. ويساعد نظام الإدراك في السيارة، الذي تم تفصيله في مصادر من مؤسسات مثل جامعة كارنيجي ميلون، على تحديد المشاة البعيدين والسيارة القريبة في نفس الإطار، وهو أمر ضروري للملاحة الآمنة.
  • تحليل الصور الطبية: في مجال الأشعة، يمكن أن تساعد شبكات FPNs في تحليل الصور الطبية للكشف عن الحالات الشاذة ذات الأحجام المختلفة، مثل الآفات الصغيرة والأورام الكبيرة. وتسمح هذه القدرة متعددة المقاييس بإجراء تشخيصات آلية أكثر شمولاً ودقة في مجالات مثل علم الأمراض والأورام، كما نوقش في بحث نشرته المعاهد الوطنية للصحة (NIH).

الشبكة الحرة للسكان الأصليين مقابل الشبكة الثنائية للسكان الأصليين

في حين أن FPN يمثل تقدمًا كبيرًا، فقد طورت البنى الأحدث هذا المفهوم. ومن الأمثلة البارزة على ذلك شبكة الهرم ثنائية الاتجاه (BiFPPN)، التي تم تقديمها في ورقة EfficientDet البحثية التي أعدتها Google Research. على عكس مسار FPN الهرمي البسيط من أعلى إلى أسفل، تقدم BiFPPN اتصالات ثنائية الاتجاه (من أعلى إلى أسفل ومن أسفل إلى أعلى) وتستخدم دمج الميزات المرجحة، مما يسمح للشبكة بتعلم أهمية ميزات المدخلات المختلفة. غالبًا ما يؤدي ذلك إلى أداء وكفاءة أفضل، كما هو موضح في مقارنات مثل EfficientDet مقابل YOLO11. في حين أن FPN هو مفهوم أساسي، فإن BiFPPN يمثل نهجًا أكثر تقدمًا وتحسينًا لدمج الميزات متعددة النطاقات.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن
تم نسخ الرابط إلى الحافظة