تعرّف على كيفية تمكين شبكات هرم الميّزات (FPN) من تعزيز دقة اكتشاف الأجسام متعددة المقاييس للأجسام الصغيرة والكبيرة في YOLO11 وأنظمة السيرة الذاتية الحديثة.
شبكة هرم السمات (FPN) هي مكوّن ضمن نماذج التعلّم العميق، وخاصةً بُنى اكتشاف الأجسام، وهي مصممة لتحسين اكتشاف الأجسام بمقاييس مختلفة. في أي صورة معينة، يمكن أن تظهر الأجسام في أي صورة كبيرة أو صغيرة اعتمادًا على حجمها ومسافتها من الكاميرا. تعالج FPN هذا التحدي من خلال إنشاء تمثيل متعدد المقاييس للميزات بكفاءة، مما يسمح للنموذج بالتعرف على سيارة صغيرة بعيدة وشاحنة كبيرة قريبة بدقة عالية في نفس الوقت. وهو يعمل كجسر، أو "عنق" بين مستخرج السمات الرئيسي ومكون التنبؤ النهائي للشبكة.
تعمل شبكة FPN من خلال الجمع بين ميزات منخفضة الدقة وقوية دلالياً مع ميزات عالية الدقة وضعيفة دلالياً. وتتحقق هذه العملية عادةً من خلال بنية ذات مسارين واتصالات جانبية.
في نموذج نموذجي للكشف عن الأجسام، تنقسم البنية إلى عمود فقري وعنق ورأس. يعد FPN خيارًا شائعًا لمكون الرقبة. يتمثل دوره الأساسي في تجميع الميزات المستخرجة من العمود الفقري قبل استخدامها في مهمة الكشف النهائي. من خلال توفير تمثيل غني ومتعدد المقاييس للميزات، تُمكِّن النماذج مثل YOLO11 من الأداء القوي عبر مجموعة واسعة من أحجام الكائنات. يُعد هذا النهج أكثر كفاءة من الناحية الحسابية من معالجة الصورة بدقة متعددة بشكل منفصل، حيث إنه يعيد استخدام الميزات المحسوبة في التمرير الأمامي الوحيد للعمود الفقري. تستفيد العديد من النماذج المتطورة من هذا المفهوم، كما رأينا في مقارنات نماذج YOLO المختلفة.
تُعد الشبكات النطاقات الضوئية الحرة جزءًا لا يتجزأ من العديد من تطبيقات الرؤية الحاسوبية الحديثة حيث يكون اكتشاف الأجسام متعددة النطاقات أمرًا بالغ الأهمية.
في حين أن FPN يمثل تقدمًا كبيرًا، فقد طورت البنى الأحدث هذا المفهوم. ومن الأمثلة البارزة على ذلك شبكة الهرم ثنائية الاتجاه (BiFPPN)، التي تم تقديمها في ورقة EfficientDet البحثية التي أعدتها Google Research. على عكس مسار FPN الهرمي البسيط من أعلى إلى أسفل، تقدم BiFPPN اتصالات ثنائية الاتجاه (من أعلى إلى أسفل ومن أسفل إلى أعلى) وتستخدم دمج الميزات المرجحة، مما يسمح للشبكة بتعلم أهمية ميزات المدخلات المختلفة. غالبًا ما يؤدي ذلك إلى أداء وكفاءة أفضل، كما هو موضح في مقارنات مثل EfficientDet مقابل YOLO11. في حين أن FPN هو مفهوم أساسي، فإن BiFPPN يمثل نهجًا أكثر تقدمًا وتحسينًا لدمج الميزات متعددة النطاقات.