Feature Pyramid Network (FPN)
استكشف كيف تعمل شبكات هرم الميزات (Feature Pyramid Networks (FPN)) على تحسين كشف الأجسام متعدد المقاييس. تعلم كيف يستخدم Ultralytics YOLO26 شبكات FPN المتقدمة لاكتشاف الأجسام الصغيرة والكبيرة.
تعد شبكة هرم الميزات (FPN) مكوناً معمارياً متخصصاً يُستخدم في أنظمة رؤية الحاسوب (CV) الحديثة لتحسين اكتشاف الكائنات بمقاييس مختلفة. وهي تعالج بفعالية تحدياً طويل الأمد في تحليل الصور: التعرف على الهياكل الكبيرة والبارزة والتفاصيل الصغيرة والبعيدة ضمن نفس الصورة. من خلال إنشاء تمثيل متعدد المقاييس للمدخلات—بشكل مشابه مفهومياً للهرم—تسمح شبكات FPN للشبكات العصبية باستخراج معلومات دلالية غنية عند كل مستوى من مستويات الدقة. عادة ما تقع هذه المعمارية بين العمود الفقري (backbone)، الذي يستخرج الميزات الأولية، و**رأس الاكتشاف (detection head)**، الذي يتنبأ بفئات الكائنات وصناديق التحديد (bounding boxes).
Link to this sectionكيف تعمل شبكات هرم الميزات#
يكمن الابتكار الأساسي في شبكة FPN في كيفية معالجتها للمعلومات. تنشئ الشبكات العصبية التلافيفية (CNNs) التقليدية بشكل طبيعي تسلسلاً هرمياً للميزات حيث يتم خفض دقة صورة المدخلات تدريجياً. وبينما يعمق هذا الفهم الدلالي (معرفة ماهية ما في الصورة)، فإنه غالباً ما يقلل من الدقة المكانية (معرفة مكان وجود الكائن بدقة)، مما يجعل الكائنات الصغيرة تتلاشى.
تعالج شبكات FPN هذا الأمر من خلال عملية مكونة من ثلاث خطوات:
-
المسار من الأسفل إلى الأعلى (Bottom-Up Pathway): هذا هو التمرير الأمامي القياسي للشبكة، مثل الشبكة المتبقية (ResNet). أثناء معالجة الشبكة للصورة، تقوم بإنشاء خرائط ميزات (feature maps) تتناقص في الحجم ولكنها تزداد في القيمة الدلالية.
-
المسار من الأعلى إلى الأسفل (Top-Down Pathway): تقوم الشبكة بإنشاء هرم عالي الدقة عن طريق زيادة دقة الميزات الغنية دلالياً من الطبقات العميقة. تقوم هذه الخطوة بـ "استحضار" سياق قوي مرة أخرى إلى خرائط مكانية أكبر.
-
الوصلات الجانبية (Lateral Connections): لاستعادة التفاصيل الدقيقة التي فُقدت أثناء خفض الدقة، تدمج شبكات FPN الميزات ذات الدقة العالية مع الخرائط الأصلية عالية الدقة من المسار من الأسفل إلى الأعلى عبر وصلات جانبية.
ينتج عن هذا المزيج هرم يتمتع فيه كل مستوى بدلالات قوية وتحديد موقع جيد، مما يعزز بشكل كبير الدقة (precision) و**الاستدعاء (recall)** عبر جميع أحجام الكائنات.
Link to this sectionالأهمية في معماريات اكتشاف الكائنات#
تعد شبكات FPN حجر الزاوية في معماريات اكتشاف الكائنات (object detection architectures) الحديثة. قبل طرحها، كان على النماذج الاختيار بين السرعة (باستخدام الطبقة النهائية فقط) أو الدقة (معالجة هرم صور، وهو أمر بطيء جداً). توفر شبكات FPN حلاً يجمع بين أفضل الميزتين، مما يتيح الاستنتاج في الوقت الفعلي (real-time inference) دون التضحية بقدرات اكتشاف الكائنات الصغيرة.
هذه الكفاءة حاسمة للنماذج المتقدمة مثل YOLO26، التي تستخدم شبكات تجميع متطورة مستوحاة من مبادئ FPN (مثل PANet) لتحقيق أداء متطور. تضمن المعمارية أنه سواء تم نشر النموذج على أجهزة الحافة أو خوادم قوية عبر منصة Ultralytics، فإنه يحافظ على دقة عالية عبر مجموعات بيانات متنوعة.
Link to this sectionتطبيقات العالم الحقيقي#
القدرة على التعامل مع مقاييس متعددة تجعل شبكات FPN لا غنى عنها في الصناعات التي تكون فيها السلامة والدقة أمراً بالغ الأهمية.
- الذكاء الاصطناعي في السيارات (AI in Automotive): يجب أن تتتبع المركبات ذاتية القيادة الشاحنات الكبيرة القريبة وإشارات المرور الصغيرة أو المشاة في المسافات البعيدة في آن واحد. تسمح شبكات FPN لمجموعة الإدراك بمعالجة هذه المقاييس المتباينة في تمريرة واحدة، مما يضمن اتخاذ قرارات في الوقت المناسب. غالباً ما تُستخدم مجموعات بيانات مثل nuScenes لقياس هذه القدرات.
- تحليل الصور الطبية (Medical Image Analysis): في التصوير التشخيصي، يتطلب اكتشاف الأمراض رصد تشوهات تتفاوت في حجمها بشكل كبير. يمكن للنموذج المجهز بـ FPN تحديد هياكل الأعضاء الكبيرة والأورام الصغيرة في مراحلها المبكرة في فحوصات MRI، مما يساعد أخصائيي الأشعة في إجراء تشخيصات دقيقة.
- الذكاء الاصطناعي في الزراعة (AI in Agriculture): يعتمد الزراعة الدقيقة على اكتشاف المحاصيل والآفات من صور الطائرات بدون طيار. نظراً لأن ارتفاع الطائرة بدون طيار يمكن أن يختلف، فإن حجم النباتات في الصورة يتغير. تساعد شبكات FPN النماذج على التعميم بشكل جيد، وتنفيذ عد الكائنات (object counting) بدقة بغض النظر عن ارتفاع الكاميرا.
Link to this sectionمقارنة FPN مع مجمعات الميزات الأخرى#
من المفيد التمييز بين شبكة FPN القياسية ومتغيراتها المتطورة الموجودة في المعماريات الأحدث.
- مقارنة FPN مع PANet: بينما تضيف FPN مساراً من الأعلى إلى الأسفل لإثراء الميزات، تضيف شبكة تجميع المسار (PANet) مساراً إضافياً من الأسفل إلى الأعلى فوق FPN. هذا يقصر مسار المعلومات للميزات ذات المستوى المنخفض، مما يحسن تحديد الموقع بشكل أكبر، وهي تقنية غالباً ما يتم تكييفها في نماذج YOLO.
- مقارنة FPN مع BiFPN: الموجودة في EfficientDet، تقدم شبكة هرم الميزات ثنائية الاتجاه (BiFPN) أوزاناً قابلة للتعلم لميزات مختلفة وتزيل العقد التي تحتوي على مدخل واحد فقط، مما يحسن الشبكة من حيث الكفاءة.
Link to this sectionمثال عملي#
تتعامل المكتبات المتقدمة مثل ultralytics مع تعقيدات إنشاء FPN داخلياً. عند تحميل نموذج مثل YOLO26، تتضمن المعمارية تلقائياً طبقات تجميع الميزات هذه لتعظيم الأداء.
from ultralytics import YOLO
# Load the YOLO26 model, which uses advanced feature pyramid principles internally
# The 'n' suffix indicates the nano version, optimized for speed
model = YOLO("yolo26n.pt")
# Perform inference on an image containing objects of various sizes
# The model's neck (FPN-based) aggregates features to detect small and large items
results = model("https://ultralytics.com/images/bus.jpg")
# Display results to see bounding boxes around buses (large) and people (small)
results[0].show()





