Yolo فيجن شنتشن
شنتشن
انضم الآن
مسرد المصطلحات

شبكة الميزات الهرمية (FPN)

اكتشف كيف تعمل شبكات Feature Pyramid Networks (FPN) على تحسين الكشف عن الكائنات متعددة المقاييس. تعرف على كيفية استخدام Ultralytics لشبكات FPN المتقدمة detect الكائنات detect والكبيرة.

شبكة هرمية مميزة (FPN) هي مكون معماري متخصص يستخدم في أنظمة الرؤية الحاسوبية (CV) لتحسين الكشف عن الكائنات بمختلف الأحجام. وهي تحل بشكل فعال تحديًا طويل الأمد في تحليل الصور: التعرف على كل من الهياكل الكبيرة البارزة والتفاصيل الصغيرة البعيدة في نفس الصورة. من خلال إنشاء تمثيل متعدد المستويات للمدخلات — مشابه من الناحية النظرية للهرم — تسمح شبكات FPN للشبكات العصبية باستخراج معلومات دلالية غنية في كل مستوى من مستويات الدقة. تقع هذه البنية عادةً بين العمود الفقري، الذي يستخرج الميزات الأولية، و رأس الكشف، الذي يتنبأ بفئات الكائنات والمربعات المحيطة.

كيف تعمل شبكات هرم الميزات

يكمن جوهر ابتكار شبكة FPN في طريقة معالجتها للمعلومات. الشبكات العصبية التلافيفية (CNNs) تخلق بشكل طبيعي تسلسلاً هرمياً للميزات حيث يتم تقليل دقة الصورة المدخلة تدريجياً. في حين أن هذا يعمق الفهم الدلالي (معرفة ما هو موجود في الصورة)، إلا أنه غالباً ما يقلل من الدقة المكانية (معرفة مكانه بالضبط )، مما يؤدي إلى اختفاء الأجسام الصغيرة.

تتناول FPNs هذه المسألة من خلال عملية من ثلاث خطوات:

  1. المسار التصاعدي: هذا هو التمرير الأمامي القياسي للشبكة، مثل الشبكة المتبقية (ResNet). أثناء معالجة الشبكة للصورة، فإنها تنشئ خرائط ميزات تقل في الحجم ولكنها تزداد في القيمة الدلالية.
  2. المسار من أعلى إلى أسفل: تقوم الشبكة ببناء هرم عالي الدقة عن طريق رفع دقة العينات من السمات الغنية دلالياً من الطبقات الأعمق. هذه الخطوة "تُعيد" السياق القوي إلى خرائط مكانية أكبر .
  3. الوصلات الجانبية: لاستعادة التفاصيل الواضحة المفقودة أثناء تقليل الدقة، تدمج شبكات FPN الميزات التي تمت زيادة دقتها مع الخرائط الأصلية عالية الدقة من المسار التصاعدي عبر الوصلات الجانبية.

ينتج عن هذا المزيج هرم يكون لكل مستوى فيه دلالات قوية وتوطين جيد، مما يعزز الدقة و الاسترجاع للأشياء.

أهمية هياكل الكشف عن الأجسام

تعد شبكات التعرف على الأشياء (FPN) حجر الزاوية في البنى الحديثة للكشف عن الأشياء. قبل ظهورها، كان على النماذج الاختيار بين السرعة (باستخدام الطبقة النهائية فقط) أو الدقة (معالجة هرم الصور، وهو أمر بطيء للغاية). توفر شبكات FPN حلاً يجمع بين أفضل ما في العالمين، مما يتيح الاستدلال في الوقت الفعلي دون التضحية بقدرات اكتشاف الأجسام الصغيرة.

هذه الكفاءة أمر بالغ الأهمية بالنسبة للطرازات المتطورة مثل YOLO26، التي تستخدم شبكات تجميع متطورة مستوحاة من مبادئ FPN (مثل PANet) لتحقيق أداء متطور. تضمن البنية الهندسية أن يتم نشر النموذج على أجهزة حافة الشبكة أو خوادم قوية عبر Ultralytics ، فإنه يحافظ على دقة عالية عبر مجموعات بيانات متنوعة.

تطبيقات واقعية

إن القدرة متعددة المقاييس لشبكات FPN تجعلها لا غنى عنها في الصناعات التي تعتبر فيها السلامة والدقة أمرين بالغين الأهمية.

  • الذكاء الاصطناعي في قطاع السيارات: يجب أن track المركبات ذاتية القيادة في آن واحد الشاحنات track القريبة وإشارات المرور الصغيرة أو المشاة في الابتعاد. تسمح شبكات FPN لمجموعة الإدراك بمعالجة هذه المقاييس المتباينة في خطوة واحدة، مما يضمن اتخاذ القرارات في الوقت المناسب . مجموعات البيانات مثل nuScenes غالبًا ما تستخدم لمقارنة هذه القدرات.
  • تحليل الصور الطبية: في التصوير التشخيصي، يتطلب اكتشاف الأمراض اكتشاف حالات شاذة تختلف اختلافًا كبيرًا في الحجم. يمكن للنموذج المزود بـ FPN تحديد كل من هياكل الأعضاء الكبيرة والأورام الصغيرة في مراحلها المبكرة في فحوصات التصوير بالرنين المغناطيسي، مما يساعد أخصائيي الأشعة في إجراء تشخيصات دقيقة.
  • الذكاء الاصطناعي في الزراعة: تعتمد الزراعة الدقيقة على اكتشاف المحاصيل والآفات من صور الطائرات بدون طيار. ونظرًا لأن ارتفاع الطائرة بدون طيار يمكن أن يتغير، فإن حجم النباتات في الصورة يتغير أيضًا. تساعد شبكات FPN النماذج على التعميم بشكل جيد، مما يؤدي إلى أداء دقيق عد الأجسام بغض النظر عن ارتفاع الكاميرا.

FPN مقابل مجمعات الميزات الأخرى

من المفيد التمييز بين FPN القياسي ومتغيراته المتطورة الموجودة في البنى الأحدث.

  • FPN مقابل PANet: بينما تضيف FPN مسارًا من أعلى إلى أسفل لإثراء الميزات، تضيف شبكة تجميع المسارات (PANet) مسارًا إضافيًا من الأسفل إلى الأعلى فوق FPN. وهذا يقصر مسار المعلومات للميزات منخفضة المستوى، مما يحسن التوطين، وهي تقنية غالبًا ما يتم تكييفها في YOLO .
  • FPN مقابل BiFPN: موجود في EfficientDet، شبكة هرم الميزات ثنائية الاتجاه (BiFPN) أوزانًا قابلة للتعلم لميزات مختلفة وتزيل العقد التي تحتوي على مدخل واحد فقط، مما يؤدي إلى تحسين كفاءة الشبكة .

مثال عملي

مكتبات متقدمة مثل ultralytics التعامل مع تعقيد بناء FPN داخليًا. عند تحميل نموذج مثل YOLO26، تتضمن البنية تلقائيًا طبقات تجميع الميزات هذه لتحقيق أقصى قدر من الأداء.

from ultralytics import YOLO

# Load the YOLO26 model, which uses advanced feature pyramid principles internally
# The 'n' suffix indicates the nano version, optimized for speed
model = YOLO("yolo26n.pt")

# Perform inference on an image containing objects of various sizes
# The model's neck (FPN-based) aggregates features to detect small and large items
results = model("https://ultralytics.com/images/bus.jpg")

# Display results to see bounding boxes around buses (large) and people (small)
results[0].show()

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن