اكتشف كيف تعمل شبكات Feature Pyramid Networks (FPN) على تحسين الكشف عن الكائنات متعددة المقاييس. تعرف على كيفية استخدام Ultralytics لشبكات FPN المتقدمة detect الكائنات detect والكبيرة.
شبكة هرمية مميزة (FPN) هي مكون معماري متخصص يستخدم في أنظمة الرؤية الحاسوبية (CV) لتحسين الكشف عن الكائنات بمختلف الأحجام. وهي تحل بشكل فعال تحديًا طويل الأمد في تحليل الصور: التعرف على كل من الهياكل الكبيرة البارزة والتفاصيل الصغيرة البعيدة في نفس الصورة. من خلال إنشاء تمثيل متعدد المستويات للمدخلات — مشابه من الناحية النظرية للهرم — تسمح شبكات FPN للشبكات العصبية باستخراج معلومات دلالية غنية في كل مستوى من مستويات الدقة. تقع هذه البنية عادةً بين العمود الفقري، الذي يستخرج الميزات الأولية، و رأس الكشف، الذي يتنبأ بفئات الكائنات والمربعات المحيطة.
يكمن جوهر ابتكار شبكة FPN في طريقة معالجتها للمعلومات. الشبكات العصبية التلافيفية (CNNs) تخلق بشكل طبيعي تسلسلاً هرمياً للميزات حيث يتم تقليل دقة الصورة المدخلة تدريجياً. في حين أن هذا يعمق الفهم الدلالي (معرفة ما هو موجود في الصورة)، إلا أنه غالباً ما يقلل من الدقة المكانية (معرفة مكانه بالضبط )، مما يؤدي إلى اختفاء الأجسام الصغيرة.
تتناول FPNs هذه المسألة من خلال عملية من ثلاث خطوات:
ينتج عن هذا المزيج هرم يكون لكل مستوى فيه دلالات قوية وتوطين جيد، مما يعزز الدقة و الاسترجاع للأشياء.
تعد شبكات التعرف على الأشياء (FPN) حجر الزاوية في البنى الحديثة للكشف عن الأشياء. قبل ظهورها، كان على النماذج الاختيار بين السرعة (باستخدام الطبقة النهائية فقط) أو الدقة (معالجة هرم الصور، وهو أمر بطيء للغاية). توفر شبكات FPN حلاً يجمع بين أفضل ما في العالمين، مما يتيح الاستدلال في الوقت الفعلي دون التضحية بقدرات اكتشاف الأجسام الصغيرة.
هذه الكفاءة أمر بالغ الأهمية بالنسبة للطرازات المتطورة مثل YOLO26، التي تستخدم شبكات تجميع متطورة مستوحاة من مبادئ FPN (مثل PANet) لتحقيق أداء متطور. تضمن البنية الهندسية أن يتم نشر النموذج على أجهزة حافة الشبكة أو خوادم قوية عبر Ultralytics ، فإنه يحافظ على دقة عالية عبر مجموعات بيانات متنوعة.
إن القدرة متعددة المقاييس لشبكات FPN تجعلها لا غنى عنها في الصناعات التي تعتبر فيها السلامة والدقة أمرين بالغين الأهمية.
من المفيد التمييز بين FPN القياسي ومتغيراته المتطورة الموجودة في البنى الأحدث.
مكتبات متقدمة مثل ultralytics التعامل مع تعقيد بناء FPN داخليًا. عند تحميل
نموذج مثل YOLO26، تتضمن البنية تلقائيًا طبقات تجميع الميزات هذه لتحقيق أقصى قدر من الأداء.
from ultralytics import YOLO
# Load the YOLO26 model, which uses advanced feature pyramid principles internally
# The 'n' suffix indicates the nano version, optimized for speed
model = YOLO("yolo26n.pt")
# Perform inference on an image containing objects of various sizes
# The model's neck (FPN-based) aggregates features to detect small and large items
results = model("https://ultralytics.com/images/bus.jpg")
# Display results to see bounding boxes around buses (large) and people (small)
results[0].show()