تعرّف على كيفية تمكين شبكات هرم الميّزات (FPN) من تعزيز دقة اكتشاف الأجسام متعددة المقاييس للأجسام الصغيرة والكبيرة في YOLO11 وأنظمة السيرة الذاتية الحديثة.
شبكة هرمية مميزة (FPN) هي بنية متخصصة تستخدم في الرؤية الحاسوبية (CV) لتحسين الكشف عن الأجسام بمقاييس مختلفة. وهي تعمل كعنصر أساسي في العديد من بنى الكشف عن الأجسام، وهي مصممة للتغلب على قيود أجهزة الكشف التقليدية التي تواجه صعوبة في التعرف على العناصر الصغيرة. من خلال إنشاء هرم ميزات متعدد المقاييس من صورة مدخلة ذات دقة واحدة، تتيح شبكات FPN للنماذج detect الهياكل الكبيرة والتفاصيل الدقيقة بدقة عالية. عادةً ما تقع هذه البنية بين العمود الفقري (الذي يستخرج الميزات) و رأس رأس الكشف (الذي يتنبأ بالفئات والمربعات)، مما يثري بشكل فعال المعلومات الدلالية التي تمر إلى الطبقات النهائية.
الهدف الأساسي لشبكة FPN هو الاستفادة من التسلسل الهرمي المتعدد المستويات المتأصل في الشبكات العصبية التلافيفية العميقة الشبكات العصبية التلافيفية (CNNs) مع تقليل التكلفة الحسابية المرتبطة بمعالجة مستويات الصور المتعددة بشكل منفصل. تتكون البنية من ثلاثة مسارات رئيسية تعالج البيانات المرئية:
قبل ظهور شبكات FPN، كان على أجهزة الكشف عن الأجسام عمومًا الاختيار بين استخدام الطبقة العليا فقط (مناسبة للأجسام الكبيرة، غير مناسبة للأجسام الصغيرة) أو معالجة هرم الصور (بطيء ومكلف من الناحية الحسابية). توفر شبكات FPN حلًا "يجمع بين أفضل ما في العالمين". هذه القدرة ضرورية الاستدلال في الوقت الفعلي، مما يسمح لنماذج متقدمة مثل YOLO26 و YOLO11 الحفاظ على معدلات إطارات عالية مع تحديد دقيق للأجسام التي تشغل بضعة بكسلات فقط من الشاشة.
إن القدرة على التعامل مع البيانات متعددة النطاقات تجعل من شبكات FPNs أمرًا لا غنى عنه في مختلف الصناعات التي تعتمد على الذكاء الاصطناعي (AI).
بينما أحدثت FPN ثورة في استخراج الميزات، قامت البنى الأحدث بتحسين هذا المفهوم.
تتعامل مكتبات التعلم العميق Ultralytics مع تعقيدات FPNs داخليًا. يوضح المثال التالي كيفية تحميل نموذج يستخدم بنية هرم الميزات detect .
from ultralytics import YOLO
# Load the YOLO26 model, which utilizes an advanced feature pyramid architecture
# The 'n' suffix stands for nano, a lightweight version of the model
model = YOLO("yolo26n.pt")
# Run inference on an image to detect objects ranging from small to large
# The model internally uses its FPN neck to aggregate features at multiple scales
results = model.predict("https://ultralytics.com/images/bus.jpg")
# Display the resulting bounding boxes and class labels
results[0].show()