اكتشف كيف يحدد المجال الاستقبالي ما تراه الشبكة العصبية. تعرف على كيفية قيام Ultralytics بتحسين السياق المكاني detect من جميع الأحجام بفعالية.
في مجال الرؤية الحاسوبية (CV) والتعلم العميق ، يشير المجال الاستقبالي إلى المنطقة المحددة من صورة الإدخال التي "تراها" أو تحللها خلية عصبية معينة في شبكة عصبية (NN). من الناحية النظرية، يعمل بشكل مشابه لمجال رؤية العين البشرية أو عدسة الكاميرا. وهو يحدد مقدار السياق المكاني الذي يمكن للنموذج إدراكه في أي طبقة معينة. مع تقدم البيانات عبر شبكة عصبية تلافيفية (CNN)، يتوسع المجال الاستقبالي عادةً، مما يسمح للنظام بالانتقال من تحديد التفاصيل الصغيرة والمحلية — مثل الحواف أو الزوايا — إلى فهم الهياكل المعقدة والشاملة مثل الكائنات أو المشاهد بأكملها.
يتم تحديد حجم وعمق المجال الاستقبالي من خلال بنية الشبكة. في الطبقات الأولية، عادةً ما يكون للخلايا العصبية مجال استقبال صغير، يركز على مجموعة صغيرة من وحدات البكسل لالتقاط نسيج دقيق. مع تعمق الشبكة، تعمل عمليات مثل طبقات التجميع و التلافيف المتدرجة على تقليل دقة خرائط الميزات بشكل فعال. تسمح هذه العملية للخلايا العصبية اللاحقة بتجميع المعلومات من جزء أكبر بكثير من المدخلات الأصلية.
تم تصميم البنى الحديثة، بما في ذلك أحدث Ultralytics ، لتحقيق التوازن بين هذه المجالات بدقة. إذا كان المجال الاستقبالي ضيقًا جدًا، فقد يفشل النموذج في التعرف على الكائنات الكبيرة لأنه لا يمكنه إدراك الشكل بالكامل. وعلى العكس، إذا كان المجال واسعًا للغاية دون الحفاظ على الدقة، فقد يفوت النموذج الأجسام الصغيرة. لمعالجة هذه المشكلة، غالبًا ما يستخدم المهندسون التلافيف الموسعة (المعروفة أيضًا باسم التلافيف الأتروس) لتوسيع المجال الاستقبالي دون تقليل الدقة المكانية، وهي تقنية حيوية للمهام عالية الدقة مثل التقسيم الدلالي.
يعد تحسين المجال الاستقبالي أمرًا بالغ الأهمية لنجاح مختلف حلول الذكاء الاصطناعي.
لفهم تصميم الشبكة بشكل كامل، من المفيد التمييز بين المجال الاستقبالي والمصطلحات المماثلة:
تستخدم النماذج الحديثة مثل YOLO26 الأحدث شبكات هرم الميزات (FPN) للحفاظ على مجالات استقبال فعالة للكائنات من جميع الأحجام. يوضح المثال التالي كيفية تحميل نموذج وإجراء الكشف عن الكائنات، بالاستفادة من هذه التحسينات الداخلية للبنية تلقائيًا. يمكن للمستخدمين الذين يرغبون في تدريب نماذجهم الخاصة باستخدام بنى محسّنة استخدام Ultralytics لإدارة مجموعات البيانات بسلاسة و التدريب السحابي.
from ultralytics import YOLO
# Load the latest YOLO26 model with optimized multi-scale receptive fields
model = YOLO("yolo26n.pt")
# Run inference; the model aggregates features from various receptive field sizes
results = model("https://ultralytics.com/images/bus.jpg")
# Display the results, detecting both large (bus) and small (person) objects
results[0].show()