Learn how receptive fields help [CNNs](https://www.ultralytics.com/glossary/convolutional-neural-network-cnn) see context. Explore why [YOLO26](https://docs.ultralytics.com/models/yolo26/) optimizes this for superior object detection.
In the domain of computer vision (CV) and deep learning, the receptive field refers to the specific region of an input image that a particular neuron in a neural network (NN) "sees" or analyzes. Conceptually, it functions similarly to the field of view of a human eye or a camera lens. It determines how much spatial context a model can perceive at any given layer. As data progresses through a Convolutional Neural Network (CNN), the receptive field typically expands, allowing the system to transition from identifying tiny, local details—like edges or corners—to understanding complex, global structures like entire objects or scenes.
يتم تحديد حجم وعمق المجال الاستقبالي من خلال بنية الشبكة. في الطبقات الأولية، عادةً ما يكون للخلايا العصبية مجال استقبال صغير، يركز على مجموعة صغيرة من وحدات البكسل لالتقاط نسيج دقيق. مع تعمق الشبكة، تعمل عمليات مثل طبقات التجميع و التلافيف المتدرجة على تقليل دقة خرائط الميزات بشكل فعال. تسمح هذه العملية للخلايا العصبية اللاحقة بتجميع المعلومات من جزء أكبر بكثير من المدخلات الأصلية.
تم تصميم البنى الحديثة، بما في ذلك أحدث Ultralytics ، لتحقيق التوازن بين هذه المجالات بدقة. إذا كان المجال الاستقبالي ضيقًا جدًا، فقد يفشل النموذج في التعرف على الكائنات الكبيرة لأنه لا يمكنه إدراك الشكل بالكامل. وعلى العكس، إذا كان المجال واسعًا للغاية دون الحفاظ على الدقة، فقد يفوت النموذج الأجسام الصغيرة. لمعالجة هذه المشكلة، غالبًا ما يستخدم المهندسون التلافيف الموسعة (المعروفة أيضًا باسم التلافيف الأتروس) لتوسيع المجال الاستقبالي دون تقليل الدقة المكانية، وهي تقنية حيوية للمهام عالية الدقة مثل التقسيم الدلالي.
يعد تحسين المجال الاستقبالي أمرًا بالغ الأهمية لنجاح مختلف حلول الذكاء الاصطناعي.
لفهم تصميم الشبكة بشكل كامل، من المفيد التمييز بين المجال الاستقبالي والمصطلحات المماثلة:
State-of-the-art models like the newer YOLO26 utilize Feature Pyramid Networks (FPN) to maintain effective receptive fields for objects of all sizes. The following example shows how to load a model and perform object detection, leveraging these internal architectural optimizations automatically. Users looking to train their own models with optimized architectures can utilize the Ultralytics Platform for seamless dataset management and cloud training.
from ultralytics import YOLO
# Load the latest YOLO26 model with optimized multi-scale receptive fields
model = YOLO("yolo26n.pt")
# Run inference; the model aggregates features from various receptive field sizes
results = model("https://ultralytics.com/images/bus.jpg")
# Display the results, detecting both large (bus) and small (person) objects
results[0].show()