Learn how receptive fields help [CNNs](https://www.ultralytics.com/glossary/convolutional-neural-network-cnn) see context. Explore why [YOLO26](https://docs.ultralytics.com/models/yolo26/) optimizes this for superior object detection.
In the domain of computer vision (CV) and deep learning, the receptive field refers to the specific region of an input image that a particular neuron in a neural network (NN) "sees" or analyzes. Conceptually, it functions similarly to the field of view of a human eye or a camera lens. It determines how much spatial context a model can perceive at any given layer. As data progresses through a Convolutional Neural Network (CNN), the receptive field typically expands, allowing the system to transition from identifying tiny, local details—like edges or corners—to understanding complex, global structures like entire objects or scenes.
La taille et la profondeur du champ réceptif sont dictées par l'architecture du réseau. Dans les couches initiales, les neurones ont généralement un petit champ réceptif, se concentrant sur un petit groupe de pixels pour capturer des textures fines. À mesure que le réseau s'approfondit, des opérations telles que les couches de regroupement et les convolutions à pas variable réduisent efficacement la résolution des cartes de caractéristiques. Ce processus permet aux neurones suivants d'agréger des informations provenant d'une partie beaucoup plus grande de l'entrée d'origine.
Les architectures modernes, notamment le modèle de pointe Ultralytics , sont conçues pour équilibrer ces champs avec minutie. Si le champ réceptif est trop étroit, le modèle peut ne pas reconnaître les objets de grande taille, car il ne peut pas percevoir la forme dans son ensemble. À l'inverse, si le champ est trop large sans maintenir la résolution, le modèle pourrait ne pas détecter les petits objets. Pour remédier à cela, les ingénieurs utilisent souvent des convolutions dilatées (également appelées convolutions atrous ) pour élargir le champ réceptif sans réduire la résolution spatiale, une technique essentielle pour les tâches de haute précision telles que la segmentation sémantique.
L'optimisation du champ réceptif est essentielle à la réussite de diverses solutions d'IA.
Pour bien comprendre la conception des réseaux, il est utile de différencier le champ réceptif d'autres termes similaires :
State-of-the-art models like the newer YOLO26 utilize Feature Pyramid Networks (FPN) to maintain effective receptive fields for objects of all sizes. The following example shows how to load a model and perform object detection, leveraging these internal architectural optimizations automatically. Users looking to train their own models with optimized architectures can utilize the Ultralytics Platform for seamless dataset management and cloud training.
from ultralytics import YOLO
# Load the latest YOLO26 model with optimized multi-scale receptive fields
model = YOLO("yolo26n.pt")
# Run inference; the model aggregates features from various receptive field sizes
results = model("https://ultralytics.com/images/bus.jpg")
# Display the results, detecting both large (bus) and small (person) objects
results[0].show()