Learn how receptive fields help [CNNs](https://www.ultralytics.com/glossary/convolutional-neural-network-cnn) see context. Explore why [YOLO26](https://docs.ultralytics.com/models/yolo26/) optimizes this for superior object detection.
In the domain of computer vision (CV) and deep learning, the receptive field refers to the specific region of an input image that a particular neuron in a neural network (NN) "sees" or analyzes. Conceptually, it functions similarly to the field of view of a human eye or a camera lens. It determines how much spatial context a model can perceive at any given layer. As data progresses through a Convolutional Neural Network (CNN), the receptive field typically expands, allowing the system to transition from identifying tiny, local details—like edges or corners—to understanding complex, global structures like entire objects or scenes.
Le dimensioni e la profondità del campo recettivo sono determinate dall'architettura della rete. Nei livelli iniziali, i neuroni hanno solitamente un campo recettivo piccolo, concentrandosi su un minuscolo gruppo di pixel per catturare texture a grana fine. Man mano che la rete si approfondisce, operazioni come livelli di pooling e convoluzioni stridate riducono efficacemente il campionamento delle mappe delle caratteristiche. Questo processo consente ai neuroni successivi di aggregare informazioni da una porzione molto più ampia dell'input originale.
Le architetture moderne, tra cui l'avanguardistico Ultralytics , sono progettate per bilanciare questi campi meticolosamente. Se il campo ricettivo è troppo ristretto, il modello potrebbe non riuscire a riconoscere oggetti di grandi dimensioni perché non è in grado di percepire l'intera forma. Al contrario, se il campo è eccessivamente ampio senza mantenere la risoluzione, il modello potrebbe non rilevare oggetti di piccole dimensioni. Per ovviare a questo problema, gli ingegneri utilizzano spesso convoluzioni dilatate (note anche come convoluzioni atrous ) per espandere il campo ricettivo senza ridurre la risoluzione spaziale, una tecnica fondamentale per attività di alta precisione come la segmentazione semantica.
L'ottimizzazione del campo ricettivo è fondamentale per il successo di varie soluzioni di intelligenza artificiale.
Per comprendere appieno la progettazione di rete, è utile distinguere il campo recettivo da termini simili:
State-of-the-art models like the newer YOLO26 utilize Feature Pyramid Networks (FPN) to maintain effective receptive fields for objects of all sizes. The following example shows how to load a model and perform object detection, leveraging these internal architectural optimizations automatically. Users looking to train their own models with optimized architectures can utilize the Ultralytics Platform for seamless dataset management and cloud training.
from ultralytics import YOLO
# Load the latest YOLO26 model with optimized multi-scale receptive fields
model = YOLO("yolo26n.pt")
# Run inference; the model aggregates features from various receptive field sizes
results = model("https://ultralytics.com/images/bus.jpg")
# Display the results, detecting both large (bus) and small (person) objects
results[0].show()
