Yolo Vision Shenzhen
Shenzhen
Iscriviti ora
Glossario

Campo Ricettivo

Learn how receptive fields help [CNNs](https://www.ultralytics.com/glossary/convolutional-neural-network-cnn) see context. Explore why [YOLO26](https://docs.ultralytics.com/models/yolo26/) optimizes this for superior object detection.

In the domain of computer vision (CV) and deep learning, the receptive field refers to the specific region of an input image that a particular neuron in a neural network (NN) "sees" or analyzes. Conceptually, it functions similarly to the field of view of a human eye or a camera lens. It determines how much spatial context a model can perceive at any given layer. As data progresses through a Convolutional Neural Network (CNN), the receptive field typically expands, allowing the system to transition from identifying tiny, local details—like edges or corners—to understanding complex, global structures like entire objects or scenes.

The Mechanics Of Receptive Fields

Le dimensioni e la profondità del campo recettivo sono determinate dall'architettura della rete. Nei livelli iniziali, i neuroni hanno solitamente un campo recettivo piccolo, concentrandosi su un minuscolo gruppo di pixel per catturare texture a grana fine. Man mano che la rete si approfondisce, operazioni come livelli di pooling e convoluzioni stridate riducono efficacemente il campionamento delle mappe delle caratteristiche. Questo processo consente ai neuroni successivi di aggregare informazioni da una porzione molto più ampia dell'input originale.

Le architetture moderne, tra cui l'avanguardistico Ultralytics , sono progettate per bilanciare questi campi meticolosamente. Se il campo ricettivo è troppo ristretto, il modello potrebbe non riuscire a riconoscere oggetti di grandi dimensioni perché non è in grado di percepire l'intera forma. Al contrario, se il campo è eccessivamente ampio senza mantenere la risoluzione, il modello potrebbe non rilevare oggetti di piccole dimensioni. Per ovviare a questo problema, gli ingegneri utilizzano spesso convoluzioni dilatate (note anche come convoluzioni atrous ) per espandere il campo ricettivo senza ridurre la risoluzione spaziale, una tecnica fondamentale per attività di alta precisione come la segmentazione semantica.

Applicazioni nel mondo reale

L'ottimizzazione del campo ricettivo è fondamentale per il successo di varie soluzioni di intelligenza artificiale.

  • Guida autonoma: nell' IA per il settore automobilistico, i sistemi di percezione devono track contemporaneamente dettagli track e ostacoli di grandi dimensioni. Un veicolo necessita di un campo ricettivo ridotto per identificare i semafori distanti, ma allo stesso tempo richiede un campo ricettivo ampio per comprendere la traiettoria di un camion nelle vicinanze o la curvatura della carreggiata. Questa percezione multiscalare garantisce una maggiore sicurezza dell'IA e un processo decisionale più efficace.
  • Diagnostica medica: quando si applica l' intelligenza artificiale in ambito sanitario, i radiologi si affidano a modelli per individuare anomalie nelle scansioni. Per identificare i tumori cerebrali, la rete richiede un ampio campo ricettivo per comprendere la simmetria e la struttura complessiva del cervello. Tuttavia, per detect nella mammografia, il modello si affida a livelli iniziali con campi ricettivi ridotti sensibili a sottili cambiamenti di struttura.

Distinguere i concetti correlati

Per comprendere appieno la progettazione di rete, è utile distinguere il campo recettivo da termini simili:

  • Campo ricettivo vs. Kernel: La dimensione del kernel (o filtro) definisce le dimensioni della finestra scorrevole (ad esempio, 3x3) per una singola operazione di convoluzione. Il campo ricettivo è una proprietà emergente che rappresenta l'area di input totale accumulata che influenza un neurone. Una pila di più kernel 3x3 darà luogo a un campo ricettivo molto più grande di 3x3.
  • Campo ricettivo vs. mappa delle caratteristiche: una mappa delle caratteristiche è il volume di output prodotto da un livello, contenente le rappresentazioni apprese. Il campo ricettivo descrive la relazione tra un singolo punto su quella mappa delle caratteristiche e l'immagine di input originale.
  • Campo ricettivo vs. Finestra contestuale: Sebbene entrambi i termini si riferiscano all'ambito dei dati percepiti, il termine "finestra contestuale" è tipicamente utilizzato nell' elaborazione del linguaggio naturale (NLP) o nell'analisi video per indicare un intervallo temporale o sequenziale (ad esempio, limite di token). Il campo ricettivo si riferisce strettamente all' area spaziale nei dati a griglia (immagini).

Practical Usage In Code

State-of-the-art models like the newer YOLO26 utilize Feature Pyramid Networks (FPN) to maintain effective receptive fields for objects of all sizes. The following example shows how to load a model and perform object detection, leveraging these internal architectural optimizations automatically. Users looking to train their own models with optimized architectures can utilize the Ultralytics Platform for seamless dataset management and cloud training.

from ultralytics import YOLO

# Load the latest YOLO26 model with optimized multi-scale receptive fields
model = YOLO("yolo26n.pt")

# Run inference; the model aggregates features from various receptive field sizes
results = model("https://ultralytics.com/images/bus.jpg")

# Display the results, detecting both large (bus) and small (person) objects
results[0].show()

Unitevi alla comunità di Ultralytics

Entra nel futuro dell'AI. Connettiti, collabora e cresci con innovatori globali

Iscriviti ora