Yolo Vision Shenzhen
Shenzhen
Rejoindre maintenant
Glossaire

Champ réceptif

Learn how receptive fields help [CNNs](https://www.ultralytics.com/glossary/convolutional-neural-network-cnn) see context. Explore why [YOLO26](https://docs.ultralytics.com/models/yolo26/) optimizes this for superior object detection.

In the domain of computer vision (CV) and deep learning, the receptive field refers to the specific region of an input image that a particular neuron in a neural network (NN) "sees" or analyzes. Conceptually, it functions similarly to the field of view of a human eye or a camera lens. It determines how much spatial context a model can perceive at any given layer. As data progresses through a Convolutional Neural Network (CNN), the receptive field typically expands, allowing the system to transition from identifying tiny, local details—like edges or corners—to understanding complex, global structures like entire objects or scenes.

The Mechanics Of Receptive Fields

La taille et la profondeur du champ réceptif sont dictées par l'architecture du réseau. Dans les couches initiales, les neurones ont généralement un petit champ réceptif, se concentrant sur un petit groupe de pixels pour capturer des textures fines. À mesure que le réseau s'approfondit, des opérations telles que les couches de regroupement et les convolutions à pas variable réduisent efficacement la résolution des cartes de caractéristiques. Ce processus permet aux neurones suivants d'agréger des informations provenant d'une partie beaucoup plus grande de l'entrée d'origine.

Les architectures modernes, notamment le modèle de pointe Ultralytics , sont conçues pour équilibrer ces champs avec minutie. Si le champ réceptif est trop étroit, le modèle peut ne pas reconnaître les objets de grande taille, car il ne peut pas percevoir la forme dans son ensemble. À l'inverse, si le champ est trop large sans maintenir la résolution, le modèle pourrait ne pas détecter les petits objets. Pour remédier à cela, les ingénieurs utilisent souvent des convolutions dilatées (également appelées convolutions atrous ) pour élargir le champ réceptif sans réduire la résolution spatiale, une technique essentielle pour les tâches de haute précision telles que la segmentation sémantique.

Applications concrètes

L'optimisation du champ réceptif est essentielle à la réussite de diverses solutions d'IA.

  • Conduite autonome : dans le domaine de l' IA appliquée à l'automobile, les systèmes de perception doivent track simultanément les détails track et les obstacles de grande taille. Un véhicule a besoin d'un petit champ réceptif pour identifier les feux de circulation éloignés , tout en nécessitant simultanément un grand champ réceptif pour comprendre la trajectoire d'un camion proche ou la courbure de la voie routière. Cette perception multi-échelle garantit une meilleure sécurité et une meilleure prise de décision de l'IA.
  • Diagnostic médical : lorsqu'ils appliquent l'IA aux soins de santé, les radiologues s'appuient sur des modèles pour détecter les anomalies dans les scanners. Pour identifier les tumeurs cérébrales, le réseau nécessite un large champ réceptif afin de comprendre la symétrie et la structure globales du cerveau. Cependant, pour detect dans la mammographie, le modèle s'appuie sur les premières couches avec de petits champs réceptifs sensibles aux changements subtils de texture.

Distinguer les concepts apparentés

Pour bien comprendre la conception des réseaux, il est utile de différencier le champ réceptif d'autres termes similaires :

  • Champ réceptif vs noyau: La taille du noyau (ou filtre) définit les dimensions de la fenêtre glissante (par exemple, 3x3) pour une seule opération de convolution. Le champ réceptif est une propriété émergente représentant la zone d'entrée totale accumulée affectant un neurone. Une pile de plusieurs noyaux 3x3 donnera un champ réceptif beaucoup plus grand que 3x3.
  • Champ réceptif vs carte de caractéristiques: une carte de caractéristiques est le volume de sortie produit par une couche, contenant les représentations apprises. Le champ réceptif décrit la relation entre un point unique sur cette carte de caractéristiques et l'image d'entrée originale.
  • Champ réceptif vs fenêtre contextuelle: Bien que ces deux termes fassent référence à la portée des données perçues, le terme « fenêtre contextuelle » est généralement utilisé dans le traitement du langage naturel (NLP) ou l'analyse vidéo pour désigner une période temporelle ou séquentielle (par exemple, une limite de jetons). Le champ réceptif fait strictement référence à la zone spatiale dans les données de type grille (images).

Practical Usage In Code

State-of-the-art models like the newer YOLO26 utilize Feature Pyramid Networks (FPN) to maintain effective receptive fields for objects of all sizes. The following example shows how to load a model and perform object detection, leveraging these internal architectural optimizations automatically. Users looking to train their own models with optimized architectures can utilize the Ultralytics Platform for seamless dataset management and cloud training.

from ultralytics import YOLO

# Load the latest YOLO26 model with optimized multi-scale receptive fields
model = YOLO("yolo26n.pt")

# Run inference; the model aggregates features from various receptive field sizes
results = model("https://ultralytics.com/images/bus.jpg")

# Display the results, detecting both large (bus) and small (person) objects
results[0].show()

Rejoindre la communauté Ultralytics

Rejoignez le futur de l'IA. Connectez-vous, collaborez et évoluez avec des innovateurs mondiaux.

Rejoindre maintenant