Learn how receptive fields help [CNNs](https://www.ultralytics.com/glossary/convolutional-neural-network-cnn) see context. Explore why [YOLO26](https://docs.ultralytics.com/models/yolo26/) optimizes this for superior object detection.
In the domain of computer vision (CV) and deep learning, the receptive field refers to the specific region of an input image that a particular neuron in a neural network (NN) "sees" or analyzes. Conceptually, it functions similarly to the field of view of a human eye or a camera lens. It determines how much spatial context a model can perceive at any given layer. As data progresses through a Convolutional Neural Network (CNN), the receptive field typically expands, allowing the system to transition from identifying tiny, local details—like edges or corners—to understanding complex, global structures like entire objects or scenes.
O tamanho e a profundidade do campo recetivo são ditados pela arquitetura da rede. Nas camadas iniciais, os neurónios geralmente têm um campo recetivo pequeno, concentrando-se num pequeno conjunto de pixels para capturar texturas finas. À medida que a rede se aprofunda, operações como camadas de agrupamento e convoluções escalonadas efetivamente reduzem a resolução dos mapas de características. Esse processo permite que os neurónios subsequentes agreguem informações de uma porção muito maior da entrada original.
As arquiteturas modernas, incluindo a tecnologia de ponta Ultralytics , são projetadas para equilibrar esses campos meticulosamente. Se o campo recetivo for muito estreito, o modelo pode não reconhecer objetos grandes, pois não consegue perceber a forma completa. Por outro lado, se o campo for excessivamente amplo sem manter a resolução, o modelo pode deixar de reconhecer objetos pequenos. Para resolver isso, os engenheiros costumam usar convoluções dilatadas (também conhecidas como convoluções atrous ) para expandir o campo receptivo sem reduzir a resolução espacial, uma técnica vital para tarefas de alta precisão, como segmentação semântica.
Otimizar o campo recetivo é fundamental para o sucesso de várias soluções de IA.
Para compreender totalmente o design de rede, é útil diferenciar o campo recetivo de termos semelhantes:
State-of-the-art models like the newer YOLO26 utilize Feature Pyramid Networks (FPN) to maintain effective receptive fields for objects of all sizes. The following example shows how to load a model and perform object detection, leveraging these internal architectural optimizations automatically. Users looking to train their own models with optimized architectures can utilize the Ultralytics Platform for seamless dataset management and cloud training.
from ultralytics import YOLO
# Load the latest YOLO26 model with optimized multi-scale receptive fields
model = YOLO("yolo26n.pt")
# Run inference; the model aggregates features from various receptive field sizes
results = model("https://ultralytics.com/images/bus.jpg")
# Display the results, detecting both large (bus) and small (person) objects
results[0].show()