Learn how receptive fields help [CNNs](https://www.ultralytics.com/glossary/convolutional-neural-network-cnn) see context. Explore why [YOLO26](https://docs.ultralytics.com/models/yolo26/) optimizes this for superior object detection.
In the domain of computer vision (CV) and deep learning, the receptive field refers to the specific region of an input image that a particular neuron in a neural network (NN) "sees" or analyzes. Conceptually, it functions similarly to the field of view of a human eye or a camera lens. It determines how much spatial context a model can perceive at any given layer. As data progresses through a Convolutional Neural Network (CNN), the receptive field typically expands, allowing the system to transition from identifying tiny, local details—like edges or corners—to understanding complex, global structures like entire objects or scenes.
El tamaño y la profundidad del campo receptivo vienen dictados por la arquitectura de la red. En las capas iniciales, las neuronas suelen tener un campo receptivo pequeño, centrándose en un pequeño grupo de píxeles para capturar texturas de grano fino. A medida que la red se profundiza, operaciones como las capas de agrupamiento y las convoluciones escalonadas reducen eficazmente la resolución de los mapas de características. Este proceso permite a las neuronas posteriores agregar información de una porción mucho mayor de la entrada original.
Las arquitecturas modernas, incluida la vanguardista Ultralytics , están diseñadas para equilibrar estos campos meticulosamente. Si el campo receptivo es demasiado estrecho, el modelo puede no reconocer objetos grandes porque no puede percibir la forma completa. Por el contrario, si el campo es excesivamente amplio sin mantener la resolución, el modelo podría pasar por alto objetos pequeños. Para solucionar esto, los ingenieros suelen utilizar convoluciones dilatadas (también conocidas como convoluciones atrous ) para ampliar el campo receptivo sin reducir la resolución espacial, una técnica vital para tareas de alta precisión como la segmentación semántica.
La optimización del campo receptivo es fundamental para el éxito de diversas soluciones de IA.
Para comprender plenamente el diseño de redes, resulta útil diferenciar el campo receptivo de términos similares:
State-of-the-art models like the newer YOLO26 utilize Feature Pyramid Networks (FPN) to maintain effective receptive fields for objects of all sizes. The following example shows how to load a model and perform object detection, leveraging these internal architectural optimizations automatically. Users looking to train their own models with optimized architectures can utilize the Ultralytics Platform for seamless dataset management and cloud training.
from ultralytics import YOLO
# Load the latest YOLO26 model with optimized multi-scale receptive fields
model = YOLO("yolo26n.pt")
# Run inference; the model aggregates features from various receptive field sizes
results = model("https://ultralytics.com/images/bus.jpg")
# Display the results, detecting both large (bus) and small (person) objects
results[0].show()