Yolo Vision Shenzhen
Shenzhen
Únete ahora
Glosario

Campo receptivo

Learn how receptive fields help [CNNs](https://www.ultralytics.com/glossary/convolutional-neural-network-cnn) see context. Explore why [YOLO26](https://docs.ultralytics.com/models/yolo26/) optimizes this for superior object detection.

In the domain of computer vision (CV) and deep learning, the receptive field refers to the specific region of an input image that a particular neuron in a neural network (NN) "sees" or analyzes. Conceptually, it functions similarly to the field of view of a human eye or a camera lens. It determines how much spatial context a model can perceive at any given layer. As data progresses through a Convolutional Neural Network (CNN), the receptive field typically expands, allowing the system to transition from identifying tiny, local details—like edges or corners—to understanding complex, global structures like entire objects or scenes.

The Mechanics Of Receptive Fields

El tamaño y la profundidad del campo receptivo vienen dictados por la arquitectura de la red. En las capas iniciales, las neuronas suelen tener un campo receptivo pequeño, centrándose en un pequeño grupo de píxeles para capturar texturas de grano fino. A medida que la red se profundiza, operaciones como las capas de agrupamiento y las convoluciones escalonadas reducen eficazmente la resolución de los mapas de características. Este proceso permite a las neuronas posteriores agregar información de una porción mucho mayor de la entrada original.

Las arquitecturas modernas, incluida la vanguardista Ultralytics , están diseñadas para equilibrar estos campos meticulosamente. Si el campo receptivo es demasiado estrecho, el modelo puede no reconocer objetos grandes porque no puede percibir la forma completa. Por el contrario, si el campo es excesivamente amplio sin mantener la resolución, el modelo podría pasar por alto objetos pequeños. Para solucionar esto, los ingenieros suelen utilizar convoluciones dilatadas (también conocidas como convoluciones atrous ) para ampliar el campo receptivo sin reducir la resolución espacial, una técnica vital para tareas de alta precisión como la segmentación semántica.

Aplicaciones en el mundo real

La optimización del campo receptivo es fundamental para el éxito de diversas soluciones de IA.

  • Conducción autónoma: en la IA para automoción, los sistemas de percepción deben track simultáneamente detalles track y obstáculos grandes. Un vehículo necesita un campo receptivo pequeño para identificar semáforos lejanos , al tiempo que requiere un campo receptivo grande para comprender la trayectoria de un camión cercano o la curvatura del carril de la carretera. Esta percepción multiescala garantiza una mayor seguridad y una mejor toma de decisiones de la IA.
  • Diagnóstico médico: al aplicar la IA en el ámbito sanitario, los radiólogos se basan en modelos para detectar anomalías en las exploraciones. Para identificar tumores cerebrales, la red requiere un amplio campo receptivo que le permita comprender la simetría y la estructura generales del cerebro. Sin embargo, para detect en mamografías, el modelo se basa en capas tempranas con campos receptivos pequeños sensibles a cambios sutiles en la textura.

Distinguir conceptos relacionados

Para comprender plenamente el diseño de redes, resulta útil diferenciar el campo receptivo de términos similares:

  • Campo receptivo frente a núcleo: El tamaño del núcleo (o filtro) define las dimensiones de la ventana deslizante (por ejemplo, 3x3) para una sola operación de convolución. El campo receptivo es una propiedad emergente que representa el área de entrada acumulada total que afecta a una neurona. Una pila de múltiples núcleos 3x3 dará como resultado un campo receptivo mucho mayor que 3x3.
  • Campo receptivo frente a mapa de características: un mapa de características es el volumen de salida producido por una capa, que contiene las representaciones aprendidas. El campo receptivo describe la relación entre un único punto de ese mapa de características y la imagen de entrada original.
  • Campo receptivo frente a ventana contextual: Aunque ambos términos se refieren al alcance de los datos percibidos, «ventana contextual» se utiliza normalmente en el procesamiento del lenguaje natural (NLP) o el análisis de vídeo para denotar un intervalo temporal o secuencial (por ejemplo, límite de tokens). El campo receptivo se refiere estrictamente al área espacial en datos en forma de cuadrícula (imágenes).

Practical Usage In Code

State-of-the-art models like the newer YOLO26 utilize Feature Pyramid Networks (FPN) to maintain effective receptive fields for objects of all sizes. The following example shows how to load a model and perform object detection, leveraging these internal architectural optimizations automatically. Users looking to train their own models with optimized architectures can utilize the Ultralytics Platform for seamless dataset management and cloud training.

from ultralytics import YOLO

# Load the latest YOLO26 model with optimized multi-scale receptive fields
model = YOLO("yolo26n.pt")

# Run inference; the model aggregates features from various receptive field sizes
results = model("https://ultralytics.com/images/bus.jpg")

# Display the results, detecting both large (bus) and small (person) objects
results[0].show()

Únase a la comunidad Ultralytics

Únete al futuro de la IA. Conecta, colabora y crece con innovadores de todo el mundo

Únete ahora