¡Sintonice YOLO Vision 2025!
25 de septiembre de 2025
10:00 — 18:00 BST
Evento híbrido
Yolo Vision 2024
Glosario

Campo receptivo

Descubra la importancia de los campos receptivos en las CNN para la visión artificial. Aprenda cómo impactan en la detección de objetos, la segmentación y la optimización de la IA.

En las Redes Neuronales Convolucionales (CNN), el campo receptivo es la región específica de la imagen de entrada que una característica particular en una capa dada puede "ver" o ser influenciada por. A medida que los datos pasan a través de las capas de una red, el campo receptivo de cada neurona se expande, lo que permite a la red aprender características jerárquicas. En las capas iniciales, las neuronas tienen pequeños campos receptivos y detectan patrones simples como bordes o colores. En las capas más profundas, los campos receptivos se vuelven mucho más grandes, lo que permite a la red reconocer objetos complejos y escenas completas combinando los patrones más simples detectados anteriormente. Este concepto es fundamental para comprender cómo las CNN procesan la información espacial.

Importancia en la visión artificial

El tamaño y la calidad del campo receptivo son críticos para el rendimiento de los modelos de visión artificial (CV). Un campo receptivo de tamaño apropiado asegura que el modelo pueda capturar todo el contexto de un objeto. Si el campo receptivo es demasiado pequeño para una tarea de detección de objetos, el modelo podría identificar solo partes de un objeto (como un neumático en lugar de un coche). Por el contrario, un campo receptivo que es excesivamente grande podría incorporar ruido de fondo que distraiga, lo que podría confundir al modelo.

Diseñar una arquitectura de red eficaz implica equilibrar cuidadosamente el tamaño del campo receptivo para que coincida con la escala de los objetos en el conjunto de datos. Técnicas como el uso de convoluciones dilatadas, también conocidas como convoluciones atrous, permiten aumentar el campo receptivo sin añadir coste computacional, lo que es especialmente útil en tareas como la segmentación semántica. También hay herramientas disponibles para ayudar a visualizar los campos receptivos, lo que ayuda en el diseño y la depuración del modelo.

Aplicaciones en el mundo real

  • Vehículos autónomos: En los coches autónomos, los modelos de detección de objetos deben identificar peatones, vehículos y señales de tráfico de varios tamaños. Un modelo como Ultralytics YOLO11 está diseñado con un campo receptivo suficientemente grande en sus capas más profundas para detectar camiones o autobuses grandes desde la distancia, al tiempo que conserva mapas de características con campos receptivos más pequeños para detectar objetos más pequeños y cercanos.
  • Análisis de imágenes médicas: Al analizar escaneos médicos para la detección de tumores, el tamaño del campo receptivo debe ajustarse a la tarea. La detección de anomalías pequeñas y sutiles como las microcalcificaciones en las mamografías requiere un modelo con una extracción de características de grano fino y campos receptivos más pequeños. Para identificar tumores más grandes en una resonancia magnética, es necesario un campo receptivo más grande para capturar el contexto completo de la lesión y el tejido circundante.

Campo receptivo vs. Conceptos relacionados

Comprender los campos receptivos requiere distinguirlos de términos relacionados:

  • Tamaño del kernel: El kernel (o filtro) es una pequeña matriz de pesos que se desliza sobre una imagen para realizar una convolución. El tamaño del kernel es un hiperparámetro directo definido por el usuario (por ejemplo, 3x3 o 5x5). El campo receptivo, por el contrario, es una propiedad emergente que describe la región acumulativa de la entrada original que afecta la salida de una sola neurona después de múltiples capas convolucionales y de pooling. Un tamaño de kernel mayor en una capa resultará en un campo receptivo más grande.
  • Stride: Stride es el número de píxeles que el kernel convolucional se mueve en cada paso. Un stride mayor aumenta el tamaño del campo receptivo más rápidamente a medida que se profundiza en la red, ya que hace que el mapa de características de salida sea más pequeño, resumiendo eficazmente un área mayor de la entrada.
  • Padding: El padding añade píxeles alrededor del borde de una imagen de entrada antes de la convolución. Si bien su propósito principal es controlar las dimensiones espaciales del mapa de características de salida, también influye en el campo receptivo, especialmente en los bordes de la imagen.

Al entrenar modelos personalizados con frameworks de aprendizaje profundo como PyTorch o TensorFlow, los desarrolladores deben considerar cómo estos elementos impactan colectivamente en el campo receptivo para optimizar el rendimiento de tareas como la segmentación de instancias o la estimación de pose. Plataformas como Ultralytics HUB agilizan este proceso al proporcionar modelos y entornos preconfigurados que están optimizados para una amplia gama de tareas de visión. Para obtener información técnica más profunda, los recursos de organizaciones como la IEEE Computational Intelligence Society pueden ser valiosos.

Únete a la comunidad de Ultralytics

Únete al futuro de la IA. Conecta, colabora y crece con innovadores de todo el mundo

Únete ahora
Enlace copiado al portapapeles