Conoce YOLO26: IA de visión de nueva generación.
Ultralytics
Volver al glosario de Ultralytics

Vanishing Gradient

Aprende cómo afecta el problema del gradiente desvaneciente al aprendizaje profundo y explora soluciones eficaces como ReLU y las conexiones residuales utilizadas en Ultralytics YOLO26.

El problema del gradiente desvaneciente es un desafío importante que surge durante el entrenamiento de redes neuronales artificiales profundas. Ocurre cuando los gradientes (los valores que dictan cuánto deben cambiar los parámetros de la red) se vuelven increíblemente pequeños a medida que se propagan hacia atrás desde la capa de salida hacia las capas de entrada. Dado que estos gradientes son esenciales para actualizar los pesos del modelo, su desaparición provoca que las primeras capas de la red dejen de aprender. Este fenómeno impide eficazmente que el modelo capture patrones complejos en los datos, lo que limita la profundidad y el rendimiento de las arquitecturas de aprendizaje profundo.

Link to this sectionLa mecánica de las señales que desaparecen#

Para entender por qué ocurre esto, resulta útil observar el proceso de retropropagación. Durante el entrenamiento, la red calcula el error entre su predicción y el objetivo real mediante una función de pérdida. Este error se envía luego hacia atrás a través de las capas para ajustar los pesos. Este ajuste se basa en la regla de la cadena del cálculo, que implica multiplicar las derivadas de las funciones de activación capa por capa.

Si una red utiliza funciones de activación como la función sigmoide o la tangente hiperbólica (tanh), las derivadas suelen ser menores que 1. Cuando se multiplican muchos de estos números pequeños en una red profunda con docenas o cientos de capas, el resultado se aproxima a cero. Puedes visualizar esto como el juego del "teléfono escacharrado", donde un mensaje se susurra a lo largo de una larga fila de personas; para cuando llega al principio de la fila, el mensaje se ha vuelto inaudible y la primera persona no sabe qué decir.

Link to this sectionSoluciones y arquitecturas modernas#

El campo de la IA ha desarrollado varias estrategias robustas para mitigar los gradientes desvanecientes, lo que permite la creación de modelos potentes como Ultralytics YOLO26.

  • ReLU y variantes: La unidad lineal rectificada (ReLU) y sus sucesoras, como Leaky ReLU y SiLU, no se saturan para valores positivos. Sus derivadas son 1 o una constante pequeña, lo que preserva la magnitud del gradiente a través de las capas profundas.
  • Conexiones residuales: Introducidas en las redes residuales (ResNets), estas son "conexiones de salto" que permiten que el gradiente pase por alto una o más capas. Esto crea una "autopista" para que el gradiente fluya sin obstáculos hacia las capas anteriores, un concepto esencial para la detección de objetos moderna.
  • Normalización por lotes (Batch Normalization): Al normalizar las entradas de cada capa, la normalización por lotes asegura que la red opere en un régimen estable donde las derivadas no sean demasiado pequeñas, lo que reduce la dependencia de una inicialización cuidadosa.
  • Arquitecturas con puertas (Gated Architectures): Para datos secuenciales, las redes de memoria a corto-largo plazo (LSTM) y las GRU utilizan puertas especializadas para decidir cuánta información retener u olvidar, protegiendo eficazmente el gradiente para que no desaparezca en secuencias largas.

Link to this sectionGradientes desvanecientes frente a explosivos#

Aunque provienen del mismo mecanismo subyacente (multiplicación repetida), los gradientes desvanecientes son distintos de los gradientes explosivos.

  • Gradiente desvaneciente: Los gradientes se acercan a cero, lo que provoca que el aprendizaje se detenga. Esto es común en redes profundas con activaciones sigmoides.
  • Gradiente explosivo: Los gradientes se acumulan hasta volverse excesivamente grandes, haciendo que los pesos del modelo fluctúen violentamente o alcancen NaN (no es un número). Esto se soluciona a menudo mediante el recorte de gradiente.

Link to this sectionAplicaciones en el mundo real#

Superar los gradientes desvanecientes ha sido un requisito previo para el éxito de las aplicaciones modernas de IA.

  1. Detección profunda de objetos: Los modelos utilizados para vehículos autónomos, como la serie YOLO, requieren cientos de capas para diferenciar entre peatones, señales y vehículos. Sin soluciones como bloques residuales y normalización por lotes, entrenar estas redes profundas en conjuntos de datos masivos como COCO sería imposible. Herramientas como la plataforma de Ultralytics ayudan a optimizar este proceso de entrenamiento, asegurando que estas arquitecturas complejas converjan correctamente.

  2. Traducción automática: En el procesamiento del lenguaje natural (NLP), traducir una oración larga requiere entender la relación entre la primera y la última palabra. Resolver el problema del gradiente desvaneciente en RNN (mediante LSTM) y más tarde en Transformers permitió que los modelos mantuvieran el contexto a lo largo de párrafos largos, revolucionando los servicios de traducción automática como el Traductor de Google.

Link to this sectionEjemplo en Python#

Los marcos y modelos modernos abstraen muchas de estas complejidades. Cuando entrenas un modelo como YOLO26, la arquitectura incluye automáticamente componentes como la activación SiLU y la normalización por lotes para evitar que los gradientes desaparezcan.

from ultralytics import YOLO

# Load the YOLO26 model (latest generation, Jan 2026)
# This architecture includes residual connections and modern activations
# that inherently prevent vanishing gradients.
model = YOLO("yolo26n.pt")

# Train the model on a dataset
# The optimization process remains stable due to the robust architecture
results = model.train(data="coco8.yaml", epochs=10)

Explore solutions

Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.

Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.

Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.

Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.

Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.

Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.

Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.

Más información
Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.

Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.

Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.

Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.

Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.

Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.

Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.

Más información
Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.

Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.

Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.

Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.

Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.

Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.

Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.

Más información

¡Construyamos juntos el futuro de la IA!

Comienza tu viaje con el futuro del aprendizaje automático