Glosario

Red Neuronal Recurrente (RNN)

Descubre el poder de las Redes Neuronales Recurrentes (RNN) para datos secuenciales, desde el PLN hasta el análisis de series temporales. ¡Aprende los conceptos clave y las aplicaciones hoy mismo!

Una Red Neuronal Recurrente (RNN) es una clase especializada de red neuronal (NN) diseñada específicamente para procesar datos secuenciales, donde el orden de las entradas dicta el significado del conjunto. A diferencia de las redes que tratan cada entrada de forma independiente, las RNN poseen una memoria interna que les permite retener la información de los pasos anteriores de una secuencia. información de los pasos anteriores de una secuencia. Esta arquitectura única las convierte en fundamentales para aplicaciones de aprendizaje profundo (deep learning, DL) temporales o secuenciales, como el procesamiento del lenguaje natural (PLN) síntesis de voz y análisis de series temporales. En un "estado oculto" que evoluciona a medida que se procesan nuevos datos, las RNN pueden captar el contexto, lo que les permite predecir la siguiente palabra de una frase o el valor futuro de la cotización de una acción. predecir la siguiente palabra de una frase o el valor futuro de una acción.

Cómo funcionan las redes neuronales recurrentes

La característica definitoria de una RNN es su mecanismo de bucle. En una red neuronal estándar, los datos fluyen en una dirección: de la entrada a la salida. entrada a la salida. En una RNN, la salida de una neurona se devuelve a sí misma como entrada para el siguiente paso temporal. Este proceso Este proceso suele visualizarse como un "desenrollado" de la red a lo largo del tiempo, en el que la red pasa su estado interno, que contiene información sobre lo que ha hecho. interno -que contiene información sobre lo que ha visto hasta el momento- al siguiente paso de la secuencia.

Durante el proceso de entrenamiento, las RNN utilizan un algoritmo denominado Backpropagation Through Time (BPTT). Se trata de una extensión de la retropropagación estándar que calcula los gradientes la red a través de los pasos temporales de la secuencia. La BPTT permite que la red aprenda cómo influyen las entradas anteriores en las salidas posteriores. influyen en las salidas posteriores, ajustando los pesos del modelo para minimizar el error. Encontrará explicaciones detalladas de este proceso en explicaciones detalladas de este proceso se pueden encontrar en recursos educativos como el curso de PNL CS224n de Stanford.

Aplicaciones en el mundo real

Las RNN son especialmente eficaces en situaciones en las que se requiere contexto para interpretar correctamente los datos.

Modelización lingüística y traducción: En traducción automática, el significado de una palabra a menudo depende de las palabras que la preceden. Las RNN se utilizan para ingerir una frase en un idioma (por ejemplo, English) y generar la frase correspondiente en otro (por ejemplo, español). y generar la frase correspondiente en otro idioma (por ejemplo, español). Las primeras versiones de Google Translate se basaban en gran medida en estas arquitecturas de secuencia a secuencia para lograr fluidez. para lograr fluidez.
Mantenimiento predictivo: En entornos industriales, las RNN analizan series temporales de datos procedentes de sensores de maquinaria. Mediante de vibración o temperatura, estos modelos pueden predecir anomalías y fallos antes de que se produzcan. predecir fallos antes de que se produzcan. Esta aplicación se solapa con la IA en la fabricación, ayudando a optimizar la eficiencia operativa.

Retos y arquitecturas relacionadas

Aunque potentes, las RNN estándar sufren el gradiente de fuga, en el que la red se esfuerza por retener información en secuencias largas. A medida que los gradientes se propagan hacia atrás a lo largo de muchos pasos temporales, pueden llegar a ser infinitesimales, lo que hace que la red "olvide" las primeras entradas. infinitesimalmente pequeños, lo que hace que la red "olvide" las primeras entradas.

Para solucionarlo, los investigadores desarrollaron variantes avanzadas:

Memoria larga a corto plazo (LSTM): Las LSTM introducen "puertas" que regulan el flujo de información y permiten a la red elegir qué recordar o descartar a largo plazo. recordar o descartar a largo plazo. Esta arquitectura se analiza ampliamente en blog de Christopher Olah sobre las LSTM.
Unidad Recurrente Cerrada (GRU): Una alternativa simplificada a las LSTM, las GRU ofrecen un rendimiento similar con una mayor eficiencia computacional al simplificar el mecanismo de compuerta. simplificando el mecanismo de compuerta.

También es importante distinguir las RNN de las redes neuronales convolucionales (CNN). Mientras que las RNN destacan en secuencias temporales (basadas en el tiempo), las CNN están diseñadas para datos espaciales (basados en cuadrículas) como las imágenes. Por ejemplo, Ultralytics YOLO11 utiliza una arquitectura basada en CNN para la detección de objetos en tiempo real, mientras que una RNN sería más adecuada para subtitular los fotogramas de vídeo que procesa YOLO .

Implementación de una RNN con PyTorch

Frameworks modernos como PyTorch hacen que sea sencillo implementar capas recurrentes. Mientras que los modelos Ultralytics como YOLO11 se basan principalmente en CNN, los usuarios que utilicen la plataformaUltralytics para soluciones personalizadas pueden encontrarse con RNNs al tratar con datos multimodales.

He aquí un ejemplo conciso de definición de una capa RNN básica en PyTorch:

import torch
import torch.nn as nn

# Define an RNN layer: Input size 10, Hidden state size 20, 2 stacked layers
rnn = nn.RNN(input_size=10, hidden_size=20, num_layers=2)

# Create a dummy input sequence: (sequence_length=5, batch_size=1, input_features=10)
input_seq = torch.randn(5, 1, 10)

# Forward pass: Returns the output for each step and the final hidden state
output, hidden = rnn(input_seq)

print(f"Output shape: {output.shape}")  # torch.Size([5, 1, 20])

Para un modelado de secuencias más avanzado, muchas aplicaciones modernas están pasando a arquitecturas Transformer, que paralelizan el procesamiento mediante un mecanismo de atención. Sin embargo, las RNN siguen siendo un concepto vital para comprender la evolución de la Inteligencia Artificial (IA) y siguen siendo eficientes para tareas específicas de streaming de baja latencia.

Red Neuronal Recurrente (RNN)

Entrene los modelosYOLO Ultralytics para agilizar los flujos de trabajo en todos los sectores

Solución de licencias empresariales flexible para impulsar su innovación

Entrene modelos de IA en segundos con Ultralytics YOLO

Cómo funcionan las redes neuronales recurrentes

Aplicaciones en el mundo real

Retos y arquitecturas relacionadas

Implementación de una RNN con PyTorch

Leer más en esta categoría

Comprender por qué la anotación con intervención humana es clave

¿Qué es la destilación de conjuntos de datos? Una breve descripción general

Las gafas Oakley Meta AI están redefiniendo el concepto de gafas con Vision AI.

Únase a la comunidad Ultralytics