Conoce YOLO26: IA de visión de nueva generación.
Ultralytics
Volver al glosario de Ultralytics

Recurrent Neural Network (RNN)

Explora cómo las redes neuronales recurrentes (RNN) procesan datos secuenciales usando memoria. Aprende sobre arquitecturas RNN, aplicaciones de NLP e implementaciones en PyTorch.

Una Red neuronal recurrente (RNN) es un tipo de red neuronal artificial diseñada específicamente para reconocer patrones en secuencias de datos, como texto, genomas, escritura a mano o la palabra hablada. A diferencia de las redes tradicionales de alimentación hacia adelante (feedforward) que asumen que todas las entradas (y salidas) son independientes entre sí, las RNN conservan una forma de memoria. Esta memoria interna les permite procesar entradas con una comprensión de la información previa, lo que las hace especialmente adecuadas para tareas donde el contexto y el orden temporal son críticos. Esta arquitectura imita cómo los humanos procesan la información: leer una oración, por ejemplo, requiere recordar palabras anteriores para comprender la actual.

Link to this sectionCómo funcionan las RNN#

La innovación principal de una RNN es su estructura de bucle. En una red de alimentación hacia adelante estándar, la información fluye solo en una dirección: de la entrada a la salida. Por el contrario, una RNN tiene un bucle de retroalimentación que permite que la información persista. A medida que la red procesa una secuencia, mantiene un "estado oculto", un vector que actúa como la memoria a corto plazo de la red. En cada paso de tiempo, la RNN toma la entrada actual y el estado oculto anterior para producir una salida y actualizar el estado oculto para el siguiente paso.

Esta capacidad de procesamiento secuencial es esencial para el Procesamiento de Lenguaje Natural (NLP) y el análisis de series temporales. Sin embargo, las RNN estándar a menudo tienen dificultades con secuencias largas debido al problema del gradiente desvaneciente, donde la red olvida las entradas anteriores a medida que crece la secuencia. Esta limitación llevó al desarrollo de variantes más avanzadas como las redes de Memoria a Corto-Largo Plazo (LSTM) y las Unidades Recurrentes Cerradas (GRUs), que introducen mecanismos para regular mejor el flujo de información durante periodos más largos.

Link to this sectionAplicaciones en el mundo real#

Las Redes Neuronales Recurrentes han transformado muchas industrias al permitir que las máquinas comprendan datos secuenciales. Estos son dos ejemplos destacados:

  1. Traducción automática: Servicios como Google Translate dependían originalmente en gran medida de arquitecturas basadas en RNN (específicamente modelos de secuencia a secuencia) para convertir texto de un idioma a otro. La red lee la oración de entrada completa (por ejemplo, en inglés) y crea un vector de contexto, que luego utiliza para generar la salida traducida (por ejemplo, en francés) palabra por palabra, asegurando la consistencia gramatical.

  2. Escritura predictiva y autocorrección: Cuando escribes en un teléfono inteligente, el teclado sugiere la siguiente palabra probable. Esto a menudo está impulsado por un modelo de lenguaje entrenado con RNN. El modelo analiza la secuencia de palabras que ya has escrito para predecir la palabra siguiente más probable, mejorando la velocidad y precisión del usuario. Una lógica similar se aplica a los sistemas de reconocimiento de voz que transcriben audio hablado a texto.

Link to this sectionRNN frente a CNN y Transformer#

Es útil distinguir las RNN de otras arquitecturas importantes. Una Red Neuronal Convolucional (CNN) está diseñada principalmente para datos espaciales, como imágenes, procesando cuadrículas de píxeles para identificar formas y objetos. Por ejemplo, Ultralytics YOLO26 utiliza una potente estructura de CNN para la detección de objetos en tiempo real. Mientras que una CNN sobresale en "¿qué hay en esta imagen?", una RNN sobresale en "¿qué sucede a continuación en este video?".

Más recientemente, la arquitectura Transformer ha reemplazado en gran medida a las RNN para muchas tareas complejas de NLP. Los Transformer utilizan un mecanismo de atención para procesar secuencias completas en paralelo en lugar de secuencialmente. Sin embargo, las RNN siguen siendo altamente eficientes para aplicaciones de streaming específicas de baja latencia y con recursos limitados, y son más sencillas de implementar en dispositivos de borde para la previsión simple de series temporales.

Link to this sectionEjemplo de implementación en PyTorch#

Si bien las tareas modernas de visión artificial a menudo dependen de CNN, los modelos híbridos pueden usar RNN para analizar características temporales extraídas de fotogramas de video. A continuación, presento un ejemplo sencillo y ejecutable usando PyTorch para crear una capa RNN básica que procesa una secuencia de datos.

import torch
import torch.nn as nn

# Define a basic RNN layer
# input_size: number of features in the input (e.g., 10 features per time step)
# hidden_size: number of features in the hidden state (memory)
# batch_first: input shape will be (batch, seq, feature)
rnn = nn.RNN(input_size=10, hidden_size=20, num_layers=1, batch_first=True)

# Create a dummy input: Batch size 1, Sequence length 5, Features 10
input_seq = torch.randn(1, 5, 10)

# Forward pass through the RNN
# output contains the hidden state for every time step
# hn contains the final hidden state
output, hn = rnn(input_seq)

print(f"Output shape: {output.shape}")  # Expected: torch.Size([1, 5, 20])
print(f"Final hidden state shape: {hn.shape}")  # Expected: torch.Size([1, 1, 20])

Link to this sectionDesafíos y perspectivas de futuro#

A pesar de su utilidad, las RNN enfrentan obstáculos computacionales. El procesamiento secuencial inhibe la paralelización, haciendo que el entrenamiento sea más lento en comparación con los Transformer en GPU. Además, gestionar el problema del gradiente explosivo requiere una cuidadosa optimización de hiperparámetros y técnicas como el recorte de gradiente.

No obstante, las RNN siguen siendo un concepto fundamental en el Aprendizaje Profundo (DL). Son integrales para comprender la evolución de la Inteligencia Artificial (AI) y todavía se utilizan ampliamente en sistemas simples de detección de anomalías para sensores IoT. Para los desarrolladores que construyen flujos de trabajo complejos, como combinar modelos de visión con predictores de secuencias, la gestión de conjuntos de datos y los flujos de trabajo de entrenamiento son cruciales. La Plataforma Ultralytics simplifica este proceso, ofreciendo herramientas para administrar datos e implementar modelos de manera eficiente en diversos entornos.

Explore solutions

Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.

Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.

Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.

Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.

Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.

Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.

Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.

Más información
Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.

Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.

Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.

Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.

Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.

Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.

Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.

Más información
Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.

Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.

Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.

Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.

Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.

Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.

Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.

Más información

¡Construyamos juntos el futuro de la IA!

Comienza tu viaje con el futuro del aprendizaje automático