Glosario

Red neuronal (NN)

Descubra el poder de las redes neuronales, clave para las innovaciones en IA y ML, como la visión por ordenador, la PNL y los avances en aprendizaje profundo.

Una red neuronal (NN) es un modelo computacional inspirado en la estructura y el funcionamiento del cerebro humano. Constituye la columna vertebral de la mayoría de los modelos de aprendizaje profundo (deep learning, DL) y es un concepto fundamental de la Inteligencia Artificial (IA) moderna. Las NN están diseñadas para reconocer patrones en los datos procesando la información a través de capas interconectadas de nodos, o "neuronas". Esta estructura les permite aprender de grandes cantidades de datos, lo que las hace increíblemente potentes para tareas complejas como el reconocimiento de imágenes y el procesamiento del lenguaje natural (PLN).

¿Cómo funcionan las redes neuronales?

Una red neuronal consta de tres tipos principales de capas: una capa de entrada, una o más capas ocultas y una capa de salida. Cada capa contiene neuronas conectadas a las neuronas de la capa siguiente.

  1. Capa de entrada: Esta capa recibe los datos iniciales, como los píxeles de una imagen o las palabras de una frase.
  2. Capas ocultas: Son las capas intermedias entre la entrada y la salida. Aquí es donde se produce la mayor parte del cálculo. Cada neurona aplica una transformación matemática a sus entradas, lo que implica el aprendizaje de los pesos del modelo y una función de activación como ReLU o Sigmoid para determinar su salida. Las redes con múltiples capas ocultas se conocen como redes neuronales "profundas".
  3. Capa de salida: Esta última capa produce el resultado, como una etiqueta de clasificación o un valor predicho.

El proceso de aprendizaje, conocido como entrenamiento, consiste en alimentar la red con grandes conjuntos de datos. La red hace una predicción, la compara con el resultado real y calcula un error mediante una función de pérdida. A continuación, utiliza un algoritmo llamado retropropagación para ajustar los pesos de sus conexiones y minimizar este error a lo largo de muchas iteraciones o épocas. Este proceso está guiado por un algoritmo de optimización como Adam.

Redes neuronales frente a conceptos afines

Es importante distinguir las NN de otros términos relacionados:

  • Aprendizaje automático frente a redes neuronales: El aprendizaje automático (AM) es un amplio campo de la IA, y las NN son sólo un tipo de modelo de AM. Otros modelos de ML son los árboles de decisión y las máquinas de vectores de soporte (SVM), que no utilizan la arquitectura de neuronas en capas.
  • Aprendizaje profundo frente a redes neuronales: El aprendizaje profundo es un subcampo del ML que utiliza específicamente redes neuronales profundas-NN con muchas capas ocultas. Por lo tanto, todos los sistemas de aprendizaje profundo se basan en NN, pero una NN simple con una sola capa oculta podría no considerarse "profunda".

Tipos y aplicaciones de las redes neuronales

Las redes neuronales son increíblemente versátiles y se han adaptado a diversas arquitecturas especializadas. He aquí dos ejemplos clave:

  1. Visión por ordenador (CV): Las redes neuronales convolucionales (CNN) son la fuerza dominante en la visión por ordenador.

  2. Procesamiento del lenguaje natural (PLN): Las NN, incluidas las redes neuronales recurrentes (RNN) y los transformadores, han revolucionado la forma en que las máquinas procesan el lenguaje.

Herramientas y marcos

El desarrollo de las NN es accesible gracias a potentes herramientas y marcos de trabajo.

  • Bibliotecas: Frameworks como PyTorch y TensorFlow proporcionan los bloques de construcción esenciales para crear y entrenar NNs. Puedes obtener más información en los sitios web oficiales de PyTorch y TensorFlow.
  • Plataformas: Ultralytics HUB ofrece una plataforma integrada para entrenar modelos YOLO, gestionar conjuntos de datos y simplificar el proceso de despliegue de modelos.
  • Modelos preformados: Muchos investigadores y desarrolladores empiezan con modelos preformados disponibles en centros como Hugging Face o dentro del ecosistema Ultralytics. Estos modelos a menudo sólo requieren un ajuste fino en un conjunto de datos específico, lo que ahorra mucho tiempo y recursos computacionales. Puede encontrar comparaciones entre diferentes modelos YOLO en nuestra documentación.

Únase a la comunidad Ultralytics

Únase al futuro de la IA. Conecta, colabora y crece con innovadores de todo el mundo.

Únete ahora
Enlace copiado en el portapapeles