Descubra el poder de las redes neuronales, clave para las innovaciones en IA y ML, como la visión artificial, el PNL y los avances en el aprendizaje profundo.
Una red neuronal (NN) es un modelo computacional que constituye el núcleo de la inteligencia artificial (IA) y está diseñado para reconocer patrones, interpretar datos sensoriales y agrupar información. Inspiradas en la estructura biológica del cerebro humano , estas redes están formadas por nodos interconectados, o «neuronas», organizados en capas. Mientras que un cerebro biológico utiliza señales químicas para comunicarse a través de las sinapsis, una red neuronal digital utiliza operaciones matemáticas para transmitir información. Estos sistemas son la tecnología fundamental que sustenta el aprendizaje automático moderno (ML), lo que permite a los ordenadores resolver problemas complejos como reconocer rostros, traducir idiomas y conducir vehículos autónomos sin estar programados explícitamente para cada regla específica.
Aunque los términos se utilizan a menudo de forma intercambiable, es importante distinguir entre una red neuronal básica y el aprendizaje profundo (DL). La principal diferencia radica en la profundidad y la complejidad. Una red neuronal estándar o «superficial» puede tener solo una o dos capas ocultas entre la entrada y la salida. Por el contrario, el aprendizaje profundo implica redes neuronales «profundas» con docenas o incluso cientos de capas. Esta profundidad permite que la extracción de características se realice automáticamente, lo que permite al modelo comprender patrones jerárquicos: los bordes simples se convierten en formas y las formas se convierten en objetos reconocibles . Para una inmersión técnica más profunda, MIT News explica el aprendizaje profundo y su evolución a partir de las redes básicas.
El proceso de «aprendizaje» en una red neuronal implica ajustar los parámetros internos para minimizar los errores. Los datos entran a través de una capa de entrada, pasan por una o más capas ocultas donde se realizan los cálculos y salen a través de una capa de salida como una predicción.
Las redes neuronales son los motores que impulsan muchas de las tecnologías que definen la era moderna.
Las bibliotecas de software modernas permiten implementar redes neuronales sin necesidad de escribir las operaciones matemáticas
desde cero. Herramientas como Plataforma Ultralytics Permite
a los usuarios entrenar estas redes fácilmente con conjuntos de datos personalizados. El siguiente Python muestra cómo cargar una
red neuronal preentrenada (concretamente, el modelo YOLO26 de última generación) y ejecutar la inferencia en una imagen utilizando el
ultralytics paquete.
from ultralytics import YOLO
# Load a pretrained YOLO26 neural network model
model = YOLO("yolo26n.pt")
# Run inference on an image to detect objects
# The model processes the image through its layers to predict bounding boxes
results = model("https://ultralytics.com/images/bus.jpg")
# Display the results
results[0].show()
Aunque son potentes, las redes neuronales presentan retos específicos. Por lo general, requieren grandes cantidades de datos etiquetados para el aprendizaje supervisado. Sin una diversidad de datos suficiente , una red es propensa al sobreajuste, por lo que memoriza los ejemplos de entrenamiento en lugar de aprender a generalizar. Además, las redes neuronales profundas se denominan a menudo «cajas negras» porque puede resultar difícil interpretar exactamente cómo han llegado a una decisión específica , lo que ha dado lugar a investigaciones sobre la IA explicable (XAI). Organizaciones como la Asociación de Estándares IEEE están trabajando activamente en la elaboración de normas para garantizar que estas potentes redes se utilicen de forma ética y segura.