Descubra el poder del aprendizaje profundo: explore las redes neuronales, las técnicas de entrenamiento y las aplicaciones en el mundo real en la IA, la atención médica y mucho más.
El aprendizaje profundo (AD) es un subconjunto transformador del aprendizaje automático que permite a los ordenadores aprender de la experiencia y comprender el mundo en términos de una jerarquía de conceptos. Inspirado en la estructura biológica estructura biológica del cerebro humano, el DL utiliza arquitecturas complejas de múltiples capas conocidas como redes neuronales (NN) para procesar grandes cantidades de datos. de datos. A diferencia de los algoritmos tradicionales, que a menudo requieren la intervención humana para definir las reglas, los modelos de DL realizan automáticamente automáticamente la extracción de características patrones intrincados que van desde simples bordes en una imagen a complejos significados semánticos en un texto. Esta capacidad hace que DL el motor de muchos avances modernos en Inteligencia Artificial (IA). Inteligencia Artificial (IA), sobre todo en campos como visión por ordenador (CV) y Procesamiento del Lenguaje Natural (PLN).
El "profundo" en Deep Learning se refiere al número de capas ocultas dentro de la red neuronal. Mientras que una red puede tener una o dos capas, los modelos profundos pueden tener docenas o incluso cientos. Cada capa consta de nodos o neuronas, que procesan los datos de entrada utilizando pesos del modelo y una función de activación, como ReLU o Sigmoid. Durante la fase de entrenamiento, el modelo se expone a conjuntos de datos etiquetados, y ajusta sus parámetros internos para minimizar los errores.
Este ajuste se consigue mediante un proceso llamado retropropagación, que calcula el gradiente de la la función de pérdida. Un algoritmo de optimización algoritmo de optimización, normalmente descenso de gradiente, actualiza los pesos para mejorar la precisión. A lo largo de muchas iteraciones, o épocas, la red red aprende a asignar entradas a salidas con gran precisión, "aprendiendo" de los datos de entrenamiento. datos de entrenamiento.
Aunque la DL forma parte del ML, ambos difieren significativamente en su enfoque de los datos. Los métodos tradicionales de ML suelen se basan a menudo en la ingeniería manual de los expertos en la materia deben seleccionar y formatear explícitamente las características que debe analizar el modelo. Por ejemplo, en el reconocimiento de imágenes, un experto puede escribir detect bordes o esquinas.
En cambio, los modelos de aprendizaje profundo aprenden estas características automáticamente. A red neuronal convolucional (CNN), una arquitectura común de DL, puede aprender a detect bordes en la primera capa, formas en la segunda y objetos reconocibles, como coches o caras, en las capas más profundas. objetos reconocibles, como coches o caras, en las capas más profundas. Esto elimina la necesidad de extracción manual de características y permite a DL escalar eficazmente con Big Data.
La versatilidad del aprendizaje profundo ha llevado a su adopción en numerosos sectores.
Implementar un modelo de Deep Learning para la inferencia es sencillo con las bibliotecas modernas. A continuación se muestra un ejemplo de usando un modelo YOLO11 pre-entrenado para detect objetos en una imagen.
from ultralytics import YOLO
# Load a pretrained YOLO11 model (a deep learning architecture)
model = YOLO("yolo11n.pt")
# Run inference on a source image
results = model("https://ultralytics.com/images/bus.jpg")
# Display the detection results
results[0].show()
El desarrollo de modelos de DL requiere marcos de software y hardware robustos.
Para una comprensión más amplia del campo, recursos como la documentación sobre aprendizaje profundo del MIT y IBM's guide to AI ofrecen excelentes lectura.