Glosario

Aprendizaje profundo (DL)

Descubra el poder del aprendizaje profundo: explore redes neuronales, técnicas de entrenamiento y aplicaciones reales en IA, sanidad y mucho más.

El aprendizaje profundo (AD) es un subcampo especializado del aprendizaje automático que utiliza redes neuronales multicapa para aprender de grandes cantidades de datos. Inspirados en la estructura del cerebro humano, los modelos de AD, a menudo denominados redes neuronales profundas, están diseñados para aprender automáticamente representaciones jerárquicas de los datos. Esto significa que las capas iniciales aprenden características sencillas y las siguientes las combinan para aprender patrones cada vez más complejos. Esta capacidad ha hecho de la DL la fuerza motriz de importantes avances en Inteligencia Artificial (IA), sobre todo en ámbitos complejos como la Visión por Computador (VC) y el Procesamiento del Lenguaje Natural (PLN).

Cómo funciona el aprendizaje profundo

El núcleo del aprendizaje profundo son las redes neuronales profundas, que son redes neuronales con múltiples capas ocultas entre las capas de entrada y salida. El "profundo" en Deep Learning se refiere a esta profundidad. Cada capa contiene unidades de procesamiento (neuronas) que aplican una operación matemática, regida por una función de activación, a su entrada. Durante el entrenamiento, la red se alimenta de grandes conjuntos de datos, y se utiliza un algoritmo llamado retropropagación para ajustar los parámetros internos de la red, o pesos. Este proceso de ajuste, guiado normalmente por un algoritmo de optimización como el descenso gradiente, minimiza la diferencia entre las predicciones del modelo y la verdad real, definida por una función de pérdida. Esto permite a la red descubrir automáticamente patrones intrincados sin estar explícitamente programada para ello. Un artículo histórico clave que ayudó a popularizar la AD moderna es el de AlexNet de 2012, que obtuvo resultados de vanguardia en el conjunto de datos ImageNet.

Aprendizaje profundo Vs. Aprendizaje automático

Aunque el aprendizaje profundo es un subconjunto del aprendizaje automático, la principal diferencia radica en su enfoque de la representación de datos. Los métodos tradicionales de ML a menudo dependen en gran medida de la ingeniería manual de características, en la que los expertos del dominio elaboran meticulosamente características a partir de datos brutos para ayudar al modelo a hacer predicciones precisas. En cambio, los modelos de LD realizan la extracción automática de características. La estructura jerárquica de las redes profundas les permite aprender características relevantes directamente de los datos. Esto hace que DL sea especialmente potente para manejar datos no estructurados como imágenes, texto y audio, donde la ingeniería manual de características suele ser poco práctica. Por ejemplo, en el reconocimiento de imágenes, un modelo de DL puede aprender a identificar bordes y texturas en sus primeras capas, luego partes de objetos como ojos y narices en capas intermedias y, por último, objetos enteros como caras en capas más profundas.

Aplicaciones y ejemplos

La capacidad del aprendizaje profundo para procesar datos complejos ha llevado a su adopción en numerosos sectores y aplicaciones. Dos ejemplos destacados son:

  1. Vehículos autónomos: Los coches autónomos dependen en gran medida de la DL para la percepción en tiempo real. Los modelos YOLO de Ultralytics, una familia de modelos DL de última generación, se utilizan para la detección de objetos con el fin de identificar peatones, otros vehículos y señales de tráfico. Del mismo modo, la DL se emplea en la segmentación de imágenes para distinguir la superficie de la carretera por la que se puede conducir de su entorno, lo que resulta crucial para una navegación segura. Más información sobre su uso en la IA de los coches autoconducidos.
  2. Análisis de imágenes médicas: En sanidad, los modelos de DL ayudan a los radiólogos a analizar las exploraciones médicas. Las redes neuronales convolucionales (CNN), una popular arquitectura de DL para visión, pueden entrenarse para detectar con gran precisión anomalías como tumores en resonancias magnéticas cerebrales o signos de enfermedad en radiografías. Esto puede conducir a un diagnóstico más precoz y a mejores resultados para los pacientes, como se observa en aplicaciones como la detección de tumores cerebrales.

Herramientas y marcos

El desarrollo de modelos de AD se ve facilitado por diversas bibliotecas y plataformas de software. Entre los marcos de código abierto más populares se encuentran:

Plataformas como Ultralytics HUB proporcionan entornos integrados para entrenar modelos personalizados, desplegar y gestionar modelos DL, especialmente para tareas de visión por ordenador que utilizan modelos como YOLO11. Un desarrollo eficaz suele implicar prácticas como el ajuste riguroso de hiperparámetros, la comprensión de las métricas de rendimiento y la utilización de la aceleración de la GPU para un entrenamiento eficiente de los modelos. El desarrollo y despliegue de estos complejos sistemas se gestiona a menudo mediante prácticas de MLOps.

Únase a la comunidad Ultralytics

Únase al futuro de la IA. Conecta, colabora y crece con innovadores de todo el mundo.

Únete ahora
Enlace copiado en el portapapeles