Yolo Vision Shenzhen
Shenzhen
Únete ahora
Glosario

Aprendizaje Profundo (DL)

Descubra el poder del aprendizaje profundo: explore las redes neuronales, las técnicas de entrenamiento y las aplicaciones en el mundo real en la IA, la atención médica y mucho más.

El Aprendizaje Profundo (DL) es un subcampo especializado del Aprendizaje Automático (ML) que utiliza redes neuronales multicapa para aprender de grandes cantidades de datos. Inspirados en la estructura del cerebro humano, los modelos de DL, a menudo llamados redes neuronales profundas, están diseñados para aprender automáticamente representaciones jerárquicas de los datos. Esto significa que las capas iniciales aprenden características simples, y las capas subsiguientes las combinan para aprender patrones cada vez más complejos. Esta capacidad ha convertido al DL en la fuerza impulsora de los principales avances en la Inteligencia Artificial (IA), particularmente en dominios complejos como la Visión Artificial (CV) y el Procesamiento del Lenguaje Natural (NLP).

¿Cómo funciona el aprendizaje profundo?

En el núcleo del Aprendizaje Profundo se encuentran las redes neuronales profundas, que son redes neuronales con múltiples capas ocultas entre las capas de entrada y salida. El término "profundo" en Aprendizaje Profundo se refiere a esta profundidad. Cada capa contiene unidades de procesamiento (neuronas) que aplican una operación matemática, gobernada por una función de activación, a su entrada. Durante el entrenamiento, la red se alimenta con grandes conjuntos de datos, y se utiliza un algoritmo llamado retropropagación para ajustar los parámetros internos de la red, o pesos. Este proceso de ajuste, típicamente guiado por un algoritmo de optimización como el descenso de gradiente, minimiza la diferencia entre las predicciones del modelo y la verdad fundamental real, tal como la define una función de pérdida. Esto permite a la red descubrir automáticamente patrones intrincados sin ser programada explícitamente para hacerlo. Un documento histórico clave que ayudó a popularizar el DL moderno es el documento de AlexNet de 2012, que logró resultados de vanguardia en el conjunto de datos ImageNet.

Aprendizaje Profundo Vs. Aprendizaje Automático

Si bien el aprendizaje profundo es un subconjunto del aprendizaje automático, la principal distinción radica en su enfoque de la representación de datos. Los métodos tradicionales de ML a menudo dependen en gran medida de la ingeniería de características manual, donde los expertos en el dominio elaboran meticulosamente características a partir de datos sin procesar para ayudar al modelo a hacer predicciones precisas. En contraste, los modelos de DL realizan la extracción de características automática. La estructura jerárquica de las redes profundas les permite aprender características relevantes directamente de los datos. Esto hace que el DL sea particularmente poderoso para manejar datos no estructurados como imágenes, texto y audio, donde la ingeniería de características manual a menudo no es práctica. Por ejemplo, en el reconocimiento de imágenes, un modelo de DL puede aprender a identificar bordes y texturas en sus primeras capas, luego partes de objetos como ojos y narices en las capas intermedias, y finalmente objetos completos como caras en las capas más profundas.

Aplicaciones y ejemplos

La capacidad del aprendizaje profundo para procesar datos complejos ha llevado a su adopción en numerosas industrias y aplicaciones. Dos ejemplos destacados incluyen:

  1. Vehículos autónomos: Los coches autónomos dependen en gran medida del DL para la percepción en tiempo real. Los modelos Ultralytics YOLO, una familia de modelos DL de última generación, se utilizan para la detección de objetos con el fin de identificar peatones, otros vehículos y señales de tráfico. Del mismo modo, el DL se utiliza para la segmentación de imágenes para distinguir la superficie de la carretera transitable de su entorno, lo cual es crucial para una navegación segura. Lea más sobre su uso en la IA en los coches autónomos.
  2. Análisis de imágenes médicas: En la atención médica, los modelos DL ayudan a los radiólogos analizando las exploraciones médicas. Las Redes Neuronales Convolucionales (CNN), una arquitectura DL popular para la visión, pueden ser entrenadas para detectar anomalías como tumores en resonancias magnéticas cerebrales o signos de enfermedad en radiografías con alta precisión. Esto puede conducir a un diagnóstico más temprano y a mejores resultados para los pacientes, como se ve en aplicaciones como la detección de tumores cerebrales.

Herramientas y Frameworks

El desarrollo de modelos DL se ve facilitado por varias bibliotecas de software y plataformas. Los frameworks populares de código abierto incluyen:

Plataformas como Ultralytics HUB proporcionan entornos integrados para el entrenamiento de modelos personalizados, el despliegue y la gestión de modelos DL, particularmente para tareas de visión artificial utilizando modelos como YOLO11. El desarrollo efectivo a menudo involucra prácticas como el ajuste riguroso de hiperparámetros, la comprensión de las métricas de rendimiento y la utilización de la aceleración de GPU para el entrenamiento eficiente del modelo. El desarrollo y el despliegue de estos sistemas complejos a menudo se gestionan a través de prácticas de MLOps.

Únete a la comunidad de Ultralytics

Únete al futuro de la IA. Conecta, colabora y crece con innovadores de todo el mundo

Únete ahora
Enlace copiado al portapapeles