Glosario

Aprendizaje profundo (DL)

Descubra el poder del aprendizaje profundo: explore redes neuronales, técnicas de entrenamiento y aplicaciones reales en IA, sanidad y mucho más.

El aprendizaje profundo (AD) es un subcampo especializado del aprendizaje automático (AA), que a su vez se engloba dentro de la inteligencia artificial (IA). Los algoritmos de aprendizaje profundo se inspiran en la estructura y el funcionamiento del cerebro humano y utilizan redes neuronales artificiales ( NN) con múltiples capas (de ahí el término "profundo"). Estas arquitecturas profundas permiten a los modelos aprender patrones complejos y representaciones jerárquicas directamente a partir de datos brutos como imágenes, texto o sonido, superando a menudo a las técnicas tradicionales de ML, especialmente en conjuntos de datos grandes y complejos.

Cómo funciona el aprendizaje profundo

Los componentes básicos del aprendizaje profundo son las redes neuronales profundas, que constan de una capa de entrada, varias capas ocultas y una capa de salida. Cada capa contiene nodos interconectados o "neuronas" que procesan la información. A diferencia de las redes menos profundas, la profundidad de estos modelos les permite aprender características jerárquicamente. Por ejemplo, en el reconocimiento de imágenes, las capas iniciales pueden detectar bordes simples, las capas siguientes combinarlos en formas y las capas más profundas reconocer objetos complejos. Este proceso de extracción automática de características elimina la necesidad de ingeniería manual de las mismas, lo que supone una ventaja significativa frente a muchos enfoques tradicionales de ML. El entrenamiento de estas redes suele implicar alimentarlas con grandes cantidades de datos etiquetados(aprendizaje supervisado) y utilizar algoritmos como la retropropagación y el descenso de gradiente para ajustar los pesos del modelo y minimizar los errores(función de pérdida). Este proceso computacionalmente intensivo depende en gran medida de hardware potente, especialmente GPUs, para un entrenamiento eficiente del modelo.

Importancia en la IA y la visión por ordenador

El aprendizaje profundo es uno de los principales motores del progreso de la IA, especialmente en el ámbito de la visión por ordenador (CV). Su capacidad para aprender representaciones significativas a partir de vastos conjuntos de datos, como el conjunto de datos COCO o ImageNet, ha dado lugar a avances en áreas que antes se consideraban difíciles para las máquinas. Modelos como Ultralytics YOLO aprovechan DL para la detección de objetos, la segmentación de imágenes y la clasificación de imágenes de alto rendimiento. Técnicas como el aprendizaje por transferencia permiten aprovechar modelos preentrenados (modelos ya entrenados en grandes conjuntos de datos) para acelerar el desarrollo de nuevas tareas relacionadas, incluso con menos datos. Este campo debe mucho a pioneros como Geoffrey Hinton, Yann LeCun y Yoshua Bengio, a menudo conocidos como los "padrinos de la IA". Organizaciones como DeepLearning.AI y la Asociación para el Avance de la Inteligencia Artificial (AAAI) siguen impulsando la investigación y la educación en este campo en rápida evolución.

Distinción de términos afines

  • Aprendizaje automático (AM): El aprendizaje automático es un subconjunto del aprendizaje automático. Aunque todo el aprendizaje automático es aprendizaje automático, no todo el aprendizaje automático es aprendizaje automático. El AM abarca una gama más amplia de algoritmos, incluidos los métodos de redes no neuronales como las máquinas de vectores de soporte (SVM), los árboles de decisión y la regresión lineal, que a menudo requieren ingeniería manual de características. La DL destaca en tareas que implican datos no estructurados y aprendizaje automático de características mediante arquitecturas profundas.
  • Inteligencia Artificial (IA): La IA es el campo general centrado en la creación de sistemas que muestren un comportamiento inteligente. El ML es uno de los métodos para lograr la IA, ya que permite a los sistemas aprender de los datos. La DL es un conjunto específico de técnicas dentro de la ML que utiliza redes neuronales profundas. Piense en ello como conceptos anidados: IA > ML > DL.

Aplicaciones reales

El aprendizaje profundo impulsa muchas aplicaciones modernas de IA:

Herramientas y marcos

El desarrollo de modelos de AD se ve facilitado por diversas bibliotecas y plataformas de software. Entre los marcos de código abierto más populares se encuentran:

Plataformas como Ultralytics HUB proporcionan entornos integrados para entrenar modelos personalizados, desplegar y gestionar modelos DL, especialmente para tareas de visión por ordenador que utilizan modelos como YOLO11. Un desarrollo eficaz suele implicar prácticas como un ajuste riguroso de los hiperparámetros, la comprensión de las métricas de rendimiento y la utilización de la aceleración de la GPU para un entrenamiento eficiente de los modelos.

Únase a la comunidad Ultralytics

Únase al futuro de la IA. Conecta, colabora y crece con innovadores de todo el mundo.

Únete ahora
Enlace copiado en el portapapeles