Glosario

Aprendizaje semisupervisado

Descubra cómo el aprendizaje semisupervisado combina datos etiquetados y no etiquetados para mejorar los modelos de IA, reducir los costes de etiquetado y aumentar la precisión.

El aprendizaje semisupervisado (SSL) representa un poderoso término medio en el aprendizaje automático (ML), ya que combina una pequeña cantidad de datos etiquetados con una gran cantidad de datos no etiquetados durante el entrenamiento. Este enfoque es especialmente valioso en situaciones en las que la adquisición de datos etiquetados es cara, lenta o poco práctica, pero los datos no etiquetados son abundantes. SSL pretende aprovechar la estructura subyacente en los datos no etiquetados para mejorar el rendimiento del modelo más allá de lo que podría lograrse utilizando sólo los limitados datos etiquetados, por lo que es una técnica práctica para muchos problemas de Inteligencia Artificial (IA) del mundo real.

Cómo funciona el aprendizaje semisupervisado

Los algoritmos SSL funcionan haciendo ciertas suposiciones sobre la relación entre los datos etiquetados y los no etiquetados. Entre las hipótesis más comunes se encuentran la "hipótesis de suavidad" (es probable que los puntos cercanos entre sí compartan una etiqueta) o la "hipótesis de conglomerados" (los datos tienden a formar conglomerados distintos y es probable que los puntos de un mismo conglomerado compartan una etiqueta). Las técnicas suelen consistir en entrenar un modelo inicial con los datos etiquetados y, a continuación, utilizarlo para generar pseudoetiquetas para los datos sin etiquetar basadas en predicciones de alta confianza. A continuación, se vuelve a entrenar el modelo tanto con los datos originales etiquetados como con los nuevos datos pseudoetiquetados. Otro enfoque es la regularización de la consistencia, en la que se anima al modelo a producir el mismo resultado para un ejemplo sin etiquetar incluso si su entrada está ligeramente perturbada, lo que a menudo se consigue mediante el aumento de datos. Estos métodos permiten al modelo aprender de los patrones y la distribución inherentes a la gran cantidad de muestras sin etiquetar. En recursos como las entradas del blog de Google AI sobre SSL se exploran técnicas más avanzadas.

Comparación con otros paradigmas de aprendizaje

El aprendizaje semisupervisado ocupa un espacio único entre otros tipos de aprendizaje primario:

  • Aprendizaje supervisado: Se basa totalmente en datos de entrenamiento etiquetados. SSL se diferencia por la incorporación de datos no etiquetados para mejorar potencialmente el rendimiento cuando los datos etiquetados son escasos.
  • Aprendizaje no supervisado: Utiliza sólo datos no etiquetados para encontrar patrones o estructuras, como la agrupación o la reducción dimensional. SSL utiliza datos no etiquetados pero guía el proceso de aprendizaje con un pequeño conjunto de ejemplos etiquetados para realizar tareas como la clasificación o la regresión.
  • Aprendizaje autosupervisado (SSL): Tipo de aprendizaje no supervisado en el que las etiquetas se generan automáticamente a partir de los propios datos de entrada (por ejemplo, la predicción de una parte enmascarada de una imagen). Aunque utiliza datos no etiquetados, su mecanismo para generar supervisión difiere de los métodos semisupervisados típicos que combinan explícitamente datos preetiquetados y no etiquetados.

Aplicaciones reales

SSL es muy eficaz en dominios donde el etiquetado es un cuello de botella:

  1. Clasificación de páginas web: Es factible etiquetar manualmente un pequeño número de páginas web (por ejemplo, "deportes", "noticias", "tecnología"), pero poco práctico etiquetar miles de millones. SSL puede utilizar el gran número de páginas web sin etiquetar para mejorar la precisión y solidez del clasificador, aprendiendo del contenido del texto y de las estructuras de los enlaces(visión general de la minería de contenidos web).
  2. Reconocimiento de voz: La transcripción de audio requiere un gran esfuerzo humano. SSL permite a los sistemas entrenarse en una pequeña cantidad de audio transcrito junto con grandes volúmenes de datos de audio sin transcribir, lo que mejora el reconocimiento de diversos acentos y estilos de habla(investigación sobre procesamiento del habla).
  3. Análisis de imágenes médicas: La anotación experta de exploraciones médicas (como resonancias magnéticas o tomografías computarizadas para la detección de tumores) es costosa y requiere conocimientos especializados. La SSL puede aprovechar numerosas exploraciones sin etiquetar para mejorar el rendimiento de los modelos de diagnóstico entrenados con un conjunto limitado de imágenes anotadas, lo que podría dar lugar a mejores soluciones de IA en la atención sanitaria.
  4. Detección de objetos en visión por ordenador (CV): La creación de cuadros delimitadores precisos para objetos en miles de imágenes requiere mucho trabajo(recopilación de datos y guía de anotación). Las técnicas SSL pueden utilizar abundantes imágenes o fotogramas de vídeo sin etiquetar junto con un conjunto de datos etiquetados más pequeño para mejorar el rendimiento del detector en modelos como Ultralytics YOLO.

Ventajas y retos

La principal ventaja de SSL es su capacidad para reducir la dependencia de grandes conjuntos de datos etiquetados, ahorrando tiempo y recursos asociados al etiquetado de datos. Suele mejorar la generalización de los modelos en comparación con los modelos puramente supervisados entrenados con datos limitados, ya que explota la información de las muestras no etiquetadas. Sin embargo, el éxito de SSL depende en gran medida de que los supuestos subyacentes sobre los datos sean correctos. Si estas suposiciones no se cumplen (por ejemplo, la distribución de los datos no etiquetados es muy diferente de la de los datos etiquetados), los métodos SSL podrían incluso degradar el rendimiento. La selección y aplicación cuidadosas de las técnicas SSL son cruciales, y a menudo requieren experiencia en prácticas de MLOps.

Herramientas y formación

Muchos marcos modernos de aprendizaje profundo (Deep Learning, DL), incluidos PyTorch(sitio oficial de PyTorch) y TensorFlow(sitio oficial de TensorFlow), ofrecen funcionalidades o pueden adaptarse para implementar algoritmos SSL. Bibliotecas como Scikit-learn proporcionan algunos métodos SSL. Plataformas como Ultralytics HUB agilizan el proceso facilitando la gestión de conjuntos de datos(Ultralytics HUB Datasets documentation) que pueden contener mezclas de datos etiquetados y no etiquetados, simplificando la formación(Ultralytics HUB Cloud Training) y el despliegue(model deployment options guide) de modelos diseñados para aprovechar tales estructuras de datos. La investigación en SSL sigue evolucionando, con contribuciones que se presentan a menudo en las principales conferencias de IA, como NeurIPS e ICML.

Únase a la comunidad Ultralytics

Únase al futuro de la IA. Conecta, colabora y crece con innovadores de todo el mundo.

Únete ahora
Enlace copiado en el portapapeles