Yolo Vision Shenzhen
Shenzhen
Únete ahora
Glosario

Aprendizaje Semisupervisado

Descubra cómo el Aprendizaje Semisupervisado combina datos etiquetados y no etiquetados para mejorar los modelos de IA, reducir los costes de etiquetado y aumentar la precisión.

El aprendizaje semisupervisado (SSL) es una técnica de aprendizaje automático (ML) que cierra la brecha entre el aprendizaje supervisado y el aprendizaje no supervisado. Aprovecha una pequeña cantidad de datos etiquetados junto con una gran cantidad de datos no etiquetados para mejorar la precisión del aprendizaje. En muchos escenarios del mundo real, la adquisición de datos no etiquetados es económica, pero el proceso de etiquetado de datos es costoso y requiere mucho tiempo. SSL aborda este desafío al permitir que los modelos aprendan del vasto conjunto de ejemplos no etiquetados, guiados por la estructura y la información proporcionada por el conjunto etiquetado más pequeño. Este enfoque es particularmente poderoso en el aprendizaje profundo (DL), donde los modelos requieren enormes conjuntos de datos para lograr un alto rendimiento.

Cómo funciona el Aprendizaje Semisupervisado

La idea central detrás de SSL es utilizar los datos etiquetados para construir un modelo inicial, y luego utilizar este modelo para hacer predicciones sobre los datos no etiquetados. Las predicciones más seguras del modelo se tratan entonces como "pseudoetiquetas" y se añaden al conjunto de entrenamiento. A continuación, el modelo se vuelve a entrenar con esta combinación de etiquetas originales y pseudoetiquetas de alta confianza. Este proceso iterativo permite al modelo aprender la estructura subyacente de todo el conjunto de datos, no sólo la pequeña porción etiquetada.

Las técnicas comunes de SSL incluyen:

  • Regularización de la consistencia: Este método impone la idea de que las predicciones del modelo deben seguir siendo consistentes incluso cuando los datos de entrada se perturban ligeramente. Por ejemplo, una imagen con una pequeña aumentación de datos debería producir la misma clasificación.
  • Modelos Generativos: Técnicas como las Redes Generativas Antagónicas (GANs) pueden aprender a generar datos que se asemejen a la distribución de datos real, lo que ayuda a definir mejor los límites de decisión entre clases.
  • Métodos basados en grafos: Estos métodos representan los puntos de datos como nodos en un grafo y propagan las etiquetas de los nodos etiquetados a los no etiquetados en función de su proximidad o similitud. Se puede encontrar una descripción técnica general en estudios académicos.

Aplicaciones en el mundo real

SSL es muy eficaz en dominios donde el etiquetado es un cuello de botella. Dos ejemplos destacados son:

  1. Análisis de imágenes médicas: Etiquetar exploraciones médicas, como resonancias magnéticas o tomografías computarizadas, para detectar tumores requiere la intervención de radiólogos expertos y resulta muy caro. Con SSL, se puede entrenar un modelo con unos cientos de exploraciones etiquetadas y, a continuación, perfeccionarlo con miles de exploraciones sin etiquetar procedentes de archivos hospitalarios. Esto permite desarrollar modelos sólidos de clasificación y segmentación de imágenes con un esfuerzo manual significativamente menor.
  2. Clasificación de Contenido Web y Documentos: Clasificar manualmente miles de millones de páginas web, artículos de noticias o reseñas de clientes no es práctico. SSL puede utilizar un pequeño conjunto de documentos categorizados manualmente para entrenar un clasificador de texto inicial. A continuación, el modelo clasifica el enorme corpus de documentos no etiquetados, utilizando sus propias predicciones para mejorar con el tiempo en tareas como el análisis de sentimientos o la categorización de temas.

Comparación con Otros Paradigmas de Aprendizaje

Es importante distinguir SSL de conceptos relacionados de Inteligencia Artificial (IA):

  • Aprendizaje Autosupervisado (SSL): Aunque comparte acrónimo, el aprendizaje autosupervisado es diferente. Es un tipo de aprendizaje no supervisado en el que las etiquetas se generan a partir de los propios datos mediante tareas previas (por ejemplo, predecir una palabra enmascarada en una frase). No utiliza ningún dato etiquetado manualmente, mientras que el aprendizaje semisupervisado requiere un pequeño conjunto de datos etiquetados explícitamente para guiar el proceso de entrenamiento del modelo.
  • Aprendizaje activo: Esta técnica también pretende reducir los costes de etiquetado. Sin embargo, en lugar de utilizar todos los datos sin etiquetar, un modelo de aprendizaje activo consulta de forma inteligente a un anotador humano para que etiquete los puntos de datos más informativos. SSL, en cambio, suele utilizar los datos sin etiquetar sin interacción humana directa durante el entrenamiento.
  • Transferencia de aprendizaje: Consiste en utilizar un modelo preentrenado en un gran conjunto de datos (como ImageNet) y luego perfeccionarlo en un conjunto de datos más pequeño y específico de la tarea. Aunque ambos aprovechan los conocimientos existentes, el SSL aprende de los datos no etiquetados de la propia tarea objetivo, mientras que el aprendizaje por transferencia aprovecha los conocimientos de una tarea diferente (aunque a menudo relacionada).

Herramientas y formación

Muchos frameworks modernos de Deep Learning (DL), incluyendo PyTorch (sitio oficial de PyTorch) y TensorFlow (sitio oficial de TensorFlow), ofrecen funcionalidades o pueden ser adaptados para implementar algoritmos SSL. Librerías como Scikit-learn proporcionan algunos métodos SSL. Plataformas como Ultralytics HUB agilizan el proceso facilitando la gestión de conjuntos de datos que pueden contener mezclas de datos etiquetados y no etiquetados, simplificando el entrenamiento y el despliegue de modelos diseñados para aprovechar tales estructuras de datos. La investigación en SSL continúa evolucionando, con contribuciones que a menudo se presentan en las principales conferencias de IA como NeurIPS e ICML.

Únete a la comunidad de Ultralytics

Únete al futuro de la IA. Conecta, colabora y crece con innovadores de todo el mundo

Únete ahora
Enlace copiado al portapapeles