Glosario

Aprendizaje Autosupervisado

Descubre cómo el aprendizaje autosupervisado aprovecha los datos no etiquetados para un entrenamiento eficiente, transformando la IA en visión artificial, PNL y más.

El Aprendizaje Autosupervisado (SSL) es una técnica de aprendizaje automático que permite a los modelos aprender de grandes cantidades de datos no etiquetados. En lugar de depender de etiquetas proporcionadas por humanos, SSL genera automáticamente etiquetas a partir de los propios datos mediante la creación y resolución de una "tarea pretexto". Este proceso obliga al modelo a aprender patrones y características subyacentes significativas de los datos, como texturas y formas en imágenes o estructuras gramaticales en texto. Estas características aprendidas crean una base sólida, lo que permite que el modelo se desempeñe excepcionalmente bien en tareas posteriores con muchos menos datos etiquetados durante la fase de ajuste fino. SSL cierra la brecha entre el aprendizaje supervisado completo, que requiere muchos datos, y el aprendizaje no supervisado puro, que puede ser menos dirigido.

Cómo Funciona el Aprendizaje Autosupervisado

La idea central detrás de SSL es la tarea pretexto: un problema autocreado que el modelo debe resolver. Las etiquetas para esta tarea se derivan directamente de los datos de entrada. Al resolver la tarea pretexto, la red neuronal aprende representaciones valiosas, o incrustaciones (embeddings), que capturan las características esenciales de los datos.

Las tareas comunes de pretexto en la visión artificial incluyen:

Predicción de la rotación de la imagen: Se muestra al modelo una imagen que ha sido rotada aleatoriamente (por ejemplo, en 0, 90, 180 o 270 grados) y debe predecir el ángulo de rotación. Para hacer esto correctamente, debe reconocer la orientación original del objeto.
Relleno de Imágenes: Se enmascara o elimina una parte de una imagen, y el modelo debe predecir el parche que falta. Esto anima al modelo a aprender sobre el contexto y la textura de las imágenes.
Aprendizaje contrastivo: Se le enseña al modelo a acercar las representaciones de imágenes similares (aumentadas) y a alejar las representaciones de imágenes diferentes. Marcos de trabajo como SimCLR son ejemplos populares de este enfoque.

Este preentrenamiento en datos no etiquetados da como resultado pesos del modelo robustos que se pueden utilizar como punto de partida para tareas más específicas.

SSL vs. Otros Paradigmas de Aprendizaje

Es crucial diferenciar el SSL de los paradigmas de aprendizaje automático relacionados:

Aprendizaje Supervisado: Se basa completamente en datos etiquetados, donde cada entrada se empareja con una salida correcta. SSL, por el contrario, genera sus propias etiquetas a partir de los propios datos, lo que reduce significativamente la necesidad de etiquetado manual de datos.
Aprendizaje No Supervisado: Tiene como objetivo encontrar patrones (como el clustering) o reducir la dimensionalidad en datos no etiquetados sin tareas pretexto predefinidas. Aunque el SSL utiliza datos no etiquetados como el aprendizaje no supervisado, se diferencia por la creación de señales de supervisión explícitas a través de tareas pretexto para guiar el aprendizaje de la representación.
Aprendizaje Semisupervisado: Utiliza una combinación de una pequeña cantidad de datos etiquetados y una gran cantidad de datos no etiquetados. El preentrenamiento SSL a menudo puede ser un paso preliminar antes del ajuste fino semisupervisado.
Aprendizaje activo: Se centra en seleccionar de forma inteligente los puntos de datos más informativos de un conjunto no etiquetado para que los etiquete un humano. El SSL aprende de todos los datos no etiquetados sin intervención humana en el bucle. Estos dos métodos pueden ser complementarios en un flujo de trabajo de IA centrado en los datos.

Aplicaciones en el mundo real

SSL ha avanzado significativamente las capacidades de la Inteligencia Artificial (IA) en varios dominios:

Avance de los modelos de visión artificial: El preentrenamiento SSL permite que modelos como Ultralytics YOLO aprendan características visuales robustas de conjuntos de datos de imágenes masivos sin etiquetar antes de ser ajustados para tareas como la detección de objetos en vehículos autónomos o el análisis de imágenes médicas. El uso de pesos preentrenados derivados de SSL a menudo conduce a un mejor rendimiento y una convergencia más rápida durante el entrenamiento del modelo.
Potenciando los Modelos de Lenguaje Grandes (LLMs): Los modelos fundacionales como GPT-4 y BERT dependen en gran medida de las tareas pretexto SSL (como el modelado de lenguaje enmascarado) durante su fase de preentrenamiento en vastos corpus de texto. Esto les permite comprender la estructura del lenguaje, la gramática y el contexto, impulsando aplicaciones que van desde chatbots sofisticados y la traducción automática hasta el resumen de textos.

SSL reduce significativamente la dependencia de conjuntos de datos etiquetados costosos, democratizando el desarrollo de modelos de IA potentes. Herramientas como PyTorch y TensorFlow, junto con plataformas como Ultralytics HUB, proporcionan entornos para aprovechar las técnicas de SSL para construir e implementar soluciones de IA de vanguardia. Puede encontrar las últimas investigaciones sobre SSL en las principales conferencias de IA como NeurIPS e ICML.

Aprendizaje Autosupervisado

Entrena modelos Ultralytics YOLO para optimizar los flujos de trabajo en todas las industrias

Solución de licencias empresariales flexible para impulsar su innovación

Entrena modelos de IA en segundos con Ultralytics YOLO

Cómo Funciona el Aprendizaje Autosupervisado

SSL vs. Otros Paradigmas de Aprendizaje

Aplicaciones en el mundo real

Leer más en esta categoría

Lo más destacado de Ultralytics en la Conferencia PyTorch 2025

Aprendizaje autosupervisado para eliminar el ruido de las imágenes

Vision AI impulsa los sistemas de control de la atención del conductor

Únete a la comunidad de Ultralytics