Yolo Vision Shenzhen
Shenzhen
Junte-se agora
Glossário

Aprendizado Semissupervisionado

Explore como a aprendizagem semi-supervisionada combina dados rotulados e não rotulados para aumentar a precisão do modelo. Aprenda a implementar fluxos de trabalho SSL usando Ultralytics .

A aprendizagem semi-supervisionada (SSL) é um paradigma estratégico na aprendizagem automática (ML) que funciona como uma ponte entre dois métodos de treino tradicionais. Enquanto a aprendizagem supervisionada depende inteiramente de conjuntos de dados totalmente anotados e a aprendizagem não supervisionada tenta encontrar padrões nos dados sem quaisquer etiquetas, a SSL funciona combinando uma pequena quantidade de dados etiquetados com um conjunto significativamente maior de dados não etiquetados. Esta abordagem é particularmente valiosa em cenários reais de visão computacional (CV), onde a recolha de imagens brutas — como imagens de vídeo de câmaras de segurança ou satélites — é relativamente barata, mas o processo de rotulagem de dados por especialistas humanos é caro, lento e demanda muito trabalho. Ao utilizar eficazmente a estrutura oculta nos exemplos não rotulados, o SSL pode melhorar significativamente a precisão e a generalização do modelo sem exigir um orçamento exaustivo para anotações.

Mecanismos centrais da aprendizagem semi-supervisionada

O objetivo principal do SSL é propagar as informações encontradas no pequeno conjunto de exemplos rotulados para o conjunto maior não rotulado. Isso permite que a rede neural aprenda limites de decisão que passam por regiões de baixa densidade dos dados, resultando em uma classificação ou detecção mais robusta.

Duas técnicas populares impulsionam a maioria dos fluxos de trabalho semi-supervisionados:

  • Pseudo-rotulagem: Neste método, um modelo é primeiro treinado com os dados rotulados limitados. Em seguida, ele é usado para executar a inferência nos dados não rotulados. As previsões que excedem um limite de confiança específico são tratadas como "pseudo-rótulos" ou verdade fundamental. Essas previsões confiáveis são adicionadas aos dados de treino, e o modelo é retreinado, melhorando iterativamente o seu desempenho.
  • Regularização da consistência: esta técnica baseia-se no aumento de dados. A ideia é que um modelo deve produzir previsões semelhantes para uma imagem e uma versão ligeiramente modificada (aumentada) dessa mesma imagem. Ao minimizar a diferença nas previsões entre a versão original e a aumentada, o modelo aprende a concentrar-se nas características essenciais do objeto, em vez de no ruído, melhorando a sua capacidade de lidar com o sobreajuste.

Implementação prática com YOLO

Python a seguir demonstra um fluxo de trabalho simples de pseudo-rotulagem usando o ultralytics . Aqui, treinamos um modelo YOLO26 em um pequeno conjunto de dados e, em seguida, usamo-lo para gerar rótulos para um diretório de imagens não rotuladas.

from ultralytics import YOLO

# Load the latest YOLO26 model
model = YOLO("yolo26n.pt")

# Train initially on a small available labeled dataset
model.train(data="coco8.yaml", epochs=10)

# Run inference on unlabeled data to generate pseudo-labels
# Setting save_txt=True saves the detections as text files for future training
results = model.predict(source="./unlabeled_images", save_txt=True, conf=0.85)

Aplicações no Mundo Real

A aprendizagem semi-supervisionada está a transformar indústrias onde os dados são abundantes, mas a experiência é escassa.

  • Imagiologia médica: Na IA aplicada à saúde, a aquisição de exames (raios-X, ressonâncias magnéticas) é um procedimento padrão, mas ter um radiologista certificado a anotar cada pixel para detecção de tumores é proibitivamente caro. O SSL permite que os investigadores treinem modelos de alto desempenho usando apenas uma fração dos casos anotados por especialistas, aproveitando milhares de exames arquivados para refinar a compreensão do modelo sobre estruturas biológicas .
  • Condução autónoma: as empresas de carros autônomos coletam petabytes de dados de vídeo diariamente dos veículos da frota. Rotular cada quadro para detecção de objetos e segmentação semântica é impossível. Por meio do SSL, o sistema pode aprender com a grande maioria das horas de condução não rotuladas para entender melhor os complexos ambientes rodoviários, as condições meteorológicas e os casos extremos raros.

Distinguir conceitos relacionados

Para implementar soluções de IA de forma eficaz, é fundamental compreender como o SSL difere de estratégias semelhantes:

  • vs. Aprendizagem ativa: Embora ambos lidem com dados não rotulados, a sua abordagem à rotulagem difere. O SSL atribui automaticamente rótulos com base nas previsões do modelo . Em contrapartida, a aprendizagem ativa identifica os pontos de dados mais «confusos» ou incertos e solicita explicitamente a um ser humano em loop para os rotular, otimizando o tempo humano em vez de os remover completamente.
  • vs. Aprendizagem por transferência: A aprendizagem por transferência envolve pegar um modelo pré-treinado em um enorme conjunto de dados externos (como o ImageNet) e ajustá-lo para a sua tarefa específica. O SSL, no entanto, concentra-se em aproveitar a parte não rotulada da distribuição do seu conjunto de dados específico durante o próprio processo de treino.
  • vs. Aprendizagem auto-supervisionada: Embora os nomes sejam semelhantes, a aprendizagem auto-supervisionada refere-se frequentemente a «tarefas pretext» (como resolver um puzzle de imagens fragmentadas), em que os dados geram os seus próprios sinais de supervisão sem quaisquer rótulos externos. A SSL implica especificamente a utilização de um conjunto mais pequeno de rótulos verificados para orientar o processo.

Ferramentas e perspectivas futuras

À medida que os modelos de deep learning (DL) crescem em tamanho, a eficiência do uso de dados torna-se fundamental. Frameworks modernos como PyTorch e TensorFlow fornecem o backend computacional para esses loops de treinamento avançados . Além disso, ferramentas como a Ultralytics estão a simplificar o ciclo de vida da gestão de conjuntos de dados. Ao utilizar recursos como a anotação automática, as equipas podem implementar fluxos de trabalho semissupervisionados com mais facilidade, transformando rapidamente dados brutos em pesos de modelos prontos para produção . Essa evolução no MLOps garante que a barreira à entrada para a criação de sistemas de visão de alta precisão continue a diminuir.

Junte-se à comunidade Ultralytics

Junte-se ao futuro da IA. Conecte-se, colabore e cresça com inovadores globais

Junte-se agora