Glossário

Aprendizado Semissupervisionado

Explore como a aprendizagem semi-supervisionada combina dados rotulados e não rotulados para aumentar a precisão do modelo. Aprenda a implementar fluxos de trabalho SSL usando Ultralytics .

A aprendizagem semi-supervisionada (SSL) é um paradigma estratégico na aprendizagem automática (ML) que funciona como uma ponte entre dois métodos de treino tradicionais. Enquanto a aprendizagem supervisionada depende inteiramente de conjuntos de dados totalmente anotados e a aprendizagem não supervisionada tenta encontrar padrões nos dados sem quaisquer etiquetas, a SSL funciona combinando uma pequena quantidade de dados etiquetados com um conjunto significativamente maior de dados não etiquetados. Esta abordagem é particularmente valiosa em cenários reais de visão computacional (CV), onde a recolha de imagens brutas — como imagens de vídeo de câmaras de segurança ou satélites — é relativamente barata, mas o processo de rotulagem de dados por especialistas humanos é caro, lento e demanda muito trabalho. Ao utilizar eficazmente a estrutura oculta nos exemplos não rotulados, o SSL pode melhorar significativamente a precisão e a generalização do modelo sem exigir um orçamento exaustivo para anotações.

Mecanismos centrais da aprendizagem semi-supervisionada

O objetivo principal do SSL é propagar as informações encontradas no pequeno conjunto de exemplos rotulados para o conjunto maior não rotulado. Isso permite que a rede neural aprenda limites de decisão que passam por regiões de baixa densidade dos dados, resultando em uma classificação ou detecção mais robusta.

Duas técnicas populares impulsionam a maioria dos fluxos de trabalho semi-supervisionados:

Pseudo-rotulagem: Neste método, um modelo é primeiro treinado com os dados rotulados limitados. Em seguida, ele é usado para executar a inferência nos dados não rotulados. As previsões que excedem um limite de confiança específico são tratadas como "pseudo-rótulos" ou verdade fundamental. Essas previsões confiáveis são adicionadas aos dados de treino, e o modelo é retreinado, melhorando iterativamente o seu desempenho.
Regularização da consistência: esta técnica baseia-se no aumento de dados. A ideia é que um modelo deve produzir previsões semelhantes para uma imagem e uma versão ligeiramente modificada (aumentada) dessa mesma imagem. Ao minimizar a diferença nas previsões entre a versão original e a aumentada, o modelo aprende a concentrar-se nas características essenciais do objeto, em vez de no ruído, melhorando a sua capacidade de lidar com o sobreajuste.

Implementação prática com YOLO

Python a seguir demonstra um fluxo de trabalho simples de pseudo-rotulagem usando o ultralytics . Aqui, treinamos um modelo YOLO26 em um pequeno conjunto de dados e, em seguida, usamo-lo para gerar rótulos para um diretório de imagens não rotuladas.

from ultralytics import YOLO

# Load the latest YOLO26 model
model = YOLO("yolo26n.pt")

# Train initially on a small available labeled dataset
model.train(data="coco8.yaml", epochs=10)

# Run inference on unlabeled data to generate pseudo-labels
# Setting save_txt=True saves the detections as text files for future training
results = model.predict(source="./unlabeled_images", save_txt=True, conf=0.85)

Aplicações no Mundo Real

A aprendizagem semi-supervisionada está a transformar indústrias onde os dados são abundantes, mas a experiência é escassa.

Imagiologia médica: Na IA aplicada à saúde, a aquisição de exames (raios-X, ressonâncias magnéticas) é um procedimento padrão, mas ter um radiologista certificado a anotar cada pixel para detecção de tumores é proibitivamente caro. O SSL permite que os investigadores treinem modelos de alto desempenho usando apenas uma fração dos casos anotados por especialistas, aproveitando milhares de exames arquivados para refinar a compreensão do modelo sobre estruturas biológicas .
Condução autónoma: as empresas de carros autônomos coletam petabytes de dados de vídeo diariamente dos veículos da frota. Rotular cada quadro para detecção de objetos e segmentação semântica é impossível. Por meio do SSL, o sistema pode aprender com a grande maioria das horas de condução não rotuladas para entender melhor os complexos ambientes rodoviários, as condições meteorológicas e os casos extremos raros.

Distinguir conceitos relacionados

Para implementar soluções de IA de forma eficaz, é fundamental compreender como o SSL difere de estratégias semelhantes:

vs. Aprendizagem ativa: Embora ambos lidem com dados não rotulados, a sua abordagem à rotulagem difere. O SSL atribui automaticamente rótulos com base nas previsões do modelo . Em contrapartida, a aprendizagem ativa identifica os pontos de dados mais «confusos» ou incertos e solicita explicitamente a um ser humano em loop para os rotular, otimizando o tempo humano em vez de os remover completamente.
vs. Aprendizagem por transferência: A aprendizagem por transferência envolve pegar um modelo pré-treinado em um enorme conjunto de dados externos (como o ImageNet) e ajustá-lo para a sua tarefa específica. O SSL, no entanto, concentra-se em aproveitar a parte não rotulada da distribuição do seu conjunto de dados específico durante o próprio processo de treino.
vs. Aprendizagem auto-supervisionada: Embora os nomes sejam semelhantes, a aprendizagem auto-supervisionada refere-se frequentemente a «tarefas pretext» (como resolver um puzzle de imagens fragmentadas), em que os dados geram os seus próprios sinais de supervisão sem quaisquer rótulos externos. A SSL implica especificamente a utilização de um conjunto mais pequeno de rótulos verificados para orientar o processo.

Ferramentas e perspectivas futuras

À medida que os modelos de deep learning (DL) crescem em tamanho, a eficiência do uso de dados torna-se fundamental. Frameworks modernos como PyTorch e TensorFlow fornecem o backend computacional para esses loops de treinamento avançados . Além disso, ferramentas como a Ultralytics estão a simplificar o ciclo de vida da gestão de conjuntos de dados. Ao utilizar recursos como a anotação automática, as equipas podem implementar fluxos de trabalho semissupervisionados com mais facilidade, transformando rapidamente dados brutos em pesos de modelos prontos para produção . Essa evolução no MLOps garante que a barreira à entrada para a criação de sistemas de visão de alta precisão continue a diminuir.

Aprendizado Semissupervisionado

Treine os modelosYOLO Ultralytics para simplificar os fluxos de trabalho em todos os sectores

Solução de licenciamento empresarial flexível para impulsionar sua inovação

Treine modelos de IA em segundos com o Ultralytics YOLO

Mecanismos centrais da aprendizagem semi-supervisionada

Implementação prática com YOLO

Aplicações no Mundo Real

Distinguir conceitos relacionados

Ferramentas e perspectivas futuras

Leia mais nesta categoria

12 casos de uso de imagens aéreas com tecnologia de visão computacional

O que é a estimativa de profundidade monocular? Uma visão geral

Uma análise sobre o usoYOLO Ultralytics para deteção de ameaças por IA

Junte-se à comunidade Ultralytics