Glossário

Aprendizado Contrastivo

Descubra o poder do aprendizado contrastivo, uma técnica auto supervisionada para representações de dados robustas com dados rotulados mínimos.

O aprendizado contrastivo é uma técnica de aprendizado de máquina que treina um modelo para distinguir entre coisas semelhantes e diferentes. Em vez de aprender a prever um rótulo a partir de um único ponto de dados, o modelo aprende comparando pares de exemplos. A ideia central é ensinar o modelo a aproximar as representações de pares semelhantes (positivos) em um espaço de recursos, enquanto afasta as representações de pares diferentes (negativos). Essa abordagem é altamente eficaz para aprender representações significativas a partir de grandes conjuntos de dados não rotulados, tornando-se um método poderoso dentro da categoria mais ampla de aprendizado auto-supervisionado.

Como funciona?

O processo de aprendizado contrastivo gira em torno da criação de amostras positivas e negativas. Para um determinado ponto de dados, chamado de "âncora", o modelo é treinado da seguinte forma:

Pares Positivos: Um par positivo consiste na âncora e num ponto de dados semanticamente semelhante a ela. Em visão computacional (VC), uma amostra positiva é frequentemente criada aplicando um forte aumento de dados (como recorte aleatório, rotação ou jitter de cor) à imagem âncora. Tanto a âncora quanto a versão aumentada são consideradas um par positivo porque se originam da mesma imagem de origem.
Pares Negativos: Um par negativo consiste na âncora e num ponto de dados que é diferente. Numa configuração típica, todas as outras imagens dentro de um batch de treino são tratadas como amostras negativas.
Objetivo do Treino: O modelo, frequentemente uma rede neural convolucional (CNN), processa estes pares e é otimizado usando uma função de perda contrastiva, como InfoNCE ou Triplet Loss. Esta função de perda penaliza o modelo quando pares negativos estão muito próximos ou pares positivos estão muito distantes no espaço de embedding. Artigos de pesquisa de referência como SimCLR e MoCo avançaram significativamente estas técnicas.

Aplicações no Mundo Real

O aprendizado contrastivo se destaca no pré-treinamento de modelos para aprender representações de recursos poderosas que podem ser ajustadas para tarefas específicas.

Busca Visual e Recuperação de Imagens: No e-commerce, um usuário pode querer encontrar produtos visualmente semelhantes a uma imagem que ele carrega. Um modelo pré-treinado com aprendizado contrastivo pode mapear imagens para um espaço vetorial onde itens semelhantes são agrupados. Isso permite uma busca semântica eficiente e sistemas de recomendação, que são cruciais para melhorar a experiência do cliente em IA no varejo.
Pré-treinamento para Tarefas a Jusante: Modelos como o Ultralytics YOLO11 podem se beneficiar do pré-treinamento em grandes conjuntos de dados não rotulados usando métodos contrastivos. Isso ajuda o modelo a aprender recursos visuais robustos antes de ser ajustado finamente em um conjunto de dados rotulado menor para tarefas como detecção de objetos ou segmentação de instâncias. Esta abordagem geralmente leva a um melhor desempenho e convergência mais rápida, especialmente quando os dados rotulados são escassos, um conceito conhecido como aprendizado com poucos exemplos.