Glossário

Aprendizagem com poucos disparos

Descubra como a aprendizagem de poucos disparos permite que a IA se adapte com o mínimo de dados, transformando domínios como o diagnóstico médico e a conservação da vida selvagem.

A aprendizagem com poucos exemplos (FSL) é um subcampo da aprendizagem automática que se centra na construção de modelos capazes de generalizar novos conceitos a partir de apenas alguns exemplos. Os modelos tradicionais de aprendizagem profunda, especialmente no domínio da visão computacional, requerem frequentemente grandes quantidades de dados de treino rotulados para atingir um elevado desempenho. A FSL aborda o desafio da escassez de dados, criando modelos que podem aprender eficazmente em situações de poucos dados, imitando a capacidade humana de aprender novos objectos ou categorias a partir de muito poucos exemplos. Isto torna-o inestimável para aplicações em que a recolha de dados e a etiquetagem são dispendiosas, demoradas ou simplesmente impossíveis.

Como funciona a aprendizagem com poucos disparos

A ideia central do FSL é aproveitar o conhecimento prévio de um conjunto de dados grande e diversificado para aprender rapidamente tarefas novas e relacionadas. Em vez de aprender a classificar diretamente categorias específicas, o modelo aprende uma representação mais geral dos dados ou aprende a comparar pontos de dados. As abordagens mais comuns incluem:

  • Aprendizagem baseada em métricas: Estes métodos aprendem uma função de distância ou métrica de semelhança para comparar algumas imagens de "apoio" rotuladas com imagens de "consulta" não rotuladas. A imagem de consulta é então atribuída à classe da imagem de suporte mais semelhante. Exemplos populares desta abordagem incluem as Redes Siamesas, que aprendem a determinar se duas imagens são da mesma classe, e as Redes Prototípicas, que aprendem uma representação protótipo para cada classe no espaço métrico.
  • Aprendizagem baseada na otimização: Frequentemente associada à meta-aprendizagem (ou "aprender a aprender"), esta abordagem treina o próprio processo de otimização de um modelo. O objetivo é desenvolver um modelo que possa adaptar rapidamente os seus parâmetros a uma nova tarefa com apenas alguns passos de descida de gradiente. Um algoritmo influente nesta área é a Meta-Aprendizagem com Diagnóstico de Modelo (MAML).
  • Aprendizagem baseada na memória: Estes modelos usam um componente de memória externa para armazenar informações dos poucos exemplos disponíveis. Quando um novo exemplo é apresentado, o modelo recupera a informação relevante da sua memória para fazer uma previsão. Isto é concetualmente semelhante à forma como os algoritmos k-Nearest Neighbors (k-NN) funcionam.

Aprendizagem de poucos disparos vs. conceitos relacionados

É importante distinguir a FSL de outros paradigmas de aprendizagem que lidam com dados limitados:

  • Aprendizagem Zero-Shot (ZSL): A ZSL é mais extrema do que a FSL, pois exige que um modelo reconheça classes que nunca viu durante o treino, utilizando apenas descrições semânticas de alto nível ou atributos. A FSL requer pelo menos um exemplo, enquanto a ZSL não requer nenhum.
  • Aprendizagem de uma só vez (OSL): A OSL é uma variante específica da FSL em que o modelo recebe exatamente um exemplo rotulado para cada nova classe. Representa o cenário mais difícil no âmbito da estrutura de poucas tentativas.
  • Aprendizagem por transferência: A FSL é uma forma de aprendizagem por transferência, mas as duas não são idênticas. A aprendizagem por transferência tradicional envolve frequentemente a utilização de um modelo pré-treinado num grande conjunto de dados como o ImageNet e a sua afinação num novo conjunto de dados mais pequeno. A FSL foi especificamente concebida para cenários em que o novo conjunto de dados é extremamente pequeno (por exemplo, menos de 10 exemplos por classe). Pode explorar a forma como modelos como o Ultralytics YOLO11 utilizam pesos pré-treinados para a aprendizagem por transferência na nossa documentação de formação de modelos.

Aplicações no mundo real

A FSL é particularmente útil em domínios especializados onde os dados são escassos.

  1. Diagnóstico de doenças raras em imagiologia médica: No caso das doenças raras, a recolha de milhares de exames de doentes para treino de modelos é muitas vezes inviável. Com a FSL, um modelo pré-treinado num grande conjunto de dados de imagens médicas comuns pode ser adaptado para identificar sinais de uma doença rara utilizando apenas um punhado de casos confirmados. Isto acelera o desenvolvimento de ferramentas de diagnóstico para a análise de imagens médicas.
  2. Deteção de defeitos industriais: No fabrico, uma nova linha de produtos pode ter defeitos únicos e pouco frequentes. Em vez de interromper a produção para recolher milhares de exemplos de defeitos, um modelo FSL para deteção de objectos pode ser rapidamente treinado com algumas amostras para automatizar o controlo de qualidade, melhorando a eficiência e reduzindo o desperdício. Plataformas como o Ultralytics HUB podem ajudar a gerenciar esses conjuntos de dados especializados e acelerar a implantação de modelos.

Desafios e direcções futuras

Apesar da sua promessa, a FSL enfrenta desafios significativos. O principal obstáculo é evitar o sobreajuste, uma vez que o modelo pode facilmente memorizar os poucos exemplos em vez de aprender a generalizar. O desempenho do modelo também pode ser altamente sensível à qualidade e representatividade dos exemplos de apoio fornecidos.

A investigação em curso, conduzida por instituições como a Universidade de Stanford, a Google AI e a Meta AI, centra-se na criação de algoritmos de meta-aprendizagem mais robustos e na melhor utilização das técnicas de aprendizagem não supervisionada ou auto-supervisionada para a pré-treino. A combinação destas abordagens tem como objetivo criar sistemas de IA mais flexíveis e eficientes em termos de dados, ultrapassando os limites do que é possível em ambientes com restrições de dados. Quadros avançados como o PyTorch e o TensorFlow fornecem as ferramentas necessárias para os investigadores explorarem estes métodos de ponta.

Junte-se à comunidade Ultralytics

Junte-se ao futuro da IA. Ligue-se, colabore e cresça com inovadores globais

Aderir agora
Ligação copiada para a área de transferência