Glossário

Aprendizagem de uma só vez

Descubra o poder do One-Shot Learning, uma técnica revolucionária de IA que permite generalizar modelos a partir de dados mínimos para aplicações do mundo real.

A Aprendizagem One-Shot (OSL) é uma tarefa de classificação no âmbito da aprendizagem automática (ML) em que um modelo é treinado para reconhecer uma nova classe de objectos a partir de um único exemplo. Ao contrário dos modelos tradicionais de aprendizagem profunda, que requerem grandes quantidades de dados de treino, a OSL tem como objetivo imitar a capacidade humana de aprender sobre um novo conceito a partir de um único exemplo. Isto torna-o particularmente valioso em cenários em que a recolha de dados é dispendiosa, difícil ou impossível. A ideia central não é aprender a classificar objectos diretamente, mas sim aprender uma função de semelhança que pode determinar se duas imagens pertencem à mesma classe.

Como funciona a aprendizagem de uma só vez

Em vez de treinar um modelo para identificar classes específicas, os modelos OSL são normalmente treinados para uma tarefa diferente: determinar se duas imagens de entrada são iguais ou diferentes. Uma arquitetura comum utilizada para este efeito é a rede siamesa, que consiste em duas redes neuronais idênticas que partilham os mesmos pesos. Cada rede processa uma das duas imagens de entrada para criar uma incorporação - umarepresentação numérica compacta da imagem.

Em seguida, o modelo compara esses dois embeddings para calcular uma pontuação de similaridade. Durante o treinamento do modelo, a rede aprende a produzir embeddings semelhantes para imagens da mesma classe e embeddings diferentes para imagens de classes diferentes. Uma vez treinado, o modelo pode classificar uma nova imagem comparando-a com o único "disparo" ou exemplo de cada classe conhecida. A nova imagem é atribuída à classe com a pontuação de semelhança mais elevada. Esta abordagem baseia-se fortemente numa boa extração de caraterísticas para construir representações robustas.

Relação com outros paradigmas de aprendizagem

O OSL faz parte de uma família mais vasta de métodos de aprendizagem concebidos para cenários com poucos dados:

  • Aprendizagem de poucas oportunidades (FSL): Uma generalização da OSL em que o modelo aprende a partir de um pequeno número de exemplos (por exemplo, 2 a 5) por classe, em vez de apenas um. A FSL fornece mais informação do que a OSL, conduzindo frequentemente a um melhor desempenho.
  • Aprendizagem Zero-Shot (ZSL): Um paradigma mais exigente em que o modelo deve reconhecer classes que nunca viu durante o treino, normalmente através da aprendizagem de um mapeamento entre caraterísticas visuais e descrições semânticas de alto nível.
  • Meta-aprendizagem: Muitas vezes designada por "aprender a aprender", esta abordagem treina um modelo numa grande variedade de tarefas de aprendizagem para lhe permitir resolver novas tarefas de forma mais eficiente. Muitas técnicas de OSL e FSL baseiam-se em princípios de meta-aprendizagem, tal como descrito pela investigação de instituições como o BAIR da UC Berkeley.
  • Aprendizagem por transferência: Isto implica a utilização de um modelo pré-treinado num grande conjunto de dados (como o ImageNet) e, em seguida, o seu aperfeiçoamento num conjunto de dados mais pequeno e específico. Embora relacionado, o OSL centra-se na aprendizagem a partir de um único exemplo, sem afinação extensiva.

Aplicações no mundo real

O One-Shot Learning é altamente eficaz em situações com dados escassos.

  1. Reconhecimento facial: Os sistemas de segurança podem utilizar a OSL para identificar uma pessoa depois de lhe ser mostrada apenas uma fotografia. O sistema aprende a criar uma assinatura facial única (incorporação) e pode então reconhecer essa pessoa de diferentes ângulos e em várias condições de iluminação. Este sistema é utilizado em aplicações que vão desde o desbloqueio de smartphones até ao acesso seguro a edifícios. Um dos primeiros artigos influentes, DeepFace do Facebook AI, demonstrou o poder das redes profundas para esta tarefa.
  2. Descoberta de medicamentos: Em farmacologia, a identificação de novas moléculas que possam tornar-se medicamentos eficazes é um processo dispendioso. A OSL pode ser utilizada para construir modelos que prevejam as propriedades de uma nova molécula com base num único exemplo conhecido com as caraterísticas desejadas. Isto acelera o processo de seleção, tal como discutido na investigação sobre a aprendizagem profunda baseada em gráficos para o desenvolvimento de medicamentos.

Desafios e direcções futuras

O principal desafio em OSL é a generalização. Um modelo deve aprender a essência de uma classe a partir de um único exemplo sem se ajustar demasiado às suas caraterísticas específicas. A qualidade do exemplo único é, portanto, crítica. A investigação em curso, como o trabalho destacado em Papers with Code, centra-se no desenvolvimento de representações de caraterísticas mais robustas e de estratégias avançadas de meta-aprendizagem. A integração de capacidades de OSL em plataformas de visão de uso geral, como o Ultralytics HUB, poderia expandir drasticamente a sua utilização em ambientes com dados limitados. À medida que os modelos se tornam mais poderosos, avaliá-los com métricas de desempenho adequadas nestas condições difíceis é também uma área de estudo fundamental.

Junte-se à comunidade Ultralytics

Junte-se ao futuro da IA. Ligue-se, colabore e cresça com inovadores globais

Aderir agora
Ligação copiada para a área de transferência