Sintonize na YOLO Vision 2025!
25 de setembro de 2025
10:00 — 18:00 BST
Evento híbrido
Yolo Vision 2024

Entendendo o aprendizado few-shot, zero-shot e por transferência

Abirami Vina

Leitura de 5 minutos

29 de janeiro de 2025

Explore as diferenças entre aprendizado com poucos exemplos (few-shot learning), aprendizado com zero exemplos (zero-shot learning) e aprendizado por transferência (transfer learning) em visão computacional e como esses paradigmas moldam o treinamento de modelos de IA.

Os sistemas de inteligência artificial (IA) podem lidar com tarefas complexas, como reconhecer rostos, classificar imagens e dirigir carros com o mínimo de intervenção humana. Eles fazem isso estudando dados, reconhecendo padrões e usando esses padrões para fazer previsões ou tomar decisões. À medida que a IA avança, estamos testemunhando maneiras cada vez mais sofisticadas pelas quais os modelos de IA podem aprender, se adaptar e executar tarefas com notável eficiência.

Por exemplo, a visão computacional é um ramo da IA que se concentra em permitir que as máquinas interpretem e compreendam as informações visuais do mundo. O desenvolvimento tradicional de modelos de visão computacional depende fortemente de grandes conjuntos de dados anotados para o treino. A recolha e rotulagem de tais dados pode ser demorada e dispendiosa. 

Para lidar com esses desafios, os pesquisadores introduziram abordagens inovadoras como o aprendizado com poucos exemplos (FSL), que aprende com exemplos limitados; o aprendizado com zero exemplos (ZSL), que identifica objetos não vistos; e a transferência de aprendizado (TL), que aplica o conhecimento de modelos pré-treinados a novas tarefas.

Neste artigo, exploraremos como esses paradigmas de aprendizado funcionam, destacaremos suas principais diferenças e veremos aplicações do mundo real. Vamos começar!

Uma visão geral dos paradigmas de aprendizado

Vamos explorar o que são few-shot learning, zero-shot learning e transfer learning em relação à visão computacional e como eles funcionam. 

Aprendizado com poucos exemplos (Few-shot learning)

A aprendizagem com poucos exemplos (few-shot learning) é um método em que os sistemas aprendem a reconhecer novos objetos usando apenas um pequeno número de exemplos. Por exemplo, se você mostrar a um modelo algumas fotos de um pinguim, um pelicano e um papagaio-do-mar (esse pequeno grupo é chamado de "conjunto de suporte"), ele aprende como esses pássaros se parecem. 

Posteriormente, se você mostrar ao modelo uma nova imagem, como um pinguim, ele compara essa nova imagem com as do seu conjunto de suporte e escolhe a correspondência mais próxima. Quando coletar uma grande quantidade de dados é difícil, este método é benéfico porque o sistema ainda pode aprender e se adaptar com apenas alguns exemplos.

__wf_reserved_inherit
Fig. 1. Uma visão geral de como funciona o aprendizado com poucos exemplos.

Aprendizado Zero-Shot

O aprendizado zero-shot é uma maneira de as máquinas reconhecerem coisas que nunca viram antes sem precisar de exemplos delas. Ele usa informações semânticas, como descrições, para ajudar a fazer conexões.

Por exemplo, se uma máquina aprendeu sobre animais como gatos, leões e cavalos, compreendendo características como “pequeno e fofo”, “grande felino selvagem” ou “rosto comprido”, ela pode usar esse conhecimento para identificar um novo animal, como um tigre. Mesmo que nunca tenha visto um tigre antes, ela pode usar uma descrição como “um animal parecido com um leão com listras escuras” para identificá-lo corretamente. Isso facilita o aprendizado e a adaptação das máquinas sem a necessidade de muitos exemplos.

__wf_reserved_inherit
Fig 2. A aprendizagem zero-shot identifica novos objetos usando descrições.

Transferência de aprendizado

A transferência de aprendizado é um paradigma de aprendizado onde um modelo usa o que aprendeu em uma tarefa para ajudar a resolver uma tarefa nova e semelhante. Essa técnica é especialmente útil quando se trata de tarefas de visão computacional, como detecção de objetos, classificação de imagens e reconhecimento de padrões. 

Por exemplo, em visão computacional, um modelo pré-treinado pode reconhecer objetos gerais, como animais, e então ser ajustado por meio de transferência de aprendizado para identificar objetos específicos, como diferentes raças de cães. Ao reutilizar o conhecimento de tarefas anteriores, a transferência de aprendizado facilita o treinamento de modelos de visão computacional em conjuntos de dados menores, economizando tempo e esforço.

__wf_reserved_inherit
Fig. 3. Uma visão geral de como funciona a transferência de aprendizado (transfer learning).

Você pode estar se perguntando quais tipos de modelos suportam a transferência de aprendizado. O Ultralytics YOLO11 é um ótimo exemplo de um modelo de visão computacional que pode fazer isso. É um modelo de detecção de objetos de última geração que é pré-treinado em um conjunto de dados grande e geral. Depois disso, ele pode ser ajustado e treinado sob medida em um conjunto de dados menor e especializado para tarefas específicas.

Comparando paradigmas de aprendizado

Agora que falamos sobre aprendizado com poucos exemplos, aprendizado com zero exemplos e aprendizado por transferência, vamos compará-los para ver como eles diferem.

__wf_reserved_inherit
Fig 4. Principais diferenças entre few-shot learning, zero-shot learning e transfer learning. Imagem do autor.

O aprendizado com poucos exemplos é útil quando você tem apenas uma pequena quantidade de dados rotulados. Ele possibilita que um modelo de IA aprenda com apenas alguns exemplos. O aprendizado com zero exemplos, por outro lado, não requer nenhum dado rotulado. Em vez disso, ele usa descrições ou contexto para ajudar o sistema a lidar com novas tarefas. Enquanto isso, o aprendizado por transferência adota uma abordagem diferente, usando o conhecimento de modelos pré-treinados, permitindo que eles se adaptem rapidamente a novas tarefas com o mínimo de dados extras. Cada método tem seus próprios pontos fortes, dependendo do tipo de dados e da tarefa em que você está trabalhando.

Aplicações reais de vários paradigmas de aprendizagem

Esses paradigmas de aprendizado já estão fazendo a diferença em muitos setores, resolvendo problemas complexos com soluções inovadoras. Vamos analisar mais de perto como eles podem ser aplicados no mundo real.

Diagnosticando doenças raras com aprendizado few-shot

O aprendizado com poucos exemplos é uma virada de jogo para o setor de saúde, especialmente em imagens médicas. Ele pode ajudar os médicos a diagnosticar doenças raras usando apenas alguns exemplos ou até mesmo descrições, sem a necessidade de grandes quantidades de dados. Isso é especialmente útil quando os dados são limitados, o que geralmente é o caso, porque coletar grandes conjuntos de dados para condições raras pode ser desafiador.

Por exemplo, o SHEPHERD usa aprendizagem com poucos exemplos e gráficos de conhecimento biomédico para diagnosticar distúrbios genéticos raros. Ele mapeia informações do paciente, como sintomas e resultados de testes, numa rede de genes e doenças conhecidos. Isso ajuda a identificar a provável causa genética e a encontrar casos semelhantes, mesmo quando os dados são limitados. 

__wf_reserved_inherit
Fig 5. O modelo Shepherd diagnostica doenças raras usando dados mínimos.

Aprimorando a detecção de doenças em plantas com aprendizado zero-shot

Na agricultura, identificar rapidamente as doenças das plantas é essencial, pois atrasos na detecção podem levar a danos generalizados nas colheitas, redução da produção e perdas financeiras significativas. Os métodos tradicionais geralmente dependem de grandes conjuntos de dados e conhecimento especializado, que nem sempre estão acessíveis, especialmente em áreas remotas ou com recursos limitados. É aqui que os avanços na IA, como o aprendizado zero-shot, entram em jogo.

Digamos que um agricultor esteja cultivando tomates e batatas e perceba sintomas como folhas amareladas ou manchas marrons. O zero-shot learning pode ajudar a identificar doenças como a requeima sem exigir grandes conjuntos de dados. Ao usar descrições dos sintomas, o modelo pode classificar doenças que nunca viu antes. Essa abordagem é rápida, escalável e permite que os agricultores detectem uma variedade de problemas nas plantas. Ajuda-os a monitorar a saúde das colheitas de forma mais eficiente, tomar medidas oportunas e reduzir perdas.

__wf_reserved_inherit
Fig 6.  Usando aprendizado zero-shot para identificar doenças de plantas.

Veículos autônomos e aprendizagem por transferência

Os veículos autônomos frequentemente precisam se adaptar a diferentes ambientes para navegar com segurança. A aprendizagem por transferência (transfer learning) os ajuda a usar o conhecimento prévio para se ajustar rapidamente a novas condições sem começar seu treinamento do zero. Combinadas com a visão computacional, que ajuda os veículos a interpretar informações visuais, essas tecnologias permitem uma navegação mais suave em diferentes terrenos e condições climáticas, tornando a direção autônoma mais eficiente e confiável.

Um bom exemplo disso em ação é um sistema de gerenciamento de estacionamento que usa o Ultralytics YOLO11 para monitorar vagas de estacionamento. O YOLO11, um modelo de detecção de objetos pré-treinado, pode ser ajustado usando aprendizado por transferência para identificar vagas de estacionamento vazias e ocupadas em tempo real. Ao treinar o modelo em um conjunto de dados menor de imagens de estacionamentos, ele aprende a detectar com precisão vagas abertas, vagas ocupadas e até áreas reservadas.

__wf_reserved_inherit
Fig 7. Gestão de estacionamento usando Ultralytics YOLO11.

Integrado com outras tecnologias, este sistema pode orientar os motoristas para a vaga disponível mais próxima, ajudando a reduzir o tempo de procura e o congestionamento do tráfego. A transferência de aprendizado torna isso possível, aproveitando os recursos existentes de detecção de objetos do YOLO11, permitindo que ele se adapte às necessidades específicas da gestão de estacionamento sem começar do zero. Essa abordagem economiza tempo e recursos, ao mesmo tempo em que cria uma solução altamente eficiente e escalável que melhora as operações de estacionamento e aprimora a experiência geral do usuário.

Tendências emergentes em paradigmas de aprendizagem

O futuro dos paradigmas de aprendizado em visão computacional está se inclinando para o desenvolvimento de sistemas de Visão de IA mais inteligentes e sustentáveis. Em particular, uma tendência crescente é o uso de abordagens híbridas que combinam aprendizado com poucos exemplos (few-shot learning), aprendizado com zero exemplos (zero-shot learning) e aprendizado por transferência (transfer learning). Ao combinar os pontos fortes desses métodos, os modelos podem aprender novas tarefas com dados mínimos e aplicar seus conhecimentos em diferentes áreas.

Um exemplo interessante é o uso de embeddings profundos adaptados para ajustar modelos usando o conhecimento de tarefas anteriores e uma pequena quantidade de novos dados, facilitando o trabalho com conjuntos de dados limitados. 

Da mesma forma, o aprendizado X-shot é projetado para lidar com tarefas com diferentes quantidades de dados. Ele usa supervisão fraca, onde os modelos aprendem com rótulos limitados ou ruidosos, e instruções claras para ajudá-los a se adaptar rapidamente, mesmo com poucos ou nenhum exemplo anterior disponível. Essas abordagens híbridas mostram como a integração de diferentes métodos de aprendizado pode ajudar os sistemas de IA a enfrentar os desafios de forma mais eficaz.

Principais conclusões

O aprendizado com poucos exemplos, o aprendizado com zero exemplos e o aprendizado por transferência abordam desafios específicos na visão computacional, tornando-os adequados para diferentes tarefas. A abordagem correta depende da aplicação específica e de quantos dados estão disponíveis. Por exemplo, o aprendizado com poucos exemplos funciona bem com dados limitados, enquanto o aprendizado com zero exemplos é ótimo para lidar com classes não vistas ou desconhecidas.

Olhando para o futuro, é provável que a combinação desses métodos para criar modelos híbridos que integrem visão, linguagem e áudio seja um foco fundamental. Esses avanços visam tornar os sistemas de IA mais flexíveis, eficientes e capazes de lidar com problemas complexos, abrindo novas possibilidades de inovação no campo.

Explore mais sobre IA juntando-se à nossa comunidade e consultando o nosso repositório GitHub. Saiba como a IA em carros autónomos e a visão computacional na agricultura estão a remodelar o futuro. Consulte as opções de licença YOLO disponíveis para começar!

Vamos construir o futuro
da IA juntos!

Comece sua jornada com o futuro do aprendizado de máquina

Comece gratuitamente
Link copiado para a área de transferência