Entendendo few-shot, zero-shot e transfer learning
Explora as diferenças entre few-shot learning, zero-shot learning e transfer learning em visão computacional e como esses paradigmas moldam o treinamento de modelos de IA.

Sistemas de inteligência artificial (IA) podem lidar com tarefas complexas como reconhecer rostos, classificar imagens e dirigir carros com o mínimo de intervenção humana. Eles fazem isso estudando dados, reconhecendo padrões e usando esses padrões para fazer previsões ou decisões. À medida que a IA avança, testemunhamos maneiras cada vez mais sofisticadas pelas quais os modelos de IA podem aprender, adaptar-se e executar tarefas com uma eficiência notável.
Por exemplo, visão computacional é um ramo da IA que se concentra em permitir que as máquinas interpretem e compreendam informações visuais do mundo. O desenvolvimento tradicional de modelos de visão computacional depende fortemente de grandes datasets anotados para treinamento. Coletar e rotular tais dados pode ser demorado e caro.
Para lidar com esses desafios, pesquisadores introduziram abordagens inovadoras como few-shot learning (FSL), que aprende a partir de exemplos limitados; zero-shot learning (ZSL), que identifica objetos nunca vistos; e transfer learning (TL), que aplica o conhecimento de modelos pré-treinados a novas tarefas.
Neste artigo, exploraremos como esses paradigmas de aprendizagem funcionam, destacaremos suas principais diferenças e analisaremos aplicações no mundo real. Vamos começar!
Link to this sectionUma visão geral dos paradigmas de aprendizagem#
Vamos explorar o que são few-shot learning, zero-shot learning e transfer learning com relação à visão computacional e como eles funcionam.
Link to this sectionFew-shot learning#
Few-shot learning é um método onde os sistemas aprendem a reconhecer novos objetos usando apenas um pequeno número de exemplos. Por exemplo, se você mostrar a um modelo algumas fotos de um pinguim, um pelicano e um papagaio-do-mar (este pequeno grupo é chamado de "conjunto de suporte"), ele aprende como esses pássaros se parecem.
Mais tarde, se você mostrar ao modelo uma nova foto, como a de um pinguim, ele compara esta nova foto com as do seu conjunto de suporte e escolhe a combinação mais próxima. Quando reunir uma grande quantidade de dados é difícil, este método é benéfico porque o sistema ainda pode aprender e se adaptar com apenas alguns exemplos.

Fig 1. Uma visão geral de como o few-shot learning funciona.
Link to this sectionZero-shot learning#
Zero-shot learning é uma maneira de as máquinas reconhecerem coisas que nunca viram antes, sem precisar de exemplos delas. Ele usa informações semânticas, como descrições, para ajudar a estabelecer conexões.
Por exemplo, se uma máquina aprendeu sobre animais como gatos, leões e cavalos ao entender características como "pequeno e fofo", "grande felino selvagem" ou "rosto longo", ela pode usar esse conhecimento para identificar um novo animal, como um tigre. Mesmo que nunca tenha visto um tigre antes, ela pode usar uma descrição como "um animal semelhante a um leão com listras escuras" para identificá-lo corretamente. Isso torna mais fácil para as máquinas aprenderem e se adaptarem sem precisar de muitos exemplos.

Fig 2. O zero-shot learning identifica novos objetos usando descrições.
Link to this sectionTransfer learning#
Transfer learning é um paradigma de aprendizagem onde um modelo usa o que aprendeu de uma tarefa para ajudar a resolver uma tarefa nova e semelhante. Essa técnica é especialmente útil quando se trata de tarefas de visão computacional como detecção de objetos, classificação de imagens e reconhecimento de padrões.
Por exemplo, em visão computacional, um modelo pré-treinado pode reconhecer objetos gerais, como animais, e então ser ajustado através de transfer learning para identificar objetos específicos, como diferentes raças de cães. Ao reutilizar o conhecimento de tarefas anteriores, o transfer learning torna mais fácil treinar modelos de visão computacional em datasets menores, economizando tempo e esforço.

Fig 3. Uma visão geral de como o transfer learning funciona.
Você pode estar se perguntando que tipo de modelos suportam transfer learning. O Ultralytics YOLO11 é um ótimo exemplo de um modelo de visão computacional que pode fazer isso. É um modelo de detecção de objetos de ponta que é primeiro pré-treinado em um dataset grande e geral. Depois disso, ele pode ser ajustado e treinado de forma personalizada em um dataset menor e especializado para tarefas específicas.
Link to this sectionComparando os paradigmas de aprendizagem#
Agora que falamos sobre few-shot learning, zero-shot learning e transfer learning, vamos compará-los para ver como eles diferem.

Fig 4. Principais diferenças entre few-shot, zero-shot e transfer learning. Imagem do autor.
O few-shot learning é útil quando você tem apenas uma pequena quantidade de dados rotulados. Ele torna possível para um modelo de IA aprender com apenas alguns exemplos. O zero-shot learning, por outro lado, não requer nenhum dado rotulado. Em vez disso, ele usa descrições ou contexto para ajudar o sistema a lidar com novas tarefas. Enquanto isso, o transfer learning adota uma abordagem diferente usando o conhecimento de modelos pré-treinados, permitindo que eles se adaptem rapidamente a novas tarefas com o mínimo de dados extras. Cada método tem seus próprios pontos fortes, dependendo do tipo de dados e da tarefa em que você está trabalhando.
Link to this sectionAplicações reais de vários paradigmas de aprendizagem#
Esses paradigmas de aprendizagem já estão fazendo a diferença em muitos setores, resolvendo problemas complexos com soluções inovadoras. Vamos analisar mais de perto como eles podem ser aplicados no mundo real.
Link to this sectionDiagnosticando doenças raras com few-shot learning#
O few-shot learning é uma virada de jogo para o setor de saúde, especialmente em diagnóstico por imagem médica. Ele pode ajudar os médicos a diagnosticar doenças raras usando apenas alguns exemplos ou até mesmo descrições, sem precisar de grandes quantidades de dados. Isso é especialmente útil quando os dados são limitados, o que é frequentemente o caso, pois coletar grandes datasets para condições raras pode ser desafiador.
Por exemplo, o SHEPHERD usa few-shot learning e grafos de conhecimento biomédico para diagnosticar distúrbios genéticos raros. Ele mapeia informações do paciente, como sintomas e resultados de exames, em uma rede de genes e doenças conhecidas. Isso ajuda a identificar a causa genética provável e a encontrar casos semelhantes, mesmo quando os dados são limitados.

Fig 5. O modelo Shepherd diagnostica doenças raras usando dados mínimos.
Link to this sectionMelhorando a detecção de doenças em plantas com zero-shot learning#
Na agricultura, identificar rapidamente doenças em plantas é essencial, pois atrasos na detecção podem levar a danos generalizados nas plantações, redução de rendimentos e perdas financeiras significativas. Os métodos tradicionais geralmente dependem de grandes datasets e conhecimento especializado, que nem sempre podem ser acessíveis, especialmente em áreas remotas ou com recursos limitados. É aqui que os avanços em IA, como o zero-shot learning, entram em cena.
Digamos que um agricultor esteja cultivando tomates e batatas e note sintomas como folhas amareladas ou manchas marrons. O zero-shot learning pode ajudar a identificar doenças como a requeima sem exigir grandes datasets. Ao usar descrições dos sintomas, o modelo pode classificar doenças que nunca viu antes. Esta abordagem é rápida, escalável e permite que os agricultores detectem uma variedade de problemas nas plantas. Isso ajuda a monitorar a saúde da cultura com mais eficiência, tomar medidas oportunas e reduzir as perdas.

Fig 6. Usando zero-shot learning para identificar doenças em plantas.
Link to this sectionVeículos autônomos e transfer learning#
Veículos autônomos geralmente precisam se adaptar a diferentes ambientes para navegar com segurança. O transfer learning os ajuda a usar conhecimentos prévios para se ajustarem rapidamente a novas condições sem começar o treinamento do zero. Combinadas com a visão computacional, que ajuda os veículos a interpretar informações visuais, essas tecnologias permitem uma navegação mais suave em diferentes terrenos e condições climáticas, tornando a direção autônoma mais eficiente e confiável.
Um bom exemplo disso na prática é um sistema de gerenciamento de estacionamento que usa o Ultralytics YOLO11 para monitorar vagas de estacionamento. O YOLO11, um modelo de detecção de objetos pré-treinado, pode ser ajustado usando transfer learning para identificar vagas de estacionamento vazias e ocupadas em tempo real. Ao treinar o modelo em um dataset menor de imagens de estacionamentos, ele aprende a detectar com precisão vagas abertas, vagas cheias e até áreas reservadas.

Fig 7. Gerenciamento de estacionamento usando Ultralytics YOLO11.
Integrado a outras tecnologias, este sistema pode guiar os motoristas até a vaga disponível mais próxima, ajudando a reduzir o tempo de busca e o congestionamento de tráfego. O transfer learning torna isso possível ao basear-se nas capacidades existentes de detecção de objetos do YOLO11, permitindo que ele se adapte às necessidades específicas de gerenciamento de estacionamento sem começar do zero. Esta abordagem economiza tempo e recursos, criando uma solução altamente eficiente e escalável que melhora as operações de estacionamento e aprimora a experiência geral do usuário.
Link to this sectionTendências emergentes em paradigmas de aprendizagem#
O futuro dos paradigmas de aprendizagem em visão computacional está caminhando para o desenvolvimento de sistemas de IA de visão mais inteligentes e sustentáveis. Em particular, uma tendência crescente é o uso de abordagens híbridas que combinam few-shot learning, zero-shot learning e transfer learning. Ao misturar os pontos fortes desses métodos, os modelos podem aprender novas tarefas com o mínimo de dados e aplicar seu conhecimento em diferentes áreas.
Um exemplo interessante é o uso de deep embeddings adaptados para ajustar modelos usando o conhecimento de tarefas anteriores e uma pequena quantidade de novos dados, facilitando o trabalho com datasets limitados.
Da mesma forma, o X-shot learning foi projetado para lidar com tarefas com diferentes quantidades de dados. Ele usa supervisão fraca, onde os modelos aprendem com rótulos limitados ou ruidosos, e instruções claras para ajudá-los a se adaptarem rapidamente, mesmo com poucos ou nenhum exemplo anterior disponível. Essas abordagens híbridas mostram como a integração de diferentes métodos de aprendizagem pode ajudar os sistemas de IA a enfrentar desafios com mais eficácia.
Link to this sectionPrincipais pontos#
Few-shot learning, zero-shot learning e transfer learning abordam desafios específicos em visão computacional, tornando-os adequados para diferentes tarefas. A abordagem correta depende da aplicação específica e de quantos dados estão disponíveis. Por exemplo, o few-shot learning funciona bem com dados limitados, enquanto o zero-shot learning é ótimo para lidar com classes não vistas ou desconhecidas.
Olhando para o futuro, é provável que a combinação desses métodos para criar modelos híbridos que integrem visão, linguagem e áudio seja um foco principal. Esses avanços visam tornar os sistemas de IA mais flexíveis, eficientes e capazes de resolver problemas complexos, abrindo novas possibilidades para inovação na área.
Explore mais sobre IA participando da nossa comunidade e conferindo nosso repositório GitHub. Aprenda como IA em carros autônomos e visão computacional na agricultura estão remodelando o futuro. Confira as opções disponíveis na licença YOLO para começar!






