Guia de aprendizagem de poucas tentativas, zero tentativas e transferência

Os sistemas de inteligência artificial (IA) podem lidar com tarefas complexas, como reconhecer rostos, classificar imagens e dirigir carros com o mínimo de intervenção humana. Eles fazem isso estudando dados, reconhecendo padrões e usando esses padrões para fazer previsões ou tomar decisões. À medida que a IA avança, estamos testemunhando maneiras cada vez mais sofisticadas pelas quais os modelos de IA podem aprender, se adaptar e executar tarefas com notável eficiência.

Por exemplo, a visão computacional é um ramo da IA que se concentra em permitir que as máquinas interpretem e compreendam as informações visuais do mundo. O desenvolvimento tradicional de modelos de visão computacional depende fortemente de grandes conjuntos de dados anotados para o treino. A recolha e rotulagem de tais dados pode ser demorada e dispendiosa.

Para lidar com esses desafios, os pesquisadores introduziram abordagens inovadoras como o aprendizado com poucos exemplos (FSL), que aprende com exemplos limitados; o aprendizado com zero exemplos (ZSL), que identifica objetos não vistos; e a transferência de aprendizado (TL), que aplica o conhecimento de modelos pré-treinados a novas tarefas.

Neste artigo, exploraremos como esses paradigmas de aprendizado funcionam, destacaremos suas principais diferenças e veremos aplicações do mundo real. Vamos começar!

Uma visão geral dos paradigmas de aprendizado

Vamos explorar o que são few-shot learning, zero-shot learning e transfer learning em relação à visão computacional e como eles funcionam.

Aprendizado com poucos exemplos (Few-shot learning)

A aprendizagem com poucos exemplos (few-shot learning) é um método em que os sistemas aprendem a reconhecer novos objetos usando apenas um pequeno número de exemplos. Por exemplo, se você mostrar a um modelo algumas fotos de um pinguim, um pelicano e um papagaio-do-mar (esse pequeno grupo é chamado de "conjunto de suporte"), ele aprende como esses pássaros se parecem.

Posteriormente, se você mostrar ao modelo uma nova imagem, como um pinguim, ele compara essa nova imagem com as do seu conjunto de suporte e escolhe a correspondência mais próxima. Quando coletar uma grande quantidade de dados é difícil, este método é benéfico porque o sistema ainda pode aprender e se adaptar com apenas alguns exemplos.

__wf_reserved_inherit — Fig. 1. Uma visão geral de como funciona o aprendizado com poucos exemplos.

‍

Aprendizado Zero-Shot

O aprendizado zero-shot é uma maneira de as máquinas reconhecerem coisas que nunca viram antes sem precisar de exemplos delas. Ele usa informações semânticas, como descrições, para ajudar a fazer conexões.

Por exemplo, se uma máquina aprendeu sobre animais como gatos, leões e cavalos, compreendendo características como “pequeno e fofo”, “grande felino selvagem” ou “rosto comprido”, ela pode usar esse conhecimento para identificar um novo animal, como um tigre. Mesmo que nunca tenha visto um tigre antes, ela pode usar uma descrição como “um animal parecido com um leão com listras escuras” para identificá-lo corretamente. Isso facilita o aprendizado e a adaptação das máquinas sem a necessidade de muitos exemplos.

‍

Transferência de aprendizado

A transferência de aprendizado é um paradigma de aprendizado onde um modelo usa o que aprendeu em uma tarefa para ajudar a resolver uma tarefa nova e semelhante. Essa técnica é especialmente útil quando se trata de tarefas de visão computacional, como detecção de objetos, classificação de imagens e reconhecimento de padrões.

Por exemplo, em visão computacional, um modelo pré-treinado pode reconhecer objetos gerais, como animais, e então ser ajustado por meio de transferência de aprendizado para identificar objetos específicos, como diferentes raças de cães. Ao reutilizar o conhecimento de tarefas anteriores, a transferência de aprendizado facilita o treinamento de modelos de visão computacional em conjuntos de dados menores, economizando tempo e esforço.

‍

Poderá estar a perguntar-se que tipo de modelos suportam a aprendizagem por transferência. Ultralytics YOLO11 é um ótimo exemplo de um modelo de visão por computador que pode fazer isso. É um modelo de deteção de objectos de última geração que é primeiro pré-treinado num conjunto de dados grande e geral. Depois disso, pode ser ajustado e treinado de forma personalizada num conjunto de dados mais pequeno e especializado para tarefas específicas.

Comparando paradigmas de aprendizado

Agora que falamos sobre aprendizado com poucos exemplos, aprendizado com zero exemplos e aprendizado por transferência, vamos compará-los para ver como eles diferem.

‍

O aprendizado com poucos exemplos é útil quando você tem apenas uma pequena quantidade de dados rotulados. Ele possibilita que um modelo de IA aprenda com apenas alguns exemplos. O aprendizado com zero exemplos, por outro lado, não requer nenhum dado rotulado. Em vez disso, ele usa descrições ou contexto para ajudar o sistema a lidar com novas tarefas. Enquanto isso, o aprendizado por transferência adota uma abordagem diferente, usando o conhecimento de modelos pré-treinados, permitindo que eles se adaptem rapidamente a novas tarefas com o mínimo de dados extras. Cada método tem seus próprios pontos fortes, dependendo do tipo de dados e da tarefa em que você está trabalhando.

Aplicações reais de vários paradigmas de aprendizagem

Esses paradigmas de aprendizado já estão fazendo a diferença em muitos setores, resolvendo problemas complexos com soluções inovadoras. Vamos analisar mais de perto como eles podem ser aplicados no mundo real.

Diagnosticando doenças raras com aprendizado few-shot

O aprendizado com poucos exemplos é uma virada de jogo para o setor de saúde, especialmente em imagens médicas. Ele pode ajudar os médicos a diagnosticar doenças raras usando apenas alguns exemplos ou até mesmo descrições, sem a necessidade de grandes quantidades de dados. Isso é especialmente útil quando os dados são limitados, o que geralmente é o caso, porque coletar grandes conjuntos de dados para condições raras pode ser desafiador.

Por exemplo, o SHEPHERD usa aprendizagem com poucos exemplos e gráficos de conhecimento biomédico para diagnosticar distúrbios genéticos raros. Ele mapeia informações do paciente, como sintomas e resultados de testes, numa rede de genes e doenças conhecidos. Isso ajuda a identificar a provável causa genética e a encontrar casos semelhantes, mesmo quando os dados são limitados.

‍

Aprimorando a detecção de doenças em plantas com aprendizado zero-shot

Na agricultura, identificar rapidamente as doenças das plantas é essencial, pois atrasos na detecção podem levar a danos generalizados nas colheitas, redução da produção e perdas financeiras significativas. Os métodos tradicionais geralmente dependem de grandes conjuntos de dados e conhecimento especializado, que nem sempre estão acessíveis, especialmente em áreas remotas ou com recursos limitados. É aqui que os avanços na IA, como o aprendizado zero-shot, entram em jogo.

Digamos que um agricultor está a cultivar tomates e batatas e nota sintomas como folhas amareladas ou manchas castanhas. A aprendizagem zero pode ajudar a identificar doenças como a requeima sem necessitar de grandes conjuntos de dados. Ao utilizar descrições dos sintomas, o modelo pode classify doenças que nunca viu antes. Esta abordagem é rápida, escalável e permite aos agricultores detect uma variedade de problemas nas plantas. Ajuda-os a monitorizar a saúde das culturas de forma mais eficiente, a tomar medidas atempadas e a reduzir as perdas.

‍

Veículos autônomos e aprendizagem por transferência

Os veículos autônomos frequentemente precisam se adaptar a diferentes ambientes para navegar com segurança. A aprendizagem por transferência (transfer learning) os ajuda a usar o conhecimento prévio para se ajustar rapidamente a novas condições sem começar seu treinamento do zero. Combinadas com a visão computacional, que ajuda os veículos a interpretar informações visuais, essas tecnologias permitem uma navegação mais suave em diferentes terrenos e condições climáticas, tornando a direção autônoma mais eficiente e confiável.

Um bom exemplo disto em ação é um sistema de gestão de estacionamento que utilizaYOLO11 Ultralytics YOLO11 para monitorizar os lugares de estacionamento. YOLO11, um modelo de deteção de objectos pré-treinado, pode ser afinado utilizando a aprendizagem por transferência para identificar lugares de estacionamento vazios e ocupados em tempo real. Ao treinar o modelo num conjunto de dados mais pequeno de imagens de parques de estacionamento, aprende a detect com precisão lugares abertos, lugares cheios e até áreas reservadas.

‍

Integrado com outras tecnologias, este sistema pode orientar os condutores para o lugar disponível mais próximo, ajudando a reduzir o tempo de procura e o congestionamento do tráfego. A aprendizagem por transferência torna isto possível ao basear-se nas capacidades existentes de deteção de objectos do YOLO11, permitindo-lhe adaptar-se às necessidades específicas da gestão de estacionamento sem começar do zero. Esta abordagem poupa tempo e recursos, ao mesmo tempo que cria uma solução altamente eficiente e escalável que melhora as operações de estacionamento e melhora a experiência geral do utilizador.

Tendências emergentes em paradigmas de aprendizagem

O futuro dos paradigmas de aprendizado em visão computacional está se inclinando para o desenvolvimento de sistemas de Visão de IA mais inteligentes e sustentáveis. Em particular, uma tendência crescente é o uso de abordagens híbridas que combinam aprendizado com poucos exemplos (few-shot learning), aprendizado com zero exemplos (zero-shot learning) e aprendizado por transferência (transfer learning). Ao combinar os pontos fortes desses métodos, os modelos podem aprender novas tarefas com dados mínimos e aplicar seus conhecimentos em diferentes áreas.

Um exemplo interessante é o uso de embeddings profundos adaptados para ajustar modelos usando o conhecimento de tarefas anteriores e uma pequena quantidade de novos dados, facilitando o trabalho com conjuntos de dados limitados.

Da mesma forma, o aprendizado X-shot é projetado para lidar com tarefas com diferentes quantidades de dados. Ele usa supervisão fraca, onde os modelos aprendem com rótulos limitados ou ruidosos, e instruções claras para ajudá-los a se adaptar rapidamente, mesmo com poucos ou nenhum exemplo anterior disponível. Essas abordagens híbridas mostram como a integração de diferentes métodos de aprendizado pode ajudar os sistemas de IA a enfrentar os desafios de forma mais eficaz.

Principais conclusões

O aprendizado com poucos exemplos, o aprendizado com zero exemplos e o aprendizado por transferência abordam desafios específicos na visão computacional, tornando-os adequados para diferentes tarefas. A abordagem correta depende da aplicação específica e de quantos dados estão disponíveis. Por exemplo, o aprendizado com poucos exemplos funciona bem com dados limitados, enquanto o aprendizado com zero exemplos é ótimo para lidar com classes não vistas ou desconhecidas.

Olhando para o futuro, é provável que a combinação desses métodos para criar modelos híbridos que integrem visão, linguagem e áudio seja um foco fundamental. Esses avanços visam tornar os sistemas de IA mais flexíveis, eficientes e capazes de lidar com problemas complexos, abrindo novas possibilidades de inovação no campo.

Explore mais sobre a IA juntando-se à nossa comunidade e consultando o nosso repositório GitHub. Saiba como a IA em carros autónomos e a visão computacional na agricultura estão a remodelar o futuro. Veja as opções disponíveis da licençaYOLO para começar!

Entendendo o aprendizado few-shot, zero-shot e por transferência

Uma visão geral dos paradigmas de aprendizado

Aprendizado com poucos exemplos (Few-shot learning)

Aprendizado Zero-Shot

Transferência de aprendizado

Comparando paradigmas de aprendizado

Aplicações reais de vários paradigmas de aprendizagem

Diagnosticando doenças raras com aprendizado few-shot

Aprimorando a detecção de doenças em plantas com aprendizado zero-shot

Veículos autônomos e aprendizagem por transferência

Tendências emergentes em paradigmas de aprendizagem

Principais conclusões

Leia mais nesta categoria

O que é a estimativa de profundidade monocular? Uma visão geral

O que é computação de imagens? Uma breve introdução

O que é a correspondência de modelos? Um guia rápido

Vamos construir o futuro
da IA juntos!

Entendendo o aprendizado few-shot, zero-shot e por transferência

Uma visão geral dos paradigmas de aprendizado

Aprendizado com poucos exemplos (Few-shot learning)

Aprendizado Zero-Shot

Transferência de aprendizado

Comparando paradigmas de aprendizado

Aplicações reais de vários paradigmas de aprendizagem

Diagnosticando doenças raras com aprendizado few-shot

Aprimorando a detecção de doenças em plantas com aprendizado zero-shot

Veículos autônomos e aprendizagem por transferência

Tendências emergentes em paradigmas de aprendizagem

Principais conclusões

Leia mais nesta categoria

O que é a estimativa de profundidade monocular? Uma visão geral

O que é computação de imagens? Uma breve introdução

O que é a correspondência de modelos? Um guia rápido

Vamos construir o futuro da IA juntos!

Vamos construir o futuro
da IA juntos!