Sintonize na YOLO Vision 2025!
25 de setembro de 2025
10:00 — 18:00 BST
Evento híbrido
Yolo Vision 2024

O aprendizado ativo acelera o desenvolvimento da visão computacional

Abirami Vina

Leitura de 3 minutos

23 de janeiro de 2025

Aprenda como o aprendizado ativo é usado em visão computacional para minimizar os esforços de anotação e explore suas aplicações no mundo real em vários setores.

Treinar um modelo de visão computacional é muito parecido com ensinar uma criança a reconhecer cores. Primeiro, você precisaria de uma coleção de objetos coloridos. Então, você orientaria a criança a identificar corretamente cada cor, uma tarefa que geralmente é demorada e repetitiva.

Assim como uma criança precisa de muitos exemplos para aprender, um modelo de visão precisa de um grande conjunto de dados rotulados para reconhecer padrões e objetos em imagens. No entanto, rotular grandes quantidades de dados exige muito tempo e esforço, sem mencionar recursos. Técnicas como aprendizado ativo podem ajudar a simplificar este processo.

O aprendizado ativo é um processo passo a passo onde os dados mais importantes de um grande conjunto de dados são selecionados e rotulados. O modelo aprende com esses dados rotulados, tornando-o mais preciso e eficaz. Concentrar-se apenas nos dados mais valiosos reduz a quantidade de rotulagem necessária e acelera o desenvolvimento do modelo.

Neste artigo, vamos analisar como o aprendizado ativo auxilia no treinamento de modelos, reduz os custos de rotulagem e melhora a precisão geral do modelo.

Os conjuntos de dados de imagem não são fáceis de construir

Os conjuntos de dados são a base para modelos de visão computacional e aprendizado profundo. Conjuntos de dados populares como o ImageNet oferecem milhões de imagens com diversas categorias de objetos. No entanto, criar e manter esses enormes volumes de conjuntos de dados de alta qualidade traz vários desafios. 

Por exemplo, coletar e rotular dados leva tempo, recursos e anotadores qualificados, tornando o processo desafiador, dependendo da aplicação específica. Soluções inovadoras e mais eficientes são necessárias para acompanhar a crescente demanda por conjuntos de dados de imagem, e é exatamente isso que a aprendizagem ativa visa resolver. 

O aprendizado ativo oferece uma solução perfeita, otimizando o processo de rotulagem de dados. Ao selecionar estrategicamente os pontos de dados mais informativos para anotação, o aprendizado ativo maximiza o desempenho do modelo, minimizando os esforços de rotulagem. 

O que é aprendizado ativo?

O aprendizado ativo é uma técnica iterativa de machine learning onde o modelo escolhe os pontos de dados mais importantes para rotular a partir de um grande conjunto de dados não rotulados. Esses pontos de dados selecionados são rotulados manualmente e adicionados ao conjunto de dados de treinamento. 

O modelo é então retreinado no conjunto de dados atualizado e seleciona o próximo conjunto de pontos de dados a rotular. Este processo repete-se, com o modelo a melhorar continuamente, concentrando-se nos pontos de dados mais informativos. O ciclo continua até que o modelo atinja a precisão desejada ou cumpra os critérios de rotulagem definidos antecipadamente.

__wf_reserved_inherit
Fig. 1. Uma visão geral do aprendizado ativo.

Entendendo como o aprendizado ativo funciona

Você pode estar se perguntando como a técnica de active learning decide quais pontos de dados precisam de rotulagem manual e quais rotular em seguida. Vamos entender como o active learning funciona comparando-o a estudar para uma prova - você se concentra em tópicos sobre os quais não tem certeza e também se certifica de cobrir uma variedade de assuntos para estar bem preparado.

Para o conjunto inicial de processos de seleção de dados, o active learning usa estratégias como amostragem de incerteza e amostragem baseada em diversidade. A amostragem de incerteza prioriza pontos de dados onde o modelo está menos confiante em suas previsões, visando melhorar a precisão em casos desafiadores. A amostragem baseada em diversidade seleciona pontos de dados que cobrem uma ampla gama de características, garantindo que o modelo generalize bem para dados não vistos, expondo-o a diversos exemplos.

__wf_reserved_inherit
Fig 2. Amostragem de incerteza (à esquerda) e amostragem baseada na diversidade (à direita).

Após a seleção inicial de dados, o aprendizado ativo usa duas abordagens principais para rotulagem: amostragem baseada em pool e amostragem baseada em fluxo, que são semelhantes a como um professor ajuda um aluno a se concentrar no que é mais importante. 

Na amostragem baseada em pool, o modelo examina um grande pool de dados não rotulados e seleciona os exemplos mais desafiadores ou informativos para rotular, como um aluno priorizando os flashcards que considera mais difíceis. Com relação à amostragem baseada em fluxo, o modelo processa os dados à medida que chegam, decidindo se deve rotulá-los ou ignorá-los, semelhante a um aluno pedindo ajuda apenas quando está preso. Em ambos os casos, os dados rotulados são adicionados ao conjunto de treinamento e o modelo se retreina, melhorando constantemente a cada iteração.

Explorando aplicações de aprendizado ativo

O aprendizado ativo desempenha um papel fundamental nas aplicações de visão computacional, como imagens médicas e direção autônoma, melhorando a precisão do modelo e otimizando o processo de rotulagem de dados. Um exemplo interessante disso são os modelos de visão computacional usados em carros autônomos para detectar pedestres ou objetos em condições de pouca luz ou neblina. O aprendizado ativo pode aumentar a precisão, concentrando-se em cenários de direção diversos e desafiadores. 

Especificamente, o aprendizado ativo pode ser usado para identificar dados ou frames incertos de tais cenários para rotulagem seletiva. Adicionar esses exemplos rotulados ao conjunto de treinamento faz com que o modelo reconheça melhor pedestres e objetos em ambientes difíceis, como durante condições climáticas adversas ou direção noturna.

Por exemplo, a NVIDIA usou o aprendizado ativo para melhorar a detecção de pedestres à noite em seus modelos de direção autônoma. Ao selecionar estrategicamente os dados mais informativos para o treinamento, principalmente em cenários desafiadores, o desempenho do modelo aumenta substancialmente.

__wf_reserved_inherit
Fig 3. Detecção de um pedestre com um guarda-chuva usando aprendizado ativo.

O aprendizado ativo pode reduzir os custos de rotulagem

Outro aspecto fundamental do aprendizado ativo é seu potencial para reduzir os custos de rotulagem. Ele faz isso concentrando-se apenas nos pontos de dados mais importantes, em vez de exigir anotações para todo o conjunto de dados. Essa abordagem direcionada economiza tempo, esforço e dinheiro. Ao se concentrar em amostras incertas ou diversas, o aprendizado ativo reduz o número de anotações necessárias, mantendo a alta precisão do modelo.

De fato, pesquisas mostram que o aprendizado ativo pode reduzir os custos de rotulagem em 40-60% sem sacrificar o desempenho. Isso é especialmente útil em setores como saúde e manufatura, onde a rotulagem de dados é dispendiosa. Ao simplificar o processo de anotação, o aprendizado ativo ajuda as empresas a desenvolver modelos mais rapidamente e a implementá-los de forma mais eficiente, mantendo a precisão.

Benefícios do aprendizado ativo

Aqui estão algumas das outras principais vantagens que o aprendizado ativo pode oferecer:

  • Abordar o desequilíbrio de classes: O aprendizado ativo pode ajudar a resolver problemas de desequilíbrio de classes, rotulando instâncias de classes de dados minoritárias. O modelo pode ter um melhor desempenho em cenários raros com dados limitados.
  • Ciclos de desenvolvimento mais rápidos: Rotular menos dados significa indiretamente acelerar o processo de desenvolvimento de modelos de aprendizado de máquina e visão computacional, permitindo mais tempo e recursos para iterações e experimentos adicionais.
  • Adaptabilidade: Ele pode melhorar continuamente os dados de treinamento, iterando em amostras incertas ou de casos extremos, tornando-o adequado para conjuntos de dados dinâmicos ou em evolução.

O aprendizado ativo e o AutoML podem trabalhar juntos

O Aprendizado de Máquina Automatizado (AutoML) concentra-se na automação das tarefas iterativas e demoradas envolvidas na construção e implantação de modelos de aprendizado de máquina. Ele simplifica os fluxos de trabalho de aprendizado de máquina, automatizando tarefas como seleção de modelo e avaliação de desempenho para reduzir a necessidade de esforço manual. 

Quando integrado ao aprendizado ativo, o AutoML pode acelerar e otimizar o ciclo de vida do desenvolvimento do modelo. O componente de aprendizado ativo seleciona estrategicamente os pontos de dados mais informativos para rotulagem, enquanto o AutoML refina o modelo automatizando a escolha da arquitetura, parâmetros e ajuste.

__wf_reserved_inherit
Fig 4. Fluxo de trabalho do AutoML.

Vamos entender essa combinação de tecnologias com um exemplo. 

Digamos que você esteja tentando detectar condições raras em imagens médicas (um caso de uso onde conjuntos de dados rotulados são limitados e caros de obter). O aprendizado ativo pode identificar e selecionar dados incertos, como mudanças sutis em imagens de raios-X, que o modelo não consegue classificar. Então, os dados incertos podem ser priorizados para anotação manual para melhorar a compreensão do modelo. 

Com os dados anotados, o AutoML pode otimizar o modelo explorando várias arquiteturas, hiperparâmetros e outras técnicas de aumento de dados. O processo iterativo acelera o desenvolvimento de modelos de visão confiáveis, como o Ultralytics YOLO11, que ajudam os profissionais de saúde a fazer diagnósticos precisos.

Desafios da aprendizagem ativa

O aprendizado ativo e suas técnicas oferecem inúmeras vantagens, mas há algumas considerações a serem lembradas ao implementar essas estratégias:

  • Seleção da estratégia de consulta: O aprendizado ativo envolve muitas técnicas, e escolher o melhor método impacta significativamente a eficácia do modelo. Selecionar uma estratégia inadequada pode reduzir o desempenho do modelo para uma aplicação específica.
  • Custos de retreinamento: A natureza iterativa do aprendizado ativo requer recursos computacionais caros, especialmente para grandes conjuntos de dados. O modelo é retreinado após cada rodada de rotulagem, aumentando sua complexidade.
  • Qualidade inicial do modelo: A eficácia do aprendizado ativo depende da qualidade do modelo inicial. Um modelo inicial com baixo desempenho pode não identificar com precisão os pontos de dados informativos, levando a solicitações de rótulos abaixo do padrão e redução do desempenho geral.

O futuro do aprendizado ativo e do AutoML

Com os recentes avanços em IA e visão computacional, o aprendizado ativo está preparado para enfrentar desafios mais complexos e otimizar os fluxos de trabalho de aprendizado de máquina. A combinação do aprendizado ativo com técnicas como aprendizado federado e aprendizado auto-supervisionado pode aprimorar ainda mais a eficiência e a escalabilidade dos modelos de visão. 

A aprendizagem federada permite que um modelo seja treinado em vários dispositivos ou servidores com uma estrutura distribuída, sem exigir que os dados saiam de sua localização original. Considere setores como o da saúde, onde a privacidade dos dados é importante; a aprendizagem federada torna possível treinar diretamente em dados locais confidenciais, mantendo-os seguros. Em vez de compartilhar dados brutos, apenas as atualizações ou insights do modelo são compartilhados, garantindo que as informações privadas permaneçam protegidas enquanto contribuem para o processo de treinamento.

Enquanto isso, o aprendizado auto-supervisionado ajuda a reduzir a necessidade de dados rotulados, pré-treinando modelos em dados não rotulados. Este processo cria uma base sólida para o modelo. O aprendizado ativo pode então se basear nisso, identificando e selecionando os pontos de dados mais importantes para a anotação humana, refinando ainda mais o modelo.

Da aprendizagem ativa ao impacto ativo

O aprendizado ativo oferece uma maneira prática de enfrentar os principais desafios da visão computacional, como o alto custo da anotação de dados e a necessidade de modelos mais precisos. Ao se concentrar em rotular apenas os pontos de dados mais valiosos, ele reduz o esforço exigido dos humanos, ao mesmo tempo em que aumenta o desempenho do modelo.

Quando combinado com tecnologias como AutoML, o aprendizado ativo agiliza o desenvolvimento de modelos, automatizando tarefas demoradas. À medida que os avanços continuam, o aprendizado ativo está definido para se tornar uma ferramenta essencial para a construção de sistemas de visão computacional mais inteligentes e eficientes.

Explore o nosso repositório GitHub e junte-se à nossa comunidade para saber mais sobre modelos de IA e visão computacional. Descubra mais aplicações de visão computacional na manufatura e saúde nas nossas páginas de soluções. Também pode consultar as nossas opções de licenciamento para começar hoje mesmo a sua jornada na Vision AI.

Vamos construir o futuro
da IA juntos!

Comece sua jornada com o futuro do aprendizado de máquina

Comece gratuitamente
Link copiado para a área de transferência