Yolo Vision Shenzhen
Shenzhen
Junte-se agora

Usando aumentos de Albumentations para diversificar seus dados

Abirami Vina

Leitura de 5 minutos

17 de fevereiro de 2025

Saiba como utilizar Albumentations para aumentos aquando da formação personalizada Ultralytics YOLO11 para melhorar o desempenho do modelo com diversos dados de formação.

Ao construir uma solução de visão computacional, coletar um conjunto diversificado de imagens para treinar modelos de Visão de IA pode ser uma parte crucial do processo. Muitas vezes, requer muito tempo e dinheiro e, às vezes, as imagens coletadas ainda não são variadas o suficiente para que os modelos aprendam de forma eficaz.

Por exemplo, modelos de visão por computador como o Ultralytics YOLO11 podem ser treinados de forma personalizada em conjuntos de dados de imagens para várias tarefas de visão computacional relacionadas com diferentes aplicações. A diversidade de dados é fundamental porque ajuda o modelo a generalizar melhor, permitindo-lhe reconhecer objectos e padrões numa vasta gama de cenários do mundo real.

Se está a ter dificuldades com a falta de dados diversificados, as técnicas de data augmentation de imagem podem ser uma ótima solução. Métodos como rotação, inversão e ajuste de brilho podem ajudar a aumentar a variedade do seu conjunto de dados, melhorando a capacidade do modelo de lidar com uma gama mais ampla de condições.

É por isso que Ultralytics suporta uma integração para aumentar os dados de imagem. Utilizando o Albumentations, uma ferramenta popular que oferece uma coleção de transformações, pode criar diversos dados visuais. Esta integração simplifica o processo de treino do YOLO11 , aumentando automaticamente as imagens de treino, o que leva a um melhor desempenho do modelo. 

Neste artigo, exploraremos como você pode usar a integração do Albumentations, seus benefícios e seu impacto no treinamento do modelo.

O que é Albumentations?

Os modelos de visão computacional podem aprender com um amplo conjunto de imagens de alta qualidade para reconhecer objetos em diferentes ambientes. Coletar grandes conjuntos de dados de fontes do mundo real pode ser lento, caro e ineficiente. Para agilizar essa tarefa, você pode usar o aumento de dados de imagem para criar novas variações de imagens existentes, ajudando os modelos a aprender com diferentes cenários sem coletar mais dados.

Especificamente, você pode aproveitar o Albumentations, uma biblioteca de código aberto introduzida para aumento eficiente de dados de imagem em 2018. Ele oferece suporte a uma variedade de operações, desde mudanças geométricas simples, como rotações e inversões, até ajustes mais complexos, como brilho, contraste e adição de ruído.

__wf_reserved_inherit
Fig. 1. Exemplos de diferentes tipos de aumentos de dados de imagem.

Principais características do Albumentations

O Albumentations é conhecido pelo seu elevado desempenho, o que significa que pode processar imagens de forma rápida e eficiente. Construído em bibliotecas optimizadas como o OpenCV e NumPy, ele lida com grandes conjuntos de dados com tempo de processamento mínimo, tornando-o ideal para o aumento rápido de dados durante o treinamento do modelo.

Aqui estão alguns outros recursos importantes do Albumentations:

  • Vasta gama de transformações: O Albumentations fornece mais de 70 tipos de aumentos. Estas variações ajudam os modelos a aprender a detect objectos apesar das alterações na iluminação, ângulos ou fundos.
  • Otimizado para velocidade: Utiliza técnicas avançadas de otimização como SIMD (Single Instruction, Multiple Data), que processa múltiplos pontos de dados de uma só vez para acelerar o aumento de imagem e lidar com grandes conjuntos de dados de forma eficiente.
  • Três níveis de aumentos: Ele aprimora os dados de três maneiras. Por exemplo, os aumentos no nível de pixel ajustam o brilho e a cor sem alterar os objetos. Enquanto isso, os aumentos no nível espacial modificam o posicionamento do objeto, preservando os detalhes principais, e os aumentos no nível de mistura combinam partes de diferentes imagens para criar novas amostras.

Por que você deve usar a integração do Albumentations?

Pode estar a perguntar-se: há muitas formas de aplicar aumentos a um conjunto de dados e pode até criar os seus próprios aumentos utilizando ferramentas como o OpenCV. Então, porquê escolher uma integração que suporte uma biblioteca como a Albumentations?

A criação manual de aumentos com ferramentas como o OpenCV pode demorar muito tempo e requer alguma experiência. Também pode ser complicado afinar as transformações para obter os melhores resultados. A integração do Albumentations torna este processo mais fácil. Oferece muitas transformações prontas a utilizar que lhe podem poupar tempo e esforço ao preparar o seu conjunto de dados.

Outra razão para escolher a integração Albumentations é o facto de funcionar sem problemas com o pipeline deformação de modelos Ultralytics . Torna muito mais fácil o treino personalizado YOLO11, uma vez que os aumentos são aplicados automaticamente durante o treino. Simplifica o processo, para que se possa concentrar mais em melhorar o seu modelo do que em lidar com a preparação dos dados. 

Começando com a integração do Albumentations

Curiosamente, a utilização das integrações Albumentations para treinar YOLO11 é mais simples do que parece. Uma vez configuradas as bibliotecas corretas, a integração aplica automaticamente aumentos de dados de imagem durante o treino. Ajuda o modelo a aprender com diferentes variações de imagem utilizando o mesmo conjunto de dados.

De seguida, vamos ver como instalar e utilizar a integração do Albumentations na formação personalizada YOLO11.

Instalar o pacote Ultralytics Python e Albumentations

Antes de aplicar as ampliações, é necessário instalar o pacoteUltralytics Python e o Albumentations. A integração foi criada de modo a que ambas as bibliotecas funcionem em conjunto sem problemas por defeito, pelo que não precisa de se preocupar com configurações complexas.

Todo o processo de instalação pode ser concluído em apenas alguns minutos com um único comando pip, que é uma ferramenta de gestão de pacotes para a instalação de bibliotecas Python , como mostra a imagem abaixo. 

__wf_reserved_inherit
Fig. 2. Instalação de Ultralytics e Albumentations.

Quando o Albumentations estiver instalado, o modo de treino do modelo Ultralytics aplica automaticamente aumentos de imagem durante o treino. Se o Albumentations não estiver instalado, estas ampliações não serão aplicadas. Para mais pormenores, pode consultar a documentação oficial Ultralytics .

Treinar YOLO11 com a ajuda da integração Albumentations

Vamos entender melhor o que está acontecendo sob o capô da integração do Albumentations. 

Aqui está um olhar mais atento sobre os aumentos que estão a ser aplicados durante o treino YOLO11 :

  • Desfoque: Esta transformação adiciona um ligeiro desfoque a uma imagem. Ajuda o modelo a detect objectos mesmo quando estes estão desfocados.
  • Desfocagem mediana: Reduz o ruído aleatório, preservando os limites dos objectos numa imagem. Isto torna mais fácil para o modelo detect objectos em ambientes complexos.
  • Escala de cinza: Ao converter uma imagem para preto e branco, este aumento pode ajudar o modelo a se concentrar em formas e texturas em vez de cores.
  • CLAHE (Equalização de histograma adaptativa com limite de contraste): Esta técnica de aumento melhora o contraste nas imagens, particularmente em áreas que estão muito escuras ou difíceis de ver, como em condições de pouca luz ou nebulosas. Isso torna os objetos nessas áreas mais claros e fáceis para o modelo identificar.
__wf_reserved_inherit
Fig. 3. Um exemplo de uma augmentação em escala de cinza aplicada a uma imagem de um gato.

Aplicações do YOLO11 e da integração das Albumentações

Se estiver a treinar YOLO11 de forma personalizada para uma aplicação específica, a integração do Albumentations pode ajudar a melhorar o desempenho do modelo, adaptando-se a várias condições. Vamos discutir algumas aplicações do mundo real e os desafios que esta integração pode resolver.

Aprimorando imagens médicas

A IA de visão na área da saúde está ajudando os médicos a analisar imagens médicas com mais precisão para auxiliar nos diagnósticos e melhorar o atendimento ao paciente. Na verdade, cerca de um quinto das organizações de saúde já estão usando soluções de IA. 

No entanto, criar essas soluções de visão computacional traz seu próprio conjunto de desafios. As varreduras médicas podem variar amplamente entre hospitais, influenciadas por fatores como diferentes equipamentos, configurações e até mesmo a experiência dos técnicos. Variações no brilho, contraste e exposição podem afetar a consistência e a precisão dos modelos de Visão de IA, tornando difícil para eles terem um desempenho confiável em diferentes ambientes.

É aqui que a integração de ferramentas como o Albumentations se torna essencial. Ao gerar várias versões aumentadas do mesmo exame, o Albumentations permite que o modelo aprenda com uma variedade de qualidades de imagem. Isto ajuda o modelo a tornar-se mais robusto, permitindo-lhe detect doenças com precisão tanto em imagens de alta como de baixa qualidade. 

__wf_reserved_inherit
Fig 4. Imagens de raio-x aumentadas.

Aprimorando a segurança e a vigilância

Outra aplicação interessante da Visão de IA é em segurança e vigilância. A detecção de objetos em tempo real pode ajudar as equipes de segurança a identificar possíveis ameaças rapidamente. 

Uma das principais preocupações relacionadas com esta aplicação é o facto de as câmaras de segurança capturarem imagens sob várias condições de iluminação ao longo do dia, e estas condições podem afetar drasticamente a forma como um modelo compreende essas imagens. Factores como ambientes com pouca luz, brilho ou fraca visibilidade podem dificultar a detect objectos ou o reconhecimento de potenciais ameaças de forma consistente pelos modelos de visão por computador.

A integração do Albumentations ajuda-o a aplicar transformações para imitar diferentes condições de iluminação. Isto permite que o modelo aprenda a detect objectos tanto em ambientes com muita como pouca luz, tornando-o mais fiável e melhorando os tempos de resposta em condições difíceis.

Redefinindo os fluxos de trabalho de varejo e a experiência do cliente

Um derramamento no corredor de um supermercado, um cachorro correndo por uma loja ou uma criança derrubando uma exibição de produtos são apenas alguns exemplos de eventos cotidianos que podem ser casos extremos para Visão de IA em ambientes de varejo. A visão computacional é cada vez mais usada para melhorar a experiência do cliente, rastreando o comportamento do comprador, monitorando o tráfego de pedestres e identificando produtos nas prateleiras. No entanto, essas situações do mundo real podem ser difíceis para os sistemas de IA entenderem e processarem com precisão.

Embora nem todos os cenários possam ser representados em um conjunto de dados de visão computacional, a integração do Albumentations ajuda aumentando os dados para cobrir muitas situações possíveis, como iluminação inesperada, ângulos incomuns ou obstruções. Isso ajuda os modelos de visão computacional a se adaptarem a várias condições, melhorando sua capacidade de lidar com casos extremos e fazer previsões precisas em ambientes de varejo dinâmicos.

Principais conclusões

Coletar dados diversos do mundo real para o treinamento de modelos pode ser complicado, mas o Albumentations facilita isso, criando variações de imagem que ajudam os modelos a se adaptarem a diferentes condições. 

A integração do Albumentations suportada pelo Ultralytics simplifica o processo de aplicação destes aumentos durante a formação personalizada YOLO11. Isto resulta numa melhor qualidade do conjunto de dados, o que beneficia uma vasta gama de indústrias ao produzir modelos de IA de visão mais precisos e fiáveis.

Junte-se à nossa comunidade e explore nosso repositório GitHub para saber mais sobre IA, e confira nossas opções de licenciamento para dar o pontapé inicial em seus projetos de Visão de IA. Interessado em inovações como IA na manufatura ou visão computacional em direção autônoma? Visite nossas páginas de soluções para descobrir mais. 

Vamos construir o futuro
da IA juntos!

Comece sua jornada com o futuro do aprendizado de máquina

Comece gratuitamente