Conheça o YOLO26: IA de visão de próxima geração.
Ultralytics
Integrações

Usando aumentações do Albumentations para diversificar seus dados

Saiba como usar o Albumentations para aumentações ao treinar o Ultralytics YOLO11 de forma personalizada, melhorando o desempenho do modelo com dados de treinamento diversificados.

ABAbirami Vina
5 min read
Aumentações de dados do Albumentations diversificando imagens de treinamento do YOLO11

Ao criar uma solução de visão computacional, coletar um conjunto diversificado de imagens para treinar modelos de IA de visão pode ser uma parte crucial do processo. Isso geralmente exige muito tempo e dinheiro e, às vezes, as imagens coletadas ainda não são variadas o suficiente para que os modelos aprendam de forma eficaz.

Por exemplo, modelos de visão computacional como o Ultralytics YOLO11 podem ser treinados de forma personalizada em conjuntos de dados de imagem para diversas tarefas de visão computacional relacionadas a diferentes aplicações. Dados diversificados são fundamentais porque ajudam o modelo a generalizar melhor, permitindo que ele reconheça objetos e padrões em uma ampla gama de cenários do mundo real.

Se você está com dificuldades devido à falta de dados diversificados, as técnicas de aumento de dados de imagem podem ser uma ótima solução. Métodos como rotação, inversão e ajuste de brilho podem ajudar a aumentar a variedade do seu conjunto de dados, melhorando a capacidade do modelo de lidar com uma gama mais ampla de condições.

É por isso que a Ultralytics oferece suporte a uma integração para aumento de dados de imagem. Usando o Albumentations, uma ferramenta popular que oferece uma coleção de transformações, você pode criar dados visuais diversos. Essa integração simplifica o processo de treinamento do YOLO11 aumentando automaticamente as imagens de treinamento, o que leva a um melhor desempenho do modelo.

Neste artigo, exploraremos como você pode usar a integração com o Albumentations, seus benefícios e seu impacto no treinamento do modelo.

Link to this sectionO que é o Albumentations?#

Os modelos de visão computacional podem aprender com um amplo conjunto de imagens de alta qualidade para reconhecer objetos em diferentes ambientes. Coletar grandes conjuntos de dados de fontes do mundo real pode ser lento, caro e ineficiente. Para simplificar essa tarefa, você pode usar o aumento de dados de imagem para criar novas variações de imagens existentes, ajudando os modelos a aprender com diferentes cenários sem precisar coletar mais dados.

Especificamente, você pode aproveitar o Albumentations, uma biblioteca de código aberto introduzida para o aumento eficiente de dados de imagem em 2018. Ela oferece suporte a uma variedade de operações, desde mudanças geométricas simples como rotações e inversões até ajustes mais complexos, como brilho, contraste e adição de ruído.

Exemplos de diferentes tipos de aumentações de dados de imagem

Fig 1. Exemplos de diferentes tipos de aumentos de dados de imagem.

Link to this sectionPrincipais recursos do Albumentations#

O Albumentations é conhecido pelo seu alto desempenho, o que significa que ele pode processar imagens de forma rápida e eficiente. Construído sobre bibliotecas otimizadas como OpenCV e NumPy, ele lida com grandes conjuntos de dados com tempo de processamento mínimo, tornando-o ideal para um rápido aumento de dados durante o treinamento do modelo.

Aqui estão alguns outros recursos importantes do Albumentations:

  • Ampla gama de transformações: O Albumentations oferece mais de 70 tipos de aumentos. Essas variações ajudam os modelos a aprender a detectar objetos, apesar de mudanças na iluminação, ângulos ou planos de fundo.
  • Otimizado para velocidade: Ele usa técnicas avançadas de otimização como SIMD (Single Instruction, Multiple Data), que processa vários pontos de dados ao mesmo tempo para acelerar o aumento da imagem e lidar com grandes conjuntos de dados de forma eficiente.
  • Três níveis de aumentos: Ele aprimora os dados de três maneiras. Por exemplo, os aumentos em nível de pixel ajustam o brilho e a cor sem alterar os objetos. Enquanto isso, os aumentos em nível espacial modificam o posicionamento do objeto preservando detalhes importantes, e os aumentos em nível de mistura combinam partes de diferentes imagens para criar novas amostras.

Link to this sectionPor que você deve usar a integração com o Albumentations?#

Você pode estar se perguntando: existem muitas maneiras de aplicar aumentos a um conjunto de dados, e você poderia até criar os seus próprios usando ferramentas como o OpenCV. Então, por que escolher uma integração que oferece suporte a uma biblioteca como o Albumentations?

Criar aumentos manualmente com ferramentas como o OpenCV pode levar muito tempo e requer algum conhecimento técnico. Também pode ser difícil ajustar as transformações para obter os melhores resultados. A integração com o Albumentations torna esse processo mais fácil. Ela oferece muitas transformações prontas para uso que podem economizar seu tempo e esforço ao preparar seu conjunto de dados.

Outro motivo para escolher a integração com o Albumentations é que ela funciona perfeitamente com o pipeline de treinamento de modelo da Ultralytics. Isso torna muito mais fácil treinar o YOLO11 de forma personalizada, já que os aumentos são aplicados automaticamente durante o treinamento. Isso simplifica o processo, para que você possa se concentrar mais em melhorar seu modelo do que em lidar com a preparação de dados.

Link to this sectionPrimeiros passos com a integração do Albumentations#

Curiosamente, usar as integrações do Albumentations para treinar o YOLO11 é mais simples do que parece. Uma vez que as bibliotecas certas estejam configuradas, a integração aplica automaticamente aumentos de dados de imagem durante o treinamento. Isso ajuda o modelo a aprender com diferentes variações de imagem usando o mesmo conjunto de dados.

A seguir, vamos orientá-lo sobre como instalar e usar a integração com o Albumentations ao treinar o YOLO11 de forma personalizada.

Link to this sectionInstalando o pacote Python da Ultralytics e o Albumentations#

Antes de aplicar os aumentos, tanto o pacote Python da Ultralytics quanto o Albumentations precisam ser instalados. A integração foi criada para que ambas as bibliotecas funcionem juntas perfeitamente por padrão, então você não precisa se preocupar com configurações complexas.

Todo o processo de instalação pode ser concluído em apenas alguns minutos com um único comando pip, que é uma ferramenta de gerenciamento de pacotes para instalar bibliotecas Python, como mostrado na imagem abaixo.

Instalando Ultralytics e Albumentations com pip

Fig 2. Instalando Ultralytics e Albumentations.

Uma vez que o Albumentations está instalado, o modo de treinamento de modelo da Ultralytics aplica automaticamente aumentos de imagem durante o treinamento. Se o Albumentations não estiver instalado, esses aumentos não serão aplicados. Para obter mais detalhes, consulte a documentação oficial da Ultralytics.

Link to this sectionTreinando o YOLO11 com a ajuda da integração com o Albumentations#

Vamos entender melhor o que está acontecendo nos bastidores da integração com o Albumentations.

Aqui está uma visão mais detalhada dos aumentos aplicados durante o treinamento do YOLO11:

  • Desfoque (Blur): Esta transformação adiciona um leve desfoque a uma imagem. Ajuda o modelo a detectar objetos mesmo quando eles estão fora de foco.
  • Desfoque mediano (Median blur): Reduz o ruído aleatório enquanto preserva as bordas dos objetos em uma imagem. Isso facilita a detecção de objetos pelo modelo em ambientes complexos.
  • Escala de cinza (Grayscale): Ao converter uma imagem para preto e branco, esse aumento pode ajudar o modelo a se concentrar em formas e texturas em vez de cores.
  • CLAHE (Equalização de histograma adaptativa limitada por contraste): Este aumento aumenta o contraste nas imagens, particularmente em áreas que são muito escuras ou difíceis de ver, como em condições de pouca luz ou com neblina. Isso torna os objetos nessas áreas mais claros e fáceis para o modelo identificar.

Aumentação de escala de cinza aplicada a uma imagem de um gato

Fig 3. Um exemplo de aumento em escala de cinza aplicado a uma imagem de um gato.

Link to this sectionAplicações do YOLO11 e a integração com o Albumentations#

Se você está treinando o YOLO11 de forma personalizada para uma aplicação específica, a integração com o Albumentations pode ajudar a melhorar o desempenho do modelo, adaptando-o a várias condições. Vamos discutir algumas aplicações do mundo real e os desafios que essa integração pode resolver.

Link to this sectionMelhorando a imagem médica#

A IA de visão na saúde está ajudando médicos a analisar imagens médicas com mais precisão para auxiliar em diagnósticos e melhorar o atendimento ao paciente. De fato, cerca de um quinto das organizações de saúde já estão usando soluções de IA.

No entanto, criar essas soluções de visão computacional traz seu próprio conjunto de desafios. Exames médicos podem variar muito entre hospitais, influenciados por fatores como equipamentos diferentes, configurações e até mesmo a experiência dos técnicos. Variações de brilho, contraste e exposição podem afetar a consistência e a precisão dos modelos de IA de visão, tornando difícil para eles um desempenho confiável em diferentes ambientes.

É aqui que a integração de ferramentas como o Albumentations se torna essencial. Ao gerar várias versões aumentadas do mesmo exame, o Albumentations permite que o modelo aprenda com uma variedade de qualidades de imagem. Isso ajuda o modelo a se tornar mais robusto, permitindo que ele detecte doenças com precisão em imagens de alta e baixa qualidade.

Imagens de raio-X aumentadas

Fig 4. Imagens de raio-X aumentadas.

Link to this sectionMelhorando a segurança e a vigilância#

Outra aplicação interessante da IA de visão é em segurança e vigilância. A detecção de objetos em tempo real pode ajudar as equipes de segurança a identificar possíveis ameaças rapidamente.

Uma preocupação principal relacionada a essa aplicação é que as câmeras de segurança capturam filmagens sob várias condições de iluminação ao longo do dia, e essas condições podem afetar drasticamente a forma como um modelo entende tais imagens. Fatores como ambientes com pouca luz, reflexos ou baixa visibilidade podem dificultar a detecção de objetos ou o reconhecimento consistente de ameaças potenciais por modelos de visão computacional.

A integração com o Albumentations ajuda aplicando transformações para simular diferentes condições de iluminação. Isso permite que o modelo aprenda a detectar objetos em ambientes claros e com pouca luz, tornando-o mais confiável e melhorando os tempos de resposta em condições desafiadoras.

Link to this sectionRedefinindo fluxos de trabalho no varejo e experiência do cliente#

Um derramamento no corredor de um supermercado, um cachorro correndo por uma loja ou uma criança derrubando uma exibição de produtos são apenas alguns exemplos de eventos cotidianos que podem ser casos extremos para a IA de visão no varejo ambientes. A visão computacional é cada vez mais usada para melhorar a experiência do cliente rastreando o comportamento do comprador, monitorando o tráfego de pedestres e identificando produtos nas prateleiras. No entanto, essas situações do mundo real podem ser difíceis para os sistemas de IA entenderem e processarem com precisão.

Embora nem todo cenário possa ser representado em um conjunto de dados de visão computacional, a integração com o Albumentations ajuda aumentando os dados para cobrir muitas situações possíveis, como iluminação inesperada, ângulos incomuns ou obstruções. Isso ajuda os modelos de visão computacional a se adaptarem a várias condições, melhorando sua capacidade de lidar com casos extremos e fazer previsões precisas em ambientes de varejo dinâmicos.

Link to this sectionPrincipais pontos#

Coletar dados diversificados do mundo real para o treinamento do modelo pode ser complicado, mas o Albumentations torna isso mais fácil criando variações de imagem que ajudam os modelos a se adaptarem a diferentes condições.

A integração com o Albumentations suportada pela Ultralytics simplifica o processo de aplicação desses aumentos durante o treinamento personalizado do YOLO11. Isso resulta em uma melhor qualidade do conjunto de dados, o que beneficia uma ampla gama de setores ao produzir modelos de IA de visão mais precisos e confiáveis.

Junte-se à nossa comunidade e explore nosso repositório no GitHub para saber mais sobre IA, e confira nossas opções de licenciamento para dar o pontapé inicial em seus projetos de IA de visão. Interessado em inovações como IA na manufatura ou visão computacional em direção autônoma? Visite nossas páginas de soluções para descobrir mais.

Explore solutions

Real-time AI that works with your team

IA em robótica

Potencialize máquinas mais inteligentes com modelos Ultralytics YOLO. A IA de visão em robótica impulsiona a navegação autônoma, percepção, rastreamento de objetos e controle em tempo real.

Sabe mais
Real-time AI that works with your team

IA na Logística

Otimize a logística com modelos Ultralytics YOLO. A IA de visão permite a inspeção de pacotes, triagem, rastreamento de veículos e monitoramento de segurança em armazéns em tempo real.

Sabe mais
Real-time AI that works with your team

IA no varejo

Reinvente o varejo com modelos Ultralytics YOLO. A IA de visão impulsiona o rastreamento de inventário, monitoramento de prateleiras, gerenciamento de filas e percepções mais inteligentes sobre o cliente.

Sabe mais
Real-time AI that works with your team

IA na Saúde

Constrói soluções de saúde com modelos Ultralytics YOLO. A visão AI na saúde impulsiona imagens médicas mais rápidas, diagnósticos mais inteligentes e monitorização do paciente.

Sabe mais
Real-time AI that works with your team

IA na Fabricação

Otimize a fabricação com modelos Ultralytics YOLO. A IA de visão impulsiona o controle de qualidade, detecção de defeitos, conformidade com EPI e automação de linhas de montagem.

Sabe mais
Real-time AI that works with your operation

IA no Setor Automóvel

Aplica visão computacional no setor automóvel com modelos Ultralytics YOLO. A visão AI eleva a segurança rodoviária, a assistência ao condutor e a automação de veículos para estradas mais inteligentes.

Sabe mais
Real-time AI tailored to your operation

IA na Agricultura

Leva a visão AI para a agricultura inteligente com os modelos Ultralytics YOLO. Potencia a monitorização de culturas, o seguimento de gado e a agricultura de precisão para colheitas maiores e mais inteligentes.

Sabe mais
Real-time AI that works with your team

IA em robótica

Potencialize máquinas mais inteligentes com modelos Ultralytics YOLO. A IA de visão em robótica impulsiona a navegação autônoma, percepção, rastreamento de objetos e controle em tempo real.

Sabe mais
Real-time AI that works with your team

IA na Logística

Otimize a logística com modelos Ultralytics YOLO. A IA de visão permite a inspeção de pacotes, triagem, rastreamento de veículos e monitoramento de segurança em armazéns em tempo real.

Sabe mais
Real-time AI that works with your team

IA no varejo

Reinvente o varejo com modelos Ultralytics YOLO. A IA de visão impulsiona o rastreamento de inventário, monitoramento de prateleiras, gerenciamento de filas e percepções mais inteligentes sobre o cliente.

Sabe mais
Real-time AI that works with your team

IA na Saúde

Constrói soluções de saúde com modelos Ultralytics YOLO. A visão AI na saúde impulsiona imagens médicas mais rápidas, diagnósticos mais inteligentes e monitorização do paciente.

Sabe mais
Real-time AI that works with your team

IA na Fabricação

Otimize a fabricação com modelos Ultralytics YOLO. A IA de visão impulsiona o controle de qualidade, detecção de defeitos, conformidade com EPI e automação de linhas de montagem.

Sabe mais
Real-time AI that works with your operation

IA no Setor Automóvel

Aplica visão computacional no setor automóvel com modelos Ultralytics YOLO. A visão AI eleva a segurança rodoviária, a assistência ao condutor e a automação de veículos para estradas mais inteligentes.

Sabe mais
Real-time AI tailored to your operation

IA na Agricultura

Leva a visão AI para a agricultura inteligente com os modelos Ultralytics YOLO. Potencia a monitorização de culturas, o seguimento de gado e a agricultura de precisão para colheitas maiores e mais inteligentes.

Sabe mais
Real-time AI that works with your team

IA em robótica

Potencialize máquinas mais inteligentes com modelos Ultralytics YOLO. A IA de visão em robótica impulsiona a navegação autônoma, percepção, rastreamento de objetos e controle em tempo real.

Sabe mais
Real-time AI that works with your team

IA na Logística

Otimize a logística com modelos Ultralytics YOLO. A IA de visão permite a inspeção de pacotes, triagem, rastreamento de veículos e monitoramento de segurança em armazéns em tempo real.

Sabe mais
Real-time AI that works with your team

IA no varejo

Reinvente o varejo com modelos Ultralytics YOLO. A IA de visão impulsiona o rastreamento de inventário, monitoramento de prateleiras, gerenciamento de filas e percepções mais inteligentes sobre o cliente.

Sabe mais
Real-time AI that works with your team

IA na Saúde

Constrói soluções de saúde com modelos Ultralytics YOLO. A visão AI na saúde impulsiona imagens médicas mais rápidas, diagnósticos mais inteligentes e monitorização do paciente.

Sabe mais
Real-time AI that works with your team

IA na Fabricação

Otimize a fabricação com modelos Ultralytics YOLO. A IA de visão impulsiona o controle de qualidade, detecção de defeitos, conformidade com EPI e automação de linhas de montagem.

Sabe mais
Real-time AI that works with your operation

IA no Setor Automóvel

Aplica visão computacional no setor automóvel com modelos Ultralytics YOLO. A visão AI eleva a segurança rodoviária, a assistência ao condutor e a automação de veículos para estradas mais inteligentes.

Sabe mais
Real-time AI tailored to your operation

IA na Agricultura

Leva a visão AI para a agricultura inteligente com os modelos Ultralytics YOLO. Potencia a monitorização de culturas, o seguimento de gado e a agricultura de precisão para colheitas maiores e mais inteligentes.

Sabe mais

Vamos construir o futuro da IA juntos!

Começa a tua jornada com o futuro da aprendizagem automática