Yolo Vision Shenzhen
Shenzhen
Junte-se agora

Como utilizar o Ultralytics YOLO11 para a classificação de imagens

Abirami Vina

4 min de leitura

11 de novembro de 2024

Saiba como o novo modelo Ultralytics YOLO11 melhora a classificação de imagens, oferecendo uma melhor precisão para tarefas na agricultura, retalho e monitorização da vida selvagem.

Digamos que um robô esteja olhando para dois gatos, um preto e um branco, e precise descobrir qual é qual. Para fazer isso, ele pode usar a classificação de imagens, uma tarefa de visão computacional que ajuda a identificar e categorizar objetos ou cenas em uma imagem. Na verdade, graças aos recentes avanços na inteligência artificial (IA), a classificação de imagens pode ser usada em uma ampla variedade de aplicações, desde o monitoramento de animais até a manufatura e a agricultura com a detecção de doenças em plantações.

Um dos mais recentes avanços na classificação de imagens é o modeloUltralytics YOLO11 . Lançado no evento híbrido anual daUltralytics, YOLO Vision 2024 (YV24), YOLO11 foi concebido para lidar com uma grande variedade de tarefas de IA de visão, incluindo a classificação de imagens, com facilidade e precisão.

Neste artigo, vamos explorar os fundamentos da classificação de imagens, discutir aplicações do mundo real e mostrar-lhe como pode utilizar o YOLO11 para classificação de imagens através do pacoteUltralytics Python . Também veremos como pode experimentar as capacidades doYOLO11 no Ultralytics HUB em alguns passos simples. Vamos começar!

__wf_reserved_inherit
Fig. 1. Um exemplo de utilização do Ultralytics YOLO11 para classify um gato persa.

O que é classificação de imagens?

A classificação de imagens funciona através da atribuição de uma etiqueta ou rótulo a uma imagem com base em padrões aprendidos a partir de imagens previamente rotuladas. Ao analisar cuidadosamente os pixéis de uma imagem, um modelo de visão por computador pode encontrar a melhor correspondência para a imagem. Modelos fiáveis como o YOLO11 podem lidar com este processo sem problemas. A arquitetura do modelo YOLO11torna possível processar imagens ou fotogramas de vídeo quase instantaneamente, tornando-o ideal para aplicações que necessitem de uma classificação de imagem rápida e precisa.

Para realmente entender o escopo da classificação de imagens, ajuda distinguir essa tarefa de outras, como a detecção de objetos. Enquanto a classificação de imagens rotula uma imagem inteira, a detecção de objetos identifica e localiza cada objeto dentro da imagem. 

__wf_reserved_inherit
Fig. 2. Uma comparação de classificação de imagem, detecção de objetos e segmentação de imagem.

Vamos considerar uma imagem de uma girafa. Na classificação de imagens, o modelo pode rotular a imagem inteira simplesmente como uma girafa com base em seu conteúdo geral. No entanto, com a detecção de objetos, o modelo não para na identificação da girafa; ele também coloca uma caixa delimitadora ao redor da girafa, identificando sua localização exata dentro da imagem.

Agora, imagine a girafa perto de uma árvore em uma savana com outros animais. Um modelo de classificação de imagem pode rotular toda a cena como uma savana ou apenas vida selvagem. No entanto, com a detecção de objetos, o modelo identificaria cada elemento individualmente, reconhecendo a girafa, a árvore e os outros animais, cada um com suas próprias caixas delimitadoras.

Aplicações de classificação de imagens YOLO11

A precisão e o desempenho do modelo Ultralytics YOLO11 para classificação de imagens torna-o útil numa vasta gama de indústrias. Vamos explorar algumas das principais aplicações do YOLO11 na classificação de imagens.

Classificação de imagens YOLO11 na agricultura

A classificação de imagens pode ajudar a otimizar muitas funções na agricultura e no sector agrícola. Especificamente, utilizando modelos de classificação de imagens como o YOLO11, os agricultores podem monitorizar constantemente a saúde das suas culturas, detect doenças graves e identificar quaisquer infestações de pragas com elevada precisão. 

Aqui está uma visão de como isso funciona:

  • Captura de imagem: Dispositivos de Internet das Coisas (IoT), como câmeras e drones, podem ser implementados para capturar imagens em tempo real de plantações de vários ângulos e locais nos campos.
  • Processamento: Dependendo dos recursos e da conectividade disponíveis, as imagens podem ser processadas no local por meio de computação de borda ou carregadas na nuvem para uma análise mais intensiva.
  • Classificação de imagens com YOLO11: O modelo YOLO11 pode analisar essas imagens para classify várias condições de cultivo. As classes comuns podem incluir saudável, doente, infestado de pragas ou deficiente em nutrientes, ajudando a identificar problemas específicos que afectam diferentes áreas do campo.
  • Geração de insights: Com base nas classificações, YOLO11 fornece informações sobre indicadores de saúde das culturas, ajudando os agricultores a detect sinais precoces de doenças, identificar pontos críticos de pragas ou detetar deficiências de nutrientes.
  • Tomada de decisão informada: Com essas informações, os agricultores podem tomar decisões direcionadas sobre irrigação, fertilização e controle de pragas, aplicando recursos apenas onde são mais necessários.
__wf_reserved_inherit
Fig. 3. Um exemplo de diferentes classes de folhas, de saudáveis a infetadas.

Classificação de imagens YOLO11 no comércio retalhista

A classificação de imagens pode melhorar significativamente a experiência de compras no varejo, tornando-a mais personalizada e amigável. Os varejistas podem usar modelos de visão computacional treinados sob medida para reconhecer produtos em seu inventário e integrar essa capacidade em seus aplicativos móveis ou sites. Os clientes podem então procurar produtos simplesmente carregando uma foto, tornando as compras mais rápidas e convenientes.

Depois que um cliente carrega uma imagem em um sistema de pesquisa visual, várias coisas acontecem nos bastidores antes que os resultados da pesquisa apareçam. 

Primeiro, a detecção de objetos pode ser usada para identificar os principais itens da imagem, como identificar uma peça de roupa ou um móvel e separá-lo do fundo. Em seguida, a classificação de imagem pode ser usada para categorizar ainda mais cada item, reconhecendo se é uma jaqueta, camisa, sofá ou mesa. 

Com essas informações, o sistema pode exibir produtos semelhantes disponíveis para compra, o que é especialmente útil para encontrar itens exclusivos ou da moda que são difíceis de descrever apenas com palavras. A mesma tecnologia também pode ajudar a agilizar outras tarefas de varejo, como gerenciamento de estoque, reconhecendo e categorizando itens automaticamente.

__wf_reserved_inherit
Fig 4. Uma plataforma de busca visual baseada em classificação de imagens em ação.

Monitorização da vida selvagem com classificação de imagens YOLO11

Tradicionalmente, a monitorização de animais na natureza é uma tarefa fastidiosa que envolve muitas pessoas que selecionam e analisam manualmente milhares de fotografias. Com modos de visão por computador como o YOLO11, os investigadores podem monitorizar automaticamente os animais a um ritmo mais rápido. As câmaras podem ser colocadas em habitats naturais para tirar fotografias. O modelo de IA de visão pode então ser utilizado para analisar essas fotografias e classify os animais nelas contidos (se existirem). Este sistema pode ajudar os investigadores a estudar e track populações de animais, os seus padrões de migração, etc.

Outra forma de os modelos de IA e de visão por computador, como o YOLO11 , poderem ajudar neste domínio é simplificando o processo de classificação das espécies ameaçadas de extinção. Ao identificar potenciais espécies ou categorias de raças a que um animal pode pertencer, estes modelos podem fornecer dados essenciais aos investigadores. Por exemplo, a Universidade da Tasmânia (UTAS) desenvolveu um sistema baseado na classificação de imagens para monitorizar diferentes animais selvagens da Tasmânia. As previsões dos modelos podem ajudar os cientistas e investigadores a manterem-se atentos à atividade e ao comportamento dos animais, o que pode indicar ameaças como a caça furtiva ou a perda de habitat

__wf_reserved_inherit
Fig. 5. YOLO11 prevê as possíveis raças a que um cão pode pertencer.

Experimentar a classificação de imagens com o modelo YOLO11

Agora que já falámos sobre o que é a classificação de imagens e explorámos algumas das suas aplicações. Vamos ver como pode experimentar a classificação de imagens com o novo modelo YOLO11 . Existem duas formas fáceis de começar: utilizando o pacoteUltralytics Python ou através do Ultralytics HUB. Iremos analisar as duas opções.

Execução de inferências com YOLO11

Para começar a usar o pacote Ultralytics Python , basta instalá-lo usando pip, conda ou Docker. Se você tiver algum problema, confira nosso Guia de problemas comuns para obter dicas úteis de solução de problemas.

Assim que o pacote estiver instalado, pode utilizar o seguinte código para carregar uma variante do modelo de classificação de imagens YOLO11 e executar uma inferência numa imagem. Executar uma inferência significa usar um modelo treinado para fazer previsões em dados novos e não vistos. Pode experimentar com uma imagem à sua escolha!

__wf_reserved_inherit
Fig. 6. Execução de inferências utilizando o modelo YOLO11 .

Treinar um modelo de classificação YOLO11 personalizado

Também pode utilizar o mesmo pacote Python para treinar um modelo de classificação YOLO11 personalizado. O treino personalizado permite-lhe afinar um modelo YOLO11 para as suas necessidades específicas. Por exemplo, se estiver a desenvolver uma aplicação para classify diferentes raças de gatos, pode treinar um modelo YOLO11 personalizado apenas para esse fim.

O código abaixo mostra como carregar e treinar um modelo de classificação de imagens YOLO11 . Permite-lhe transferir pesos pré-treinados, utilizando o conhecimento de um modelo existente para aumentar o desempenho do seu próprio modelo. Pode especificar um conjunto de dados, como o conjunto de dados "fashion-mnist", que é um conjunto bem conhecido de imagens em escala de cinzentos de artigos de vestuário (camisas, calças, sapatos, etc.). O treino do modelo neste conjunto de dados ensina-o a reconhecer diferentes categorias de vestuário. Pode trocar "fashion-mnist" por qualquer conjunto de dados que se adeqúe ao seu projeto, como raças de gatos ou tipos de plantas.

__wf_reserved_inherit
Fig. 7. Treino personalizado de um modelo YOLO11 para classificação de imagens.

Experimente YOLO11 no Ultralytics HUB

Embora a utilização do pacote Ultralytics seja simples, requer alguns conhecimentos de Python. Se estiver à procura de uma opção mais amigável para principiantes, pode utilizar o Ultralytics HUB, uma plataforma concebida para tornar a formação e a implementação de diferentes modelos YOLO simples e acessíveis. Para começar, é necessário criar uma conta.

Depois de iniciar sessão, navegue até à secção "Modelos" e selecione o modelo YOLO11 para classificação de imagens. Verá uma gama de tamanhos de modelos disponíveis: nano, pequeno, médio, grande e extra-grande. Depois de escolher um modelo, pode carregar uma imagem na secção 'Pré-visualização', onde as previsões aparecerão no lado esquerdo da página assim que a imagem for processada.

__wf_reserved_inherit
Fig. 8. Utilização do Ultralytics HUB para efetuar uma inferência.

Principais conclusões

YOLO11 oferece poderosas capacidades de classificação de imagens que abrem novas possibilidades em vários sectores. Desde a melhoria da monitorização das colheitas na agricultura e a melhoria das pesquisas de produtos no retalho até ao apoio à conservação da vida selvagem, a velocidade e a precisão do YOLO11tornam-no ideal para diversas aplicações. Com opções de formação personalizada através do pacote Ultralytics Python ou uma configuração fácil e sem código no Ultralytics HUB, os utilizadores podem facilmente incorporar YOLO11 nos seus fluxos de trabalho. À medida que mais indústrias adoptam soluções de IA, YOLO11 oferece uma ferramenta flexível e de elevado desempenho que apoia a inovação e os avanços práticos.

Para explorar mais, visite nosso repositório GitHub e interaja com nossa comunidade. Explore aplicações de IA em carros autônomos e assistência médica em nossas páginas de soluções. 🚀

Vamos construir o futuro
da IA juntos!

Comece sua jornada com o futuro do aprendizado de máquina

Comece gratuitamente