Yolo Vision Shenzhen
Shenzhen
Junte-se agora

Como utilizar o Ultralytics YOLO11 para a classificação de imagens

Saiba como o novo modelo Ultralytics YOLO11 melhora a classificação de imagens, oferecendo uma melhor precisão para tarefas na agricultura, retalho e monitorização da vida selvagem.

Pretende implementar um projeto de visão computacional?

Explore as opções de licenciamento

Digamos que um robô esteja olhando para dois gatos, um preto e um branco, e precise descobrir qual é qual. Para fazer isso, ele pode usar a classificação de imagens, uma tarefa de visão computacional que ajuda a identificar e categorizar objetos ou cenas em uma imagem. Na verdade, graças aos recentes avanços na inteligência artificial (IA), a classificação de imagens pode ser usada em uma ampla variedade de aplicações, desde o monitoramento de animais até a manufatura e a agricultura com a detecção de doenças em plantações.

Um dos mais recentes avanços na classificação de imagens é o modeloUltralytics YOLO11 . Lançado no evento híbrido anual daUltralytics, YOLO Vision 2024 (YV24), YOLO11 foi concebido para lidar com uma grande variedade de tarefas de IA de visão, incluindo a classificação de imagens, com facilidade e precisão.

Neste artigo, vamos explorar os fundamentos da classificação de imagens, discutir aplicações do mundo real e mostrar-lhe como pode utilizar o YOLO11 para classificação de imagens através do pacoteUltralytics Python . Também veremos como pode experimentar as capacidades doYOLO11 no Ultralytics HUB em alguns passos simples. Vamos começar!

Fig. 1. Um exemplo de utilização do Ultralytics YOLO11 para classify um gato persa.

O que é classificação de imagens?

A classificação de imagens funciona através da atribuição de uma etiqueta ou rótulo a uma imagem com base em padrões aprendidos a partir de imagens previamente rotuladas. Ao analisar cuidadosamente os pixéis de uma imagem, um modelo de visão por computador pode encontrar a melhor correspondência para a imagem. Modelos fiáveis como o YOLO11 podem lidar com este processo sem problemas. A arquitetura do modelo YOLO11torna possível processar imagens ou fotogramas de vídeo quase instantaneamente, tornando-o ideal para aplicações que necessitem de uma classificação de imagem rápida e precisa.

Para realmente entender o escopo da classificação de imagens, ajuda distinguir essa tarefa de outras, como a detecção de objetos. Enquanto a classificação de imagens rotula uma imagem inteira, a detecção de objetos identifica e localiza cada objeto dentro da imagem. 

Fig. 2. Uma comparação de classificação de imagem, detecção de objetos e segmentação de imagem.

Vamos considerar uma imagem de uma girafa. Na classificação de imagens, o modelo pode rotular a imagem inteira simplesmente como uma girafa com base em seu conteúdo geral. No entanto, com a detecção de objetos, o modelo não para na identificação da girafa; ele também coloca uma caixa delimitadora ao redor da girafa, identificando sua localização exata dentro da imagem.

Agora, imagine a girafa perto de uma árvore em uma savana com outros animais. Um modelo de classificação de imagem pode rotular toda a cena como uma savana ou apenas vida selvagem. No entanto, com a detecção de objetos, o modelo identificaria cada elemento individualmente, reconhecendo a girafa, a árvore e os outros animais, cada um com suas próprias caixas delimitadoras.

Aplicações de classificação de imagens YOLO11

A precisão e o desempenho do modelo Ultralytics YOLO11 para classificação de imagens torna-o útil numa vasta gama de indústrias. Vamos explorar algumas das principais aplicações do YOLO11 na classificação de imagens.

Classificação de imagens YOLO11 na agricultura

A classificação de imagens pode ajudar a otimizar muitas funções na agricultura e no sector agrícola. Especificamente, utilizando modelos de classificação de imagens como o YOLO11, os agricultores podem monitorizar constantemente a saúde das suas culturas, detect doenças graves e identificar quaisquer infestações de pragas com elevada precisão. 

Aqui está uma visão de como isso funciona:

  • Captura de imagem: Dispositivos de Internet das Coisas (IoT), como câmeras e drones, podem ser implementados para capturar imagens em tempo real de plantações de vários ângulos e locais nos campos.
  • Processamento: Dependendo dos recursos e da conectividade disponíveis, as imagens podem ser processadas no local por meio de computação de borda ou carregadas na nuvem para uma análise mais intensiva.
  • Classificação de imagens com YOLO11: O modelo YOLO11 pode analisar essas imagens para classify várias condições de cultivo. As classes comuns podem incluir saudável, doente, infestado de pragas ou deficiente em nutrientes, ajudando a identificar problemas específicos que afectam diferentes áreas do campo.
  • Geração de insights: Com base nas classificações, YOLO11 fornece informações sobre indicadores de saúde das culturas, ajudando os agricultores a detect sinais precoces de doenças, identificar pontos críticos de pragas ou detetar deficiências de nutrientes.
  • Tomada de decisão informada: Com essas informações, os agricultores podem tomar decisões direcionadas sobre irrigação, fertilização e controle de pragas, aplicando recursos apenas onde são mais necessários.
Fig. 3. Um exemplo de diferentes classes de folhas, de saudáveis a infetadas.

Classificação de imagens YOLO11 no comércio retalhista

A classificação de imagens pode melhorar significativamente a experiência de compras no varejo, tornando-a mais personalizada e amigável. Os varejistas podem usar modelos de visão computacional treinados sob medida para reconhecer produtos em seu inventário e integrar essa capacidade em seus aplicativos móveis ou sites. Os clientes podem então procurar produtos simplesmente carregando uma foto, tornando as compras mais rápidas e convenientes.

Depois que um cliente carrega uma imagem em um sistema de pesquisa visual, várias coisas acontecem nos bastidores antes que os resultados da pesquisa apareçam. 

Primeiro, a detecção de objetos pode ser usada para identificar os principais itens da imagem, como identificar uma peça de roupa ou um móvel e separá-lo do fundo. Em seguida, a classificação de imagem pode ser usada para categorizar ainda mais cada item, reconhecendo se é uma jaqueta, camisa, sofá ou mesa. 

Com essas informações, o sistema pode exibir produtos semelhantes disponíveis para compra, o que é especialmente útil para encontrar itens exclusivos ou da moda que são difíceis de descrever apenas com palavras. A mesma tecnologia também pode ajudar a agilizar outras tarefas de varejo, como gerenciamento de estoque, reconhecendo e categorizando itens automaticamente.

Fig 4. Uma plataforma de busca visual baseada em classificação de imagens em ação.

Monitorização da vida selvagem com classificação de imagens YOLO11

Tradicionalmente, a monitorização de animais na natureza é uma tarefa fastidiosa que envolve muitas pessoas que selecionam e analisam manualmente milhares de fotografias. Com modos de visão por computador como o YOLO11, os investigadores podem monitorizar automaticamente os animais a um ritmo mais rápido. As câmaras podem ser colocadas em habitats naturais para tirar fotografias. O modelo de IA de visão pode então ser utilizado para analisar essas fotografias e classify os animais nelas contidos (se existirem). Este sistema pode ajudar os investigadores a estudar e track populações de animais, os seus padrões de migração, etc.

Outra forma de os modelos de IA e de visão por computador, como o YOLO11 , poderem ajudar neste domínio é simplificando o processo de classificação das espécies ameaçadas de extinção. Ao identificar potenciais espécies ou categorias de raças a que um animal pode pertencer, estes modelos podem fornecer dados essenciais aos investigadores. Por exemplo, a Universidade da Tasmânia (UTAS) desenvolveu um sistema baseado na classificação de imagens para monitorizar diferentes animais selvagens da Tasmânia. As previsões dos modelos podem ajudar os cientistas e investigadores a manterem-se atentos à atividade e ao comportamento dos animais, o que pode indicar ameaças como a caça furtiva ou a perda de habitat

Fig. 5. YOLO11 prevê as possíveis raças a que um cão pode pertencer.

Experimentar a classificação de imagens com o modelo YOLO11

Agora que já falámos sobre o que é a classificação de imagens e explorámos algumas das suas aplicações. Vamos ver como pode experimentar a classificação de imagens com o novo modelo YOLO11 . Existem duas formas fáceis de começar: utilizando o pacoteUltralytics Python ou através do Ultralytics HUB. Iremos analisar as duas opções.

Execução de inferências com YOLO11

Para começar a usar o pacote Ultralytics Python , basta instalá-lo usando pip, conda ou Docker. Se você tiver algum problema, confira nosso Guia de problemas comuns para obter dicas úteis de solução de problemas.

Assim que o pacote estiver instalado, pode utilizar o seguinte código para carregar uma variante do modelo de classificação de imagens YOLO11 e executar uma inferência numa imagem. Executar uma inferência significa usar um modelo treinado para fazer previsões em dados novos e não vistos. Pode experimentar com uma imagem à sua escolha!

Fig. 6. Execução de inferências utilizando o modelo YOLO11 .

Treinar um modelo de classificação YOLO11 personalizado

Também pode utilizar o mesmo pacote Python para treinar um modelo de classificação YOLO11 personalizado. O treino personalizado permite-lhe afinar um modelo YOLO11 para as suas necessidades específicas. Por exemplo, se estiver a desenvolver uma aplicação para classify diferentes raças de gatos, pode treinar um modelo YOLO11 personalizado apenas para esse fim.

O código abaixo mostra como carregar e treinar um modelo de classificação de imagens YOLO11 . Permite-lhe transferir pesos pré-treinados, utilizando o conhecimento de um modelo existente para aumentar o desempenho do seu próprio modelo. Pode especificar um conjunto de dados, como o conjunto de dados "fashion-mnist", que é um conjunto bem conhecido de imagens em escala de cinzentos de artigos de vestuário (camisas, calças, sapatos, etc.). O treino do modelo neste conjunto de dados ensina-o a reconhecer diferentes categorias de vestuário. Pode trocar "fashion-mnist" por qualquer conjunto de dados que se adeqúe ao seu projeto, como raças de gatos ou tipos de plantas.

Fig. 7. Treino personalizado de um modelo YOLO11 para classificação de imagens.

Experimente YOLO11 no Ultralytics HUB

Embora a utilização do pacote Ultralytics seja simples, requer alguns conhecimentos de Python. Se estiver à procura de uma opção mais amigável para principiantes, pode utilizar o Ultralytics HUB, uma plataforma concebida para tornar a formação e a implementação de diferentes modelos YOLO simples e acessíveis. Para começar, é necessário criar uma conta.

Depois de iniciar sessão, navegue até à secção "Modelos" e selecione o modelo YOLO11 para classificação de imagens. Verá uma gama de tamanhos de modelos disponíveis: nano, pequeno, médio, grande e extra-grande. Depois de escolher um modelo, pode carregar uma imagem na secção 'Pré-visualização', onde as previsões aparecerão no lado esquerdo da página assim que a imagem for processada.

Fig. 8. Utilização do Ultralytics HUB para efetuar uma inferência.

Principais conclusões

YOLO11 oferece poderosas capacidades de classificação de imagens que abrem novas possibilidades em vários sectores. Desde a melhoria da monitorização das colheitas na agricultura e a melhoria das pesquisas de produtos no retalho até ao apoio à conservação da vida selvagem, a velocidade e a precisão do YOLO11tornam-no ideal para diversas aplicações. Com opções de formação personalizada através do pacote Ultralytics Python ou uma configuração fácil e sem código no Ultralytics HUB, os utilizadores podem facilmente incorporar YOLO11 nos seus fluxos de trabalho. À medida que mais indústrias adoptam soluções de IA, YOLO11 oferece uma ferramenta flexível e de elevado desempenho que apoia a inovação e os avanços práticos.

Para explorar mais, visite nosso repositório GitHub e interaja com nossa comunidade. Explore aplicações de IA em carros autônomos e assistência médica em nossas páginas de soluções. 🚀

Vamos construir juntos o futuro da IA!

Comece sua jornada com o futuro do aprendizado de máquina