Como usar o Ultralytics YOLO11 para classificação de imagens
Aprende como o novo modelo Ultralytics YOLO11 melhora a classificação de imagens, oferecendo maior precisão para tarefas na agricultura, retalho e monitorização da vida selvagem.

Digamos que um robô esteja olhando para dois gatos, um preto e outro branco, e precise descobrir qual é qual. Para isso, ele pode usar a classificação de imagens, uma tarefa de visão computacional que ajuda a identificar e categorizar objetos ou cenas em uma imagem. Na verdade, graças aos recentes avanços em inteligência artificial (IA), a classificação de imagens pode ser usada em uma ampla variedade de aplicações, desde o monitoramento de animais até a fabricação e a agricultura, com a detecção de doenças em culturas.
Um dos avanços mais recentes na classificação de imagens é o modelo YOLO11 da Ultralytics. Lançado no evento híbrido anual da Ultralytics, o YOLO Vision 2024 (YV24), o YOLO11 foi projetado para lidar com uma grande variedade de tarefas de visão computacional com IA, incluindo a classificação de imagens, com facilidade e precisão.
Neste artigo, exploraremos os fundamentos da classificação de imagens, discutiremos aplicações no mundo real e mostraremos como você pode usar o YOLO11 para classificação de imagens por meio do pacote Python da Ultralytics. Também veremos como você pode experimentar os recursos do YOLO11 no Ultralytics HUB em poucos passos simples. Vamos começar!

Fig 1. Um exemplo de uso do YOLO11 da Ultralytics para classificar um gato persa.
Link to this sectionO que é classificação de imagens?#
A classificação de imagens funciona atribuindo um rótulo ou tag a uma imagem com base em padrões aprendidos a partir de imagens previamente rotuladas. Ao analisar cuidadosamente os pixels de uma imagem, um modelo de visão computacional consegue encontrar a melhor correspondência para ela. Modelos confiáveis como o YOLO11 podem realizar esse processo sem problemas. A arquitetura do modelo YOLO11 permite processar imagens ou quadros de vídeo quase instantaneamente, tornando-o ideal para aplicações que exigem uma classificação de imagens rápida e precisa.
Para entender verdadeiramente o escopo da classificação de imagens, é útil distingui-la de outras tarefas, como a detecção de objetos. Enquanto a classificação de imagens rotula uma imagem inteira, a detecção de objetos identifica e localiza cada objeto dentro da imagem.

Fig 2. Uma comparação entre classificação de imagens, detecção de objetos e segmentação de imagens.
Vamos considerar a imagem de uma girafa. Na classificação de imagens, o modelo pode rotular a imagem inteira simplesmente como "girafa" com base no seu conteúdo geral. No entanto, com a detecção de objetos, o modelo não para na identificação da girafa; ele também coloca uma caixa delimitadora ao redor da girafa, localizando sua posição exata dentro da imagem.
Agora, imagine a girafa parada perto de uma árvore em uma savana com outros animais. Um modelo de classificação de imagens pode rotular a cena inteira como "savana" ou apenas "vida selvagem". No entanto, com a detecção de objetos, o modelo identificaria cada elemento individualmente, reconhecendo a girafa, a árvore e os outros animais, cada um com suas próprias caixas delimitadoras.
Link to this sectionAplicações de classificação de imagens com YOLO11#
A precisão e o desempenho do modelo YOLO11 da Ultralytics para classificação de imagens tornam-no útil em uma ampla gama de setores. Vamos explorar algumas das principais aplicações do YOLO11 na classificação de imagens.
Link to this sectionClassificação de imagens com YOLO11 na agricultura#
A classificação de imagens pode ajudar a simplificar muitas funções no setor de agricultura e cultivo. Especificamente, usando modelos de classificação de imagens como o YOLO11, os agricultores podem monitorar constantemente a saúde de suas culturas, detectar doenças graves e identificar infestações de pragas com alta precisão.
Veja como isso funciona:
- Captura de imagens: Dispositivos de Internet das Coisas (IoT), como câmeras e drones, podem ser implantados para capturar imagens em tempo real das culturas de vários ângulos e locais nos campos.
- Processamento: Dependendo dos recursos e da conectividade disponíveis, as imagens podem ser processadas no local por meio de edge computing ou enviadas para a nuvem para uma análise mais intensiva.
- Classificação de imagens com YOLO11: O modelo YOLO11 pode analisar essas imagens para classificar várias condições das culturas. As classes comuns podem incluir "saudável", "doente", "infestada por pragas" ou "deficiente em nutrientes", ajudando a identificar problemas específicos que afetam diferentes áreas do campo.
- Geração de insights: Com base nas classificações, o YOLO11 fornece insights sobre os indicadores de saúde das culturas, ajudando os agricultores a detectar sinais precoces de doenças, identificar focos de pragas ou detectar deficiências nutricionais.
- Tomada de decisão informada: Com esses insights, os agricultores podem tomar decisões direcionadas sobre irrigação, fertilização e controle de pragas, aplicando recursos apenas onde são mais necessários.

Fig 3. Um exemplo de diferentes classes de folhas, de saudáveis a infectadas.
Link to this sectionClassificação de imagens com YOLO11 no varejo#
A classificação de imagens pode melhorar significativamente a experiência de compras no varejo, tornando-a mais personalizada e amigável. Varejistas podem usar modelos de visão computacional treinados de forma personalizada para reconhecer produtos em seu inventário e integrar essa capacidade em seus aplicativos móveis ou sites. Os clientes podem então procurar produtos simplesmente fazendo upload de uma foto, tornando as compras mais rápidas e convenientes.
Depois que um cliente faz o upload de uma imagem para um sistema de busca visual, várias coisas acontecem nos bastidores antes que os resultados da busca apareçam.
Primeiro, a detecção de objetos pode ser usada para selecionar os principais itens na imagem, como identificar uma peça de vestuário ou uma peça de mobiliário e separá-la do fundo. Em seguida, a classificação de imagens pode ser usada para categorizar ainda mais cada item, reconhecendo se é uma jaqueta, camisa, sofá ou mesa.
Com essas informações, o sistema pode exibir produtos similares disponíveis para compra, o que é especialmente útil para encontrar itens únicos ou da moda que são difíceis de descrever apenas com palavras. A mesma tecnologia também pode ajudar a agilizar outras tarefas de varejo, como gestão de inventário, reconhecendo e categorizando itens automaticamente.

Fig 4. Uma plataforma de busca visual baseada em classificação de imagens em ação.
Link to this sectionMonitoramento da vida selvagem com classificação de imagens YOLO11#
Tradicionalmente, monitorar animais na natureza é uma tarefa tediosa que envolve muitas pessoas classificando e analisando manualmente milhares de fotos. Com modelos de visão computacional como o YOLO11, pesquisadores podem monitorar automaticamente os animais em um ritmo mais rápido. Câmeras podem ser colocadas em habitats naturais para tirar fotos. O modelo de visão de IA pode então ser usado para analisar essas fotos e classificar os animais nelas contidos (se houver). Esse sistema pode ajudar os pesquisadores a estudar e rastrear populações animais, seus padrões de migração, etc.
Outra maneira pela qual a IA e modelos de visão computacional como o YOLO11 podem ajudar nesse campo é simplificando o processo de classificação de espécies ameaçadas. Ao identificar possíveis espécies ou categorias de raças às quais um animal pode pertencer, esses modelos podem fornecer dados essenciais para os pesquisadores. Por exemplo, a Universidade da Tasmânia (UTAS) desenvolveu um sistema baseado em classificação de imagens para monitorar diferentes espécies da vida selvagem da Tasmânia. As previsões dos modelos podem então ajudar cientistas e pesquisadores a observar a atividade e o comportamento dos animais, o que pode sinalizar ameaças como caça furtiva ou perda de habitat.

Fig 5. YOLO11 prevendo as possíveis raças às quais um cão pode pertencer.
Link to this sectionExperimentando a classificação de imagens com o modelo YOLO11#
Agora que discutimos o que é classificação de imagens e exploramos algumas de suas aplicações, vamos dar uma olhada em como você pode experimentar a classificação de imagens com o novo modelo YOLO11. Existem duas maneiras fáceis de começar: usando o pacote Python da Ultralytics ou por meio do Ultralytics HUB. Vamos percorrer ambas as opções.
Link to this sectionExecutando inferências usando YOLO11#
Para começar com o pacote Python da Ultralytics, basta instalá-lo usando pip, conda ou Docker. Se encontrar algum problema, confira nosso Guia de Problemas Comuns para obter dicas de solução de problemas.
Uma vez instalado o pacote, você pode usar o código a seguir para carregar uma variante do modelo de classificação de imagens YOLO11 e executar uma inferência em uma imagem. Executar uma inferência significa usar um modelo treinado para fazer previsões em dados novos e não vistos. Você pode tentar com uma imagem de sua escolha!

Fig 6. Executando inferências usando o modelo YOLO11.
Link to this sectionTreinando um modelo de classificação YOLO11 personalizado#
Você também pode usar o mesmo pacote Python para treinar um modelo de classificação YOLO11 personalizado. O treinamento personalizado torna possível ajustar um modelo YOLO11 para suas necessidades específicas. Por exemplo, se você estiver desenvolvendo um aplicativo para classificar diferentes raças de gatos, pode treinar um modelo YOLO11 personalizado apenas para esse propósito.
O código abaixo mostra como carregar e treinar um modelo de classificação de imagens YOLO11. Ele permite transferir pesos pré-treinados, usando o conhecimento de um modelo existente para impulsionar o desempenho do seu próprio modelo. Você pode especificar um dataset, como o conjunto "fashion-mnist", que é um conjunto bem conhecido de imagens em tons de cinza de itens de vestuário (camisas, calças, sapatos, etc.). Treinar o modelo nesse dataset ensina-o a reconhecer diferentes categorias de vestuário. Você pode trocar "fashion-mnist" por qualquer dataset que se ajuste ao seu projeto, como raças de gatos ou tipos de plantas.

Fig 7. Treinamento personalizado de um modelo YOLO11 para classificação de imagens.
Link to this sectionExperimente o YOLO11 no Ultralytics HUB#
Embora usar o pacote da Ultralytics seja simples, requer algum conhecimento de Python. Se você está procurando uma opção mais amigável para iniciantes, pode usar o Ultralytics HUB, uma plataforma projetada para tornar o treinamento e a implantação de diferentes modelos YOLO simples e acessíveis. Para começar, você precisará criar uma conta.
Uma vez conectado, navegue até a seção 'Models' e selecione o modelo YOLO11 para classificação de imagens. Você verá uma variedade de tamanhos de modelo disponíveis: nano, small, medium, large e extra-large. Depois de escolher um modelo, você pode fazer o upload de uma imagem na seção 'Preview', onde as previsões aparecerão no lado esquerdo da página assim que a imagem for processada.

Fig 8. Usando o Ultralytics HUB para executar uma inferência.
Link to this sectionPrincipais pontos#
O YOLO11 oferece poderosas capacidades de classificação de imagens que abrem novas possibilidades em vários setores. Desde a melhoria do monitoramento de culturas na agricultura e a melhoria das buscas de produtos no varejo até o suporte à conservação da vida selvagem, a velocidade e a precisão do YOLO11 o tornam ideal para diversas aplicações. Com opções de treinamento personalizado por meio do pacote Python da Ultralytics ou uma configuração fácil e sem código no Ultralytics HUB, os usuários podem incorporar facilmente o YOLO11 em seus fluxos de trabalho. À medida que mais indústrias adotam soluções de IA, o YOLO11 oferece uma ferramenta flexível e de alto desempenho que apoia a inovação e os avanços práticos.
Para explorar mais, visite nosso repositório no GitHub e interaja com nossa comunidade. Explore aplicações de IA em carros autônomos e saúde em nossas páginas de soluções. 🚀






