Como usar o Ultralytics YOLO11 para detecção de objetos

29 de novembro de 2024
Explore como o novo modelo Ultralytics YOLO11 pode ser usado para detecção de objetos para alcançar maior precisão em várias aplicações em uma variedade de indústrias.

29 de novembro de 2024
Explore como o novo modelo Ultralytics YOLO11 pode ser usado para detecção de objetos para alcançar maior precisão em várias aplicações em uma variedade de indústrias.
A visão computacional é um campo da inteligência artificial (IA) que ajuda as máquinas a interpretar e entender informações visuais para permitir tarefas essenciais como detecção de objetos. Ao contrário da classificação de imagens, a detecção de objetos não apenas identifica quais objetos estão em uma imagem, mas também localiza seus locais exatos. Isso a torna uma ferramenta crítica para aplicações de visão de IA, como carros autônomos, sistemas de segurança em tempo real e automação de armazéns.
Com o tempo, a tecnologia de detecção de objetos se tornou mais avançada e fácil de usar. Um grande passo à frente foi anunciado no evento híbrido anual da Ultralytics, YOLO Vision 2024 (YV24), com o lançamento do modelo Ultralytics YOLO11. O YOLO11 melhora a precisão e o desempenho, ao mesmo tempo em que oferece suporte às mesmas tarefas do YOLOv8, facilitando a transição perfeita para os usuários de modelos anteriores.
Neste artigo, vamos detalhar o que é detecção de objetos, como ela é diferente de outras tarefas de visão computacional e explorar suas aplicações no mundo real. Também mostraremos como usar o modelo YOLO11 com o pacote Ultralytics Python e a plataforma Ultralytics HUB. Vamos começar!
A detecção de objetos é uma tarefa central em visão computacional que faz mais do que apenas identificar objetos em uma imagem. Ao contrário da classificação de imagens, que determina apenas se um objeto específico está presente, a detecção de objetos reconhece vários objetos e identifica suas localizações exatas usando caixas delimitadoras.
Por exemplo, pode identificar e localizar rostos em uma foto de grupo, carros em uma rua movimentada ou produtos em uma prateleira de loja. A combinação de reconhecimento e localização de objetos o torna especialmente útil para aplicações como vigilância, monitoramento de multidões e gerenciamento automatizado de estoque.
O que diferencia a deteção de objetos de outras tarefas, como a segmentação semântica ou de instâncias, é o seu foco e eficiência.
A segmentação semântica rotula cada pixel em uma imagem, mas não diferencia entre objetos individuais do mesmo tipo (por exemplo, todos os rostos em uma foto seriam agrupados como "rosto"). A segmentação de instâncias vai além, separando cada objeto e delineando sua forma exata, mesmo para objetos da mesma classe.
A detecção de objetos, no entanto, fornece uma abordagem mais simplificada, identificando e classificando objetos enquanto marca suas posições. Isso o torna ideal para tarefas em tempo real, como detectar rostos em filmagens de segurança ou identificar obstáculos para veículos autônomos.
Os recursos avançados de detecção de objetos do YOLO11 o tornam útil em muitos setores. Vamos dar uma olhada em alguns exemplos.
O YOLO11 e a detecção de objetos estão redefinindo a análise de varejo, tornando o gerenciamento de estoque e o monitoramento de prateleiras mais eficientes e precisos. A capacidade do modelo de detectar objetos de forma rápida e confiável ajuda os varejistas a rastrear os níveis de estoque, organizar as prateleiras e reduzir erros nas contagens de estoque.
Por exemplo, o YOLO11 pode detectar itens específicos, como óculos de sol em uma prateleira de loja. Mas por que um varejista monitoraria uma prateleira? Manter as prateleiras abastecidas e organizadas é vital para garantir que os clientes encontrem o que precisam, o que impacta diretamente as vendas. Ao monitorar as prateleiras em tempo real, os varejistas podem identificar rapidamente quando os itens estão acabando, fora do lugar ou superlotados, ajudando-os a manter uma exibição organizada e atraente que melhora a experiência de compra.
Uma cidade movimentada depende de um fluxo de tráfego suave e ruas seguras para funcionar de forma eficiente, e o YOLO11 pode ajudar a tornar isso possível. Na verdade, muitas aplicações de cidades inteligentes podem ser integradas ao YOLO11.
Um caso interessante envolve o uso da detecção de objetos para identificar placas de veículos em movimento. Ao fazer isso, o YOLO11 pode oferecer suporte a uma cobrança de pedágio mais rápida, melhor gerenciamento de tráfego e aplicação de regulamentação mais rápida.
Os insights dos sistemas de Visão de IA que monitorizam as estradas podem alertar as autoridades para infrações de trânsito ou congestionamentos antes que estes se transformem em problemas maiores. O YOLO11 também pode detectar pedestres e ciclistas, tornando as ruas mais seguras e eficientes para todos.
Na verdade, a capacidade do YOLO11 de processar dados visuais o torna uma ferramenta poderosa para melhorar a infraestrutura da cidade. Por exemplo, pode ajudar a otimizar o tempo dos semáforos, analisando o movimento de veículos e pedestres. Também pode aumentar a segurança em zonas escolares, detectando crianças e alertando os motoristas para diminuírem a velocidade. Com o YOLO11, as cidades podem tomar medidas proativas para enfrentar os desafios e criar um ambiente mais eficiente para todos.
A detecção de objetos em tempo real se refere à capacidade de um sistema identificar e classificar objetos em um feed de vídeo ao vivo à medida que eles aparecem. O YOLO11 foi projetado para um desempenho superior em tempo real e se destaca no suporte a essa capacidade. Suas aplicações vão além da simples otimização de processos - também pode ajudar a criar um mundo mais inclusivo e acessível.
Por exemplo, o YOLO11 pode ajudar indivíduos com deficiência visual, identificando objetos em tempo real. Com base nas deteções, podem ser fornecidas descrições de áudio, o que ajuda os utilizadores a navegar no seu ambiente com maior independência.
Considere uma pessoa com deficiência visual a fazer compras de supermercado. Escolher os itens certos pode ser um desafio, mas o YOLO11 pode ajudar. À medida que colocam os itens no carrinho, um sistema integrado com o YOLO11 pode ser usado para identificar cada item - como bananas, abacates ou um pacote de leite - e fornecer descrições áudio em tempo real. Isto permite-lhes confirmar as suas escolhas e garantir que têm tudo o que precisam. Ao reconhecer itens do dia a dia, o YOLO11 pode tornar as compras mais simples.
Agora que abordamos o básico da detecção de objetos e suas diversas aplicações, vamos mergulhar em como você pode começar com o modelo Ultralytics YOLO11 para tarefas como detecção de objetos.
Existem duas maneiras diretas de usar o YOLO11: através do pacote Python Ultralytics ou do Ultralytics HUB. Vamos explorar ambos os métodos, começando com o pacote Python.
A inferência é quando um modelo de IA analisa dados novos e não vistos para fazer previsões, classificar informações ou fornecer insights com base no que aprendeu durante o treinamento. No que diz respeito à detecção de objetos, isso significa identificar e localizar objetos específicos dentro de uma imagem ou vídeo, desenhando caixas delimitadoras à volta deles e rotulando-os com base no treinamento do modelo.
Para inferir usando o modelo de detecção de objetos YOLO11, você primeiro precisará instalar o pacote Python Ultralytics via pip, conda ou Docker. Se você encontrar algum problema de instalação, consulte o guia de solução de problemas para obter dicas e truques para ajudá-lo a resolvê-los. Uma vez instalado, você pode usar o seguinte código para carregar o modelo de detecção de objetos YOLO11 e fazer previsões em uma imagem.
O YOLO11 também oferece suporte ao treinamento personalizado para melhor se adequar aos seus casos de uso específicos. Ao ajustar o modelo, você pode adaptá-lo para detectar objetos relevantes para o seu projeto. Por exemplo, ao usar visão computacional na área da saúde, um modelo YOLO11 treinado de forma personalizada pode ser usado para detectar anomalias específicas em imagens médicas, como tumores em ressonâncias magnéticas ou fraturas em radiografias, ajudando os médicos a fazer diagnósticos mais rápidos e precisos.
O trecho de código abaixo mostra como carregar e treinar um modelo YOLO11 para detecção de objetos. Você pode começar a partir de um arquivo de configuração YAML ou um modelo pré-treinado, transferir pesos e treinar em conjuntos de dados como COCO para capacidades de detecção de objetos mais refinadas.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n.yaml") # build a new model from YAML
model = YOLO("yolo11n.pt") # load a pretrained model (recommended for training)
model = YOLO("yolo11n.yaml").load("yolo11n.pt") # build from YAML and transfer weights
# Train the model
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
Depois de treinar um modelo, você também pode exportá-lo em vários formatos para implantação em diferentes ambientes.
Para aqueles que procuram uma alternativa sem código, o Ultralytics HUB fornece uma plataforma de Visão de IA fácil de usar para treinar e implantar modelos YOLO, incluindo o YOLO11.
Para executar a detecção de objetos em imagens, basta criar uma conta, navegar até à seção ‘Modelos’ e selecionar a variante do modelo de detecção de objetos YOLO11. Carregue a sua imagem e a plataforma exibirá os objetos detectados numa seção de pré-visualização.
Ao combinar a flexibilidade do pacote Python com a facilidade do HUB, o YOLO11 torna simples para desenvolvedores e empresas aproveitarem o poder da tecnologia avançada de deteção de objetos.
O YOLO11 estabelece um novo padrão em detecção de objetos, combinando alta precisão com versatilidade para atender às necessidades de vários setores. Desde o aprimoramento da análise de varejo até o gerenciamento da infraestrutura de cidades inteligentes, o YOLO11 foi desenvolvido para desempenho confiável e em tempo real em inúmeras aplicações.
Com opções de treinamento personalizado e uma interface fácil de usar através do Ultralytics HUB, integrar o YOLO11 em seus fluxos de trabalho nunca foi tão simples. Seja você um desenvolvedor explorando a visão computacional ou uma empresa procurando inovar com IA, o YOLO11 oferece as ferramentas necessárias para ter sucesso.
Para saber mais, confira nosso repositório GitHub e interaja com nossa comunidade. Explore as aplicações de IA em carros autônomos e visão computacional para agricultura em nossas páginas de soluções. 🚀