Como utilizar o Ultralytics YOLO11 para a deteção de objectos

Abirami Vina

3 min ler

29 de novembro de 2024

Explore a forma como o novo modelo Ultralytics YOLO11 pode ser utilizado para a deteção de objectos, de modo a obter uma maior precisão em várias aplicações numa vasta gama de indústrias.

A visão por computador é um domínio da inteligência artificial (IA) que ajuda as máquinas a interpretar e compreender a informação visual para permitir tarefas essenciais como a deteção de objectos. Ao contrário da classificação de imagens, a deteção de objectos não só identifica os objectos que estão numa imagem, como também aponta a sua localização exacta. Isto torna-a uma ferramenta essencial para aplicações de IA de visão, como carros autónomos, sistemas de segurança em tempo real e automatização de armazéns.

Ao longo do tempo, a tecnologia de deteção de objectos tornou-se mais avançada e mais fácil de utilizar. Um grande passo em frente foi anunciado no evento híbrido anual da Ultralytics, o YOLO Vision 2024 (YV24), com o lançamento do modelo Ultralytics YOLO11. O YOLO11 melhora a precisão e o desempenho, ao mesmo tempo que suporta as mesmas tarefas que o YOLOv8, facilitando a transição dos utilizadores de modelos anteriores.

Fig. 1. Um exemplo de utilização do modelo Ultralytics YOLO11 para a deteção de objectos.

Neste artigo, vamos explicar o que é a deteção de objectos, como é diferente de outras tarefas de visão computacional e explorar as suas aplicações no mundo real. Iremos também explicar-lhe como utilizar o modelo YOLO11 com o pacote Ultralytics Python e a plataforma Ultralytics HUB. Vamos começar!

O que é a deteção de objectos?

A deteção de objectos é uma tarefa essencial na visão por computador que faz mais do que apenas identificar objectos numa imagem. Ao contrário da classificação de imagens, que apenas determina se um objeto específico está presente, a deteção de objectos reconhece vários objectos e aponta as suas localizações exactas utilizando caixas delimitadoras. 

Por exemplo, pode identificar e localizar rostos numa fotografia de grupo, carros numa rua movimentada ou produtos numa prateleira de uma loja. A combinação de reconhecimento e localização de objectos torna-o especialmente útil para aplicações como vigilância, monitorização de multidões e gestão automática de inventário.

Fig. 2. Utilização do YOLO11 para detetar rostos.

O que distingue a deteção de objectos de outras tarefas, como a segmentação semântica ou de instâncias, é o seu foco e eficiência. 

A segmentação semântica rotula cada pixel de uma imagem, mas não diferencia entre objectos individuais do mesmo tipo (por exemplo, todos os rostos de uma fotografia seriam agrupados como "rosto"). A segmentação de instâncias vai mais longe, separando cada objeto e delineando a sua forma exacta, mesmo para objectos da mesma classe. 

A deteção de objectos, no entanto, oferece uma abordagem mais simplificada, identificando e classificando objectos enquanto marca as suas posições. Isto torna-a ideal para tarefas em tempo real, como a deteção de rostos em imagens de segurança ou a identificação de obstáculos para veículos autónomos.

Aplicações do YOLO11 e deteção de objectos

As funcionalidades avançadas de deteção de objectos do YOLO11 tornam-no útil em muitas indústrias. Vejamos alguns exemplos.

Utilização do YOLO11 para análise de retalho

O YOLO11 e a deteção de objectos estão a redefinir a análise do retalho, tornando a gestão do inventário e a monitorização das prateleiras mais eficientes e precisas. A capacidade do modelo para detetar objectos de forma rápida e fiável ajuda os retalhistas a controlar os níveis de stock, a organizar as prateleiras e a reduzir os erros nas contagens de inventário.

Por exemplo, o YOLO11 pode detetar artigos específicos, como óculos de sol, numa prateleira de uma loja. Mas por que razão haveria um retalhista de querer monitorizar uma prateleira? Manter as prateleiras abastecidas e organizadas é vital para garantir que os clientes conseguem encontrar o que precisam, o que tem um impacto direto nas vendas. Ao monitorizar as prateleiras em tempo real, os retalhistas podem detetar rapidamente quando os artigos estão a acabar, mal colocados ou sobrelotados, ajudando-os a manter uma exposição organizada e atraente que melhora a experiência de compra.

Fig. 3. Um exemplo de utilização do YOLO11 para detetar produtos nas prateleiras.

YOLO11 em aplicações para cidades inteligentes

Uma cidade movimentada depende de um fluxo de tráfego suave e de ruas seguras para funcionar eficientemente, e o YOLO11 pode ajudar a tornar isso possível. De facto, muitas aplicações de cidades inteligentes podem ser integradas no YOLO11. 

Um caso interessante envolve a utilização da deteção de objectos para identificar matrículas em veículos em movimento. Ao fazê-lo, o YOLO11 pode apoiar uma cobrança mais rápida de portagens, uma melhor gestão do tráfego e uma aplicação mais rápida da regulamentação. 

Fig. 4. Utilização da deteção de objectos e do YOLO11 para detetar matrículas.

As informações dos sistemas Vision AI que monitorizam as estradas podem alertar as autoridades para infracções de trânsito ou congestionamentos antes que estes se transformem em problemas maiores. O YOLO11 também consegue detetar peões e ciclistas, tornando as ruas mais seguras e eficientes para todos. 

De facto, a capacidade do YOLO11 para processar dados visuais torna-o uma ferramenta poderosa para melhorar as infra-estruturas da cidade. Por exemplo, pode ajudar a otimizar a temporização dos semáforos, analisando o movimento dos veículos e dos peões. Também pode aumentar a segurança nas zonas escolares, detectando crianças e alertando os condutores para abrandarem. Com o YOLO11, as cidades podem tomar medidas proactivas para enfrentar os desafios e criar um ambiente mais eficiente para todos.

Deteção de vídeo em tempo real com YOLO11: Aumentar a acessibilidade

A deteção de objectos em tempo real refere-se à capacidade de um sistema para identificar e classificar objectos numa transmissão de vídeo em direto à medida que aparecem. O YOLO11 foi concebido para um desempenho superior em tempo real e é excelente no apoio a esta capacidade. As suas aplicações não se limitam a simplificar os processos - também podem ajudar a criar um mundo mais inclusivo e acessível.

Por exemplo, o YOLO11 pode ajudar pessoas com deficiência visual, identificando objectos em tempo real. Com base nas detecções, podem ser fornecidas descrições áudio, o que ajuda os utilizadores a navegar no seu ambiente com maior independência.

Imagine uma pessoa com deficiência visual a fazer compras. Escolher os artigos certos pode ser um desafio, mas o YOLO11 pode ajudar. À medida que a pessoa coloca os artigos no carrinho, um sistema integrado com o YOLO11 pode ser utilizado para identificar cada artigo - como bananas, abacates ou um pacote de leite - e fornecer descrições áudio em tempo real. Isto permite-lhes confirmar as suas escolhas e garantir que têm tudo o que precisam. Ao reconhecer os artigos do quotidiano, o YOLO11 pode tornar as compras mais simples.

Figura 5. A deteção de objectos pode ajudar a tornar o mundo mais acessível para as pessoas com deficiência visual.

Guia passo-a-passo para a deteção de objectos com o YOLO11 

Agora que já abordámos os conceitos básicos da deteção de objectos e as suas diversas aplicações, vamos ver como pode começar a utilizar o modelo Ultralytics YOLO11 para tarefas como a deteção de objectos.

Existem duas formas simples de utilizar o YOLO11: através do pacote Python do Ultralytics ou do HUB do Ultralytics. Vamos explorar ambos os métodos, começando pelo pacote Python.

Execução de inferências com YOLO11

A inferência é quando um modelo de IA analisa dados novos e não vistos para fazer previsões, classificar informações ou fornecer informações com base no que aprendeu durante o treino. No que diz respeito à deteção de objectos, isto significa identificar e localizar objectos específicos numa imagem ou vídeo, desenhar caixas delimitadoras à sua volta e rotulá-los com base na formação do modelo.

Para inferir usando o modelo de deteção de objetos YOLO11, primeiro é necessário instalar o pacote Ultralytics Python via pip, conda ou Docker. Se você encontrar algum problema de instalação, confira o guia de solução de problemas para obter dicas e truques para ajudá-lo a resolvê-los. Depois de instalado, você pode usar o código a seguir para carregar o modelo de deteção de objetos YOLO11 e fazer previsões em uma imagem.

Fig. 6. Execução de uma inferência numa imagem utilizando o YOLO11n.

Treinar um modelo YOLO11 personalizado

O YOLO11 também suporta formação personalizada para melhor se adaptar aos seus casos de utilização específicos. Ao afinar o modelo, pode adaptá-lo para detetar objectos relevantes para o seu projeto. Por exemplo, ao utilizar a visão por computador nos cuidados de saúde, um modelo YOLO11 treinado de forma personalizada pode ser utilizado para detetar anomalias específicas em imagens médicas, como tumores em exames de ressonância magnética ou fracturas em raios X, ajudando os médicos a fazer diagnósticos mais rápidos e precisos.

O trecho de código abaixo mostra como carregar e treinar um modelo YOLO11 para deteção de objetos. Pode começar a partir de um ficheiro de configuração YAML ou de um modelo pré-treinado, transferir pesos e treinar em conjuntos de dados como o COCO para obter capacidades de deteção de objectos mais refinadas.

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n.yaml")  # build a new model from YAML
model = YOLO("yolo11n.pt")  # load a pretrained model (recommended for training)
model = YOLO("yolo11n.yaml").load("yolo11n.pt")  # build from YAML and transfer weights

# Train the model
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

Depois de treinar um modelo, também é possível exportar o modelo treinado em vários formatos para implantação em diferentes ambientes.

Deteção de objectos YOLO11 no Ultralytics HUB

Para quem procura uma alternativa sem código, o Ultralytics HUB fornece uma plataforma Vision AI fácil de utilizar para treinar e implementar modelos YOLO, incluindo o YOLO11.

Para executar a deteção de objectos em imagens, basta criar uma conta, navegar para a secção "Models" e selecionar a variante do modelo de deteção de objectos YOLO11. Carregue a sua imagem e a plataforma apresentará os objectos detectados numa secção de pré-visualização.

Fig. 7. Execução de inferências no Ultralytics HUB.

Ao combinar a flexibilidade do pacote Python com a facilidade do HUB, o YOLO11 simplifica o aproveitamento do poder da tecnologia avançada de deteção de objectos por parte dos programadores e das empresas.

Principais conclusões

O YOLO11 estabelece um novo padrão na deteção de objectos, combinando elevada precisão com versatilidade para satisfazer as necessidades de várias indústrias. Desde a melhoria da análise de retalho à gestão de infra-estruturas de cidades inteligentes, o YOLO11 foi concebido para um desempenho fiável e em tempo real em inúmeras aplicações.

Com opções de formação personalizada e uma interface fácil de utilizar através do Ultralytics HUB, a integração do YOLO11 nos seus fluxos de trabalho nunca foi tão simples. Quer seja um programador a explorar a visão por computador ou uma empresa que procura inovar com IA, o YOLO11 oferece as ferramentas de que necessita para ter sucesso.

Para saber mais, consulte o nosso repositório GitHub e participe na nossa comunidade. Explore aplicações de IA em carros autónomos e visão computacional para a agricultura nas nossas páginas de soluções. 🚀

Vamos construir juntos o futuro
da IA!

Comece a sua viagem com o futuro da aprendizagem automática

Comece gratuitamente
Ligação copiada para a área de transferência