Yolo Vision Shenzhen
Shenzhen
Junte-se agora

Como utilizar o Ultralytics YOLO11 para a segmentação de instâncias

Abirami Vina

Leitura de 5 minutos

5 de novembro de 2024

Compreenda como o novo modelo Ultralytics YOLO11 pode ser utilizado para a segmentação de instâncias, de modo a obter uma maior precisão em aplicações como a gestão de resíduos e a monitorização de chamas.

A visão por computador, um campo da inteligência artificial (IA) que ajuda as máquinas a interpretar e compreender a informação visual, permite tarefas como a segmentação de instâncias. A segmentação de instâncias pode ser utilizada para analisar uma imagem ou um fotograma de vídeo para marcar os limites exactos de cada objeto distinto na imagem, mesmo quando estão presentes vários objectos do mesmo tipo. Com o seu elevado nível de precisão, a segmentação de instâncias tem uma vasta gama de aplicações, desde ajudar os carros autónomos a detect obstáculos na estrada até à identificação de tumores em exames médicos.

Ao longo dos anos, a segmentação de instâncias evoluiu significativamente. Um desenvolvimento recente foi apresentado durante o evento híbrido anual da Ultralytics, o YOLO Vision 2024 (YV24), sob a forma do Ultralytics YOLO11 do Ultralytics. O novo modelo suporta as mesmas tarefas de visão computacional (incluindo a segmentação de instâncias) que o modelo Ultralytics YOLOv8 pelo que os utilizadores familiarizados com as versões anteriores podem adotar o novo modelo sem problemas.

Fig. 1. Um exemplo de utilização do modelo Ultralytics YOLO11 para a segmentação de instâncias.

Neste artigo, vamos explorar a segmentação de instâncias e como ela difere de outras tarefas de visão computacional, como a segmentação semântica, além de discutir algumas de suas aplicações. Iremos também explicar como pode utilizar o modelo de segmentação de instâncias YOLO11 utilizando o pacoteUltralytics Python e a plataforma Ultralytics HUB. Vamos começar!

O que é segmentação de instâncias?

A segmentação de instâncias pode ser usada para identificar objetos em uma imagem e delineá-los no nível do pixel. O processo normalmente envolve primeiro detectar objetos e desenhar caixas delimitadoras ao redor deles. Em seguida, um algoritmo de segmentação classifica cada pixel dentro da caixa delimitadora para criar uma máscara precisa para cada objeto.

A segmentação de instâncias também é diferente de tarefas como segmentação semântica e segmentação panóptica. A segmentação semântica rotula cada pixel com base na categoria geral de um objeto, sem distinguir instâncias individuais. A segmentação panóptica, por outro lado, combina segmentação de instâncias e semântica, rotulando cada pixel com uma classe e um ID de instância, identificando objetos individuais dentro de cada categoria.

Fig. 2. Utilização do YOLO11 para detect e segment uma pessoa e um cão.

As capacidades da segmentação de instâncias podem ser aplicadas em vários cenários que podem exigir modelos diferentes. Por exemplo, um modelo leve pode ser ideal para processamento em tempo real em aplicações móveis, enquanto um modelo mais complexo pode ser usado para tarefas de alta precisão, como controle de qualidade na manufatura.

Tal como os modelos anteriores, o YOLO11 também tem várias variações, consoante as suas necessidades. Essas variações incluem o YOLO11n-seg (Nano), YOLO11s-seg (Pequeno), YOLO11m-seg (Médio), YOLO11l-seg (Grande) e YOLO11x-seg (Extra Grande). Estes modelos variam em termos de tamanho, velocidade de processamento, precisão e quantidade de potência computacional necessária. Com base nos seus requisitos específicos, pode escolher o modelo que melhor se adapta à sua aplicação.

Aplicações de segmentação de instâncias para YOLO11

As capacidades avançadas de segmentação de instâncias do YOLO11 abrem um leque de aplicações em vários sectores. Vamos analisar mais de perto algumas dessas aplicações.

Utilização da segmentação YOLO11 na indústria do petróleo e do gás

A extração de petróleo e gás envolve o gerenciamento de flutuações de pressão extremamente altas. Técnicas como a queima de gás (gas flaring) ajudam a queimar o gás natural produzido durante a extração de petróleo. Isso é necessário por razões de segurança. Por exemplo, na extração de petróleo bruto, um pico de pressão repentino ou significativo pode levar a uma explosão. Embora incomuns, acidentes industriais no setor de manufatura de petróleo e gás podem resultar em incêndios intensos que são difíceis de conter e controlar. A queima de gás ajuda os operadores a despressurizar equipamentos com segurança e gerenciar grandes flutuações de pressão imprevisíveis, queimando o excesso de gás.

Os sistemas de IA podem melhorar esse processo de monitoramento, e o risco de acidentes pode ser reduzido usando um sistema de monitoramento de queima baseado em segmentação de instâncias. O monitoramento da queima de gás também é importante por razões ambientais, pois o excesso de queima pode impactar negativamente o meio ambiente. 

Os modelosde segmentação de instâncias Ultralytics YOLO11 podem ser utilizados para monitorizar a quantidade de fogo e fumo causados pela queima. A área de píxeis da chama e do fumo detectados e segmentados pode ser calculada. Com esta informação, os operadores podem obter informações em tempo real sobre as chamas e o fumo provocados pela queima de gás, ajudando-os a evitar acidentes e impactos ambientais negativos. 

Fig. 3. Um exemplo de monitorização de flare utilizando YOLO11 na produção de petróleo e gás.

Segmentação de instâncias com YOLO11 para a gestão de resíduos de plástico 

Os trabalhadores das instalações de gestão e reciclagem de resíduos podem utilizar os sistemas baseados na segmentação de instâncias YOLO11 para identificar os resíduos de plástico. YOLO11 pode ser integrado em sistemas robóticos de triagem para identificar com exatidão diferentes materiais de resíduos, como o cartão e o plástico (que devem ser processados separadamente). É especialmente importante tendo em conta que, dos 7 mil milhões de toneladas de resíduos de plástico produzidos a nível mundial, apenas cerca de 10% são reciclados.

A automatização da identificação e seleção de resíduos de plástico reduz significativamente o tempo necessário em comparação com os métodos tradicionais, em que os trabalhadores selecionam os artigos manualmente. Os modelos de visão por computador podem até segment plásticos macios, como embalagens e sacos, que são particularmente difíceis porque muitas vezes ficam emaranhados. Os modelosYOLO11 também podem ser treinados de forma personalizada para segment diferentes tipos de plásticos. Saberemos mais sobre como pode treinar um modelo YOLO11 de forma personalizada nas secções seguintes.

Fig. 4. Identificação de resíduos de plástico utilizando o Ultralytics YOLO11. 

Segmentação YOLO11 em veículos autónomos

Outro caso de utilização interessante da segmentação de instâncias é nos automóveis autónomos. YOLO11 permite que os carros autónomos melhorem a segurança dos passageiros e a segurança dos outros na estrada, reconhecendo com precisão os objectos ao nível do pixel. O sistema de câmara a bordo do automóvel pode captar imagens do ambiente circundante e analisá-las utilizando YOLO11 e a segmentação de instâncias. Cada objeto (peões, semáforos, outros veículos, etc.) dentro da imagem é segmentado e é-lhe atribuída uma etiqueta. Este nível de precisão dá aos automóveis autónomos a capacidade de identificar cada um dos objectos que os rodeiam. 

Fig. 5. Utilização do YOLO11 e da segmentação de instâncias para identificar veículos e peões na estrada.

Experimentar a segmentação de instâncias com o modelo YOLO11

Agora que já explorámos a segmentação de instâncias e discutimos algumas das suas aplicações, vamos ver como pode experimentá-la utilizando o modeloYOLO11 Ultralytics . 

Há duas formas de o fazer: pode utilizar o pacotePython Ultralytics ou o HUB Ultralytics . Iremos explorar ambas, começando pelo pacote Python .

Execução de inferências com YOLO11

A execução de uma inferência envolve o uso do modelo para analisar dados novos e não vistos anteriormente. Para executar uma inferência usando o modelo de segmentação de instância YOLO11 por meio de código, precisamos instalar o pacoteUltralytics Python usando pip, conda ou docker. Caso você enfrente algum problema durante a instalação, consulte nosso Guia de problemas comuns para obter ajuda na solução de problemas. Depois que o pacote estiver instalado, você poderá executar o código mostrado abaixo para carregar o modelo de segmentação de instância YOLO11 e executar previsões em uma imagem.

Fig 6. Executando uma inferência em uma imagem usando YOLO11n-seg.

Treinar um modelo YOLO11 personalizado

Com a mesma configuração de código, também é possível treinar um modelo YOLO11 personalizado. Ao afinar um modelo YOLO11 , pode criar uma versão personalizada do modelo que satisfaça melhor os requisitos específicos do seu projeto. Por exemplo, os retalhistas podem utilizar um modelo personalizado para segment com precisão as caraterísticas físicas de um cliente, de modo a recomendar roupas que lhe sirvam adequadamente. O trecho de código abaixo mostra como carregar e treinar um modelo YOLO11 para segmentação de instância. É possível começar a partir de uma configuração YAML ou de um modelo pré-treinado, transferir pesos e treinar em um conjunto de dados como COCO para obter uma segmentação eficaz. 

Uma vez concluído, você pode realizar inferências usando o modelo personalizado para suas aplicações específicas. Usando a opção de exportação, você também pode exportar seu modelo personalizado para um formato diferente.

Segmentação de instâncias YOLO11 no Ultralytics HUB

Agora que exploramos a execução de inferências e o treinamento personalizado de um modelo de segmentação de instância YOLO11 por meio de código, vamos examinar uma alternativa sem código: Ultralytics HUB. O Ultralytics HUB é uma plataforma intuitiva de IA de visão que simplifica o processo de treinamento e implantação de modelos YOLO , incluindo os modelos de segmentação de instância YOLO11 . 

Para executar a inferência em imagens, basta criar uma conta, ir à secção "Models" (Modelos) e selecionar a variante do modelo de segmentação de instâncias YOLO11 à sua escolha. Pode carregar uma imagem e ver os resultados da previsão na secção de pré-visualização, como se mostra abaixo.

Fig. 7. Execução de inferências no Ultralytics HUB.

Principais conclusões

YOLO11 oferece capacidades fiáveis de segmentação de instâncias que abrem um mundo de possibilidades em várias indústrias. Desde o aumento da segurança em veículos autónomos e a monitorização da queima de gás no sector do petróleo e do gás até à automatização da separação de resíduos em instalações de reciclagem, a precisão ao nível do pixel do YOLO11torna-o ideal para tarefas de segmentação complexas. 

Com opções de formação personalizada através do pacote Ultralytics Python e uma configuração sem código através do Ultralytics HUB, os utilizadores podem integrar facilmente YOLO11 nos seus fluxos de trabalho. Quer seja para aplicações industriais, cuidados de saúde, retalho ou monitorização ambiental, YOLO11 oferece flexibilidade e precisão para satisfazer diversas necessidades de segmentação.

Para explorar mais, visite nosso repositório GitHub e interaja com nossa comunidade. Explore aplicações de IA em carros autônomos e agricultura em nossas páginas de soluções. 🚀

Vamos construir o futuro
da IA juntos!

Comece sua jornada com o futuro do aprendizado de máquina

Comece gratuitamente