Identificação e segmentação de embalagens com o Ultralytics YOLO11

Abirami Vina

6 min. de leitura

7 de fevereiro de 2025

Saiba como utilizar um conjunto de dados de segmentação de pacotes para treinar o Ultralytics YOLO11 de forma personalizada para identificar e segmentar pacotes para melhorar as operações de logística.

Quando encomendamos algo online e este é enviado para nossa casa, o processo parece simples. Clica-se em alguns botões e a encomenda aparece à porta de casa. No entanto, por detrás dessa entrega sem problemas está uma intrincada rede de armazéns, camiões e sistemas de triagem que trabalham incansavelmente para levar as encomendas para onde têm de ir. Prevê-se que o sector da logística, a espinha dorsal deste sistema, cresça para uns incríveis 13,7 mil milhões de euros até 2027.

No entanto, este crescimento traz consigo a sua quota-parte de desafios, como erros de triagem, entregas atrasadas e ineficiências. À medida que a procura de entregas mais rápidas e precisas aumenta, os métodos tradicionais estão a ficar aquém das expectativas e as empresas estão a voltar-se para a inteligência artificial (IA) e a visão por computador para obter soluções mais inteligentes.

A IA de visão na logística está a remodelar a indústria através da automatização de processos e do aumento da precisão no manuseamento de pacotes. Ao analisar imagens e vídeos em tempo real, a visão computacional pode ajudar a identificar, rastrear e classificar pacotes com alta precisão, reduzindo erros e simplificando as operações. Em particular, os modelos avançados de visão computacional, como o Ultralytics YOLO11, permitem uma identificação de embalagens mais rápida e precisa. 

O treino personalizado do YOLO11 com conjuntos de dados de visão computacional de alta qualidade, como o Roboflow Package Segmentation Dataset, garante um desempenho ótimo em cenários do mundo real. Neste artigo, vamos explorar como este conjunto de dados pode ser usado para treinar o YOLO11 para redefinir as operações logísticas. Também discutiremos as suas aplicações no mundo real. Vamos começar!

Como a visão computacional redefine a eficiência em armazéns inteligentes

Os armazéns processam milhares de pacotes por hora. Erros na triagem ou no rastreamento podem causar atrasos, aumento de custos e frustração dos clientes. A visão por computador pode ser aproveitada para tornar possível que as máquinas interpretem imagens e executem tarefas de forma inteligente. As soluções de IA de visão podem ajudar a otimizar as operações, para que estas decorram sem problemas e com menos erros.

Por exemplo, a visão por computador pode melhorar tarefas como a identificação de embalagens e a deteção de danos, tornando-as mais rápidas e mais fiáveis do que os métodos manuais. Estes sistemas são frequentemente concebidos para funcionar bem em ambientes difíceis, tais como espaços apertados ou pouca iluminação. 

Especificamente, o YOLO11 pode ser utilizado para acelerar o manuseamento de embalagens. Pode detetar rapidamente embalagens em tempo real com precisão. Ao aumentar a eficiência e reduzir os erros, o YOLO11 apoia operações contínuas, ajudando as empresas a cumprir prazos e a proporcionar melhores experiências aos clientes.

__wf_reserved_inherit
Fig. 1. Um exemplo de deteção de caixas com YOLO11.

O YOLO11 é ideal para aplicações logísticas

O YOLO11 suporta várias tarefas de visão por computador, tais como deteção de objectos, segmentação de instâncias e classificação de imagens, tornando-o uma ferramenta versátil para várias indústrias. O YOLO11 combina velocidade e precisão, o que o torna uma excelente ferramenta para o sector da logística. 

Com menos 22% de parâmetros do que o YOLOv8m, consegue uma maior precisão no conjunto de dados COCO, o que lhe permite detetar objectos de forma mais precisa e eficiente. Isto significa que pode identificar pacotes de forma rápida e fiável, mesmo em ambientes de expedição de grande volume e ritmo acelerado.

Além disso, estas vantagens não se limitam apenas às embalagens. Por exemplo, o YOLO11 pode ser utilizado em armazéns para detetar trabalhadores em tempo real, melhorando a segurança e a eficiência. Pode seguir o movimento dos trabalhadores, identificar áreas restritas e alertar os supervisores para potenciais perigos, ajudando a evitar acidentes e a garantir operações sem problemas.

__wf_reserved_inherit
Fig. 2. Um exemplo de utilização do YOLO11 para detetar trabalhadores num armazém.

Otimização do YOLO11 com o conjunto de dados de segmentação de pacotes

Por detrás de cada grande aplicação de IA está normalmente um modelo treinado em conjuntos de dados de elevada qualidade. Esses conjuntos de dados são cruciais para a criação de soluções logísticas de visão por computador. 

Um bom exemplo desse tipo de conjunto de dados é o Roboflow Universe Package Segmentation Dataset, concebido para refletir os desafios logísticos do mundo real. Este conjunto de dados pode ser utilizado para treinar um modelo para detetar e delinear (ou segmentar) embalagens em imagens.

A segmentação de instâncias é uma tarefa de visão por computador que identifica objectos, gera caixas delimitadoras e delineia com precisão a sua forma. Ao contrário da deteção de objectos, que apenas coloca caixas delimitadoras à volta dos objectos, a segmentação de instâncias fornece máscaras detalhadas, ao nível dos pixels, como uma caraterística adicional. 

O conjunto de dados de segmentação de embalagens do universo Roboflow apresenta imagens de embalagens em várias condições, desde iluminação fraca e espaços desorganizados até orientações imprevisíveis. Além disso, a estrutura deste conjunto de dados foi criada para um treino e avaliação eficazes do modelo. Consiste em 1920 imagens anotadas para treino, 89 para teste e 188 para validação. Os modelos de visão por computador treinados com este conjunto de dados de segmentação de instâncias diversificadas podem adaptar-se facilmente às complexidades dos armazéns e centros de distribuição.

__wf_reserved_inherit
Fig. 3. Vista geral do conjunto de dados de segmentação de pacotes Roboflow.

Treinar o YOLO11 com um conjunto de dados de segmentação de pacotes

O treino de modelos Ultralytics YOLO como o Ultralytics YOLO11 envolve um processo simples e direto. Os modelos podem ser treinados utilizando a Interface de Linha de Comando (CLI) ou scripts Python, oferecendo opções de configuração flexíveis e fáceis de utilizar.

Uma vez que o pacote Python do Ultralytics suporta o conjunto de dados de segmentação de pacotes Roboflow, o treino do YOLO11 requer apenas algumas linhas de código e pode ser iniciado em apenas cinco minutos. Para obter mais detalhes, consulte a documentação oficial do Ultralytics.

Quando treina o YOLO11 neste conjunto de dados, nos bastidores, o processo de treino começa por dividir o conjunto de dados de segmentação de embalagens em três partes: treino, validação e teste. O conjunto de treino ensina o modelo a identificar e segmentar embalagens com precisão, enquanto o conjunto de validação ajuda a afinar a sua precisão testando-o em imagens não vistas, garantindo que se adapta bem a cenários do mundo real. 

Finalmente, o conjunto de testes avalia o desempenho geral para confirmar que o modelo está pronto para ser implementado. Uma vez treinado, o modelo adapta-se perfeitamente aos fluxos de trabalho logísticos, automatizando tarefas como a identificação e a triagem de pacotes.

__wf_reserved_inherit
Fig. 4. Fluxo de trabalho de treino personalizado para o YOLO11. Imagem do autor.

Aplicações de visão por computador para uma logística mais inteligente

Agora que já explicámos como treinar o YOLO11 de forma personalizada utilizando o conjunto de dados de segmentação de pacotes. Vamos discutir algumas aplicações do mundo real da visão computacional na logística inteligente.

Monitorização inteligente de armazéns com YOLO11

Os armazéns lidam frequentemente com milhares de pacotes por hora, especialmente durante as épocas de vendas mais movimentadas. Embalagens de todas as formas e tamanhos movem-se rapidamente ao longo de tapetes rolantes, à espera de serem separadas e expedidas. A triagem manual de um volume tão grande de pacotes pode levar a erros, atrasos e desperdício de esforço.

Com o YOLO11, os armazéns podem funcionar de forma muito mais eficiente. O modelo pode analisar um feed em tempo real, utilizando a deteção de objectos para identificar cada pacote. Isto ajuda a localizar os pacotes com precisão, reduzindo os erros e evitando envios extraviados ou atrasados.

__wf_reserved_inherit
Fig. 5. Utilização do YOLO11 para detetar e contar pacotes.

Para além disso, as capacidades de segmentação de instâncias do YOLO11 tornam o manuseamento de pacotes mais eficiente, identificando e separando com precisão os pacotes individuais, mesmo quando estão empilhados ou sobrepostos. Ao melhorar a precisão da triagem e ao permitir um melhor controlo do inventário, o YOLO11 ajuda a automatizar os processos logísticos, a reduzir os erros e a manter as operações a funcionar sem problemas.

Utilização do YOLO11 para deteção de danos

Ninguém quer receber uma encomenda rasgada, amolgada ou danificada. Pode ser frustrante para os clientes e dispendioso para as empresas, levando a reclamações, devoluções e recursos desperdiçados. A entrega consistente de pacotes intactos é uma parte essencial da manutenção da confiança dos clientes.

O YOLO11 pode ajudar a detetar estes problemas numa fase inicial. Nos centros de triagem, o YOLO11 pode ser utilizado para digitalizar embalagens em tempo real, utilizando a segmentação por instância para detetar amolgadelas, rasgões ou fugas. Quando uma embalagem danificada é identificada, pode ser automaticamente assinalada e removida da linha de produção. Um sistema orientado para a IA da Vision pode ajudar a reduzir o desperdício e garantir que os clientes recebem apenas produtos de alta qualidade.

Prós e contras da visão computacional na logística

Agora que explorámos as aplicações do mundo real da utilização da visão computacional na logística inteligente, vamos analisar mais de perto os benefícios que os modelos de visão computacional como o YOLO11 trazem. Desde a manutenção da qualidade da embalagem até o manuseio de tarefas durante o pico de demanda, até mesmo pequenas melhorias podem fazer uma grande diferença.

Eis um breve resumo de algumas das principais vantagens:

  • Redução de custos: Ao melhorar a eficiência, reduzir o desperdício e minimizar as devoluções, o YOLO11 ajuda a reduzir os custos operacionais gerais.
  • Automação de armazém: Optimizado para computação de ponta, o YOLO11 pode ser integrado com robôs de armazém e drones aéreos, automatizando o manuseamento de pacotes em centros de distribuição de grande escala.
  • Benefícios para a sustentabilidade: Ao reduzir os resíduos, otimizar as rotas e minimizar os envios desnecessários, o YOLO11 contribui para operações logísticas mais ecológicas.

Apesar das vantagens, há também certas limitações a ter em conta quando se implementam inovações da visão computacional em fluxos de trabalho logísticos:

  • Necessidade de actualizações contínuas: Os modelos de IA precisam de ser regularmente actualizados e retreinados para se adaptarem a novos desafios, tipos de embalagens ou layouts de armazém em mudança.
  • Integração com sistemas legados: Muitas empresas de logística dependem de infraestruturas mais antigas, o que torna a integração perfeita com as modernas tecnologias de IA um desafio.
  • Preocupações com a privacidade e a segurança: A utilização de sistemas de visão baseados em IA pode suscitar preocupações relativamente à privacidade dos trabalhadores e à segurança dos dados, exigindo considerações políticas cuidadosas.

Principais conclusões sobre armazéns inteligentes

Quando o Ultralytics YOLO11 é treinado de forma personalizada em conjuntos de dados como o Roboflow Package Segmentation Dataset, ele pode aprimorar a automação logística adaptando-se a várias condições de armazém e escalonando de forma eficiente durante períodos de pico. À medida que as operações logísticas se tornam mais complexas, o YOLO11 pode ajudar a garantir a exatidão, minimizar os erros e manter as entregas a decorrer sem problemas.

A IA de visão na logística está a transformar a indústria, permitindo fluxos de trabalho mais inteligentes, mais rápidos e mais fiáveis. Ao integrar a visão computacional nas suas operações, as empresas podem aumentar a eficiência, reduzir custos e melhorar a satisfação do cliente.

Junte-se à nossa comunidade e consulte o nosso repositório GitHub para ver a IA em ação. Explore as nossas opções de licenciamento YOLO e descubra mais sobre visão computacional na agricultura e IA nos cuidados de saúde nas nossas páginas de soluções.

Vamos construir juntos o futuro
da IA!

Comece a sua viagem com o futuro da aprendizagem automática

Comece gratuitamente
Ligação copiada para a área de transferência