Segmentação de imagens com o Ultralytics YOLO11 no Google Colab

Abirami Vina

4 min ler

30 de dezembro de 2024

Descubra como utilizar eficazmente o Ultralytics YOLO11 para a segmentação de imagens, tirando partido de um conjunto de dados de peças de automóveis no Google Colab para treino e teste contínuos.

Os modelos Ultralytics YOLO, como o mais recente Ultralytics YOLO11, suportam uma variedade de tarefas de visão computacional, como a deteção de objectos, a classificação de imagens e a segmentação de instâncias. Cada uma destas tarefas tem como objetivo replicar um aspeto específico da visão humana, tornando possível às máquinas ver e interpretar o mundo que as rodeia. 

Por exemplo, considere-se como um aluno numa aula de arte pode pegar num lápis e delinear um objeto num desenho. Nos bastidores, o seu cérebro está a efetuar a segmentação - distinguindo o objeto do fundo e de outros elementos. A segmentação de imagens atinge um objetivo semelhante utilizando a inteligência artificial (IA), dividindo os dados visuais em partes significativas para que as máquinas os compreendam. Esta técnica pode ser utilizada numa variedade de aplicações em muitos sectores. 

__wf_reserved_inherit
Fig. 1. Ultralytics YOLO11 a ser utilizado para segmentar objectos numa imagem.

Um exemplo prático é a segmentação de peças de automóveis. Ao identificar e categorizar componentes específicos de um veículo, a segmentação de imagens pode simplificar processos em indústrias como o fabrico automóvel, a reparação e a catalogação de comércio eletrónico.

Neste artigo, vamos explorar a forma como pode utilizar o Ultralytics YOLO11, o Google Colab e o conjunto de dados Roboflow Carparts Segmentation para criar uma solução capaz de identificar e segmentar com precisão as peças dos automóveis.

O Ultralytics YOLO11 é fácil de utilizar

O Ultralytics YOLO11 está disponível como um modelo pré-treinado treinado no conjunto de dados COCO, abrangendo 80 classes de objectos diferentes. No entanto, para aplicações específicas, como a segmentação de peças de automóveis, o modelo pode ser treinado de forma personalizada para melhor se adequar ao seu conjunto de dados e caso de utilização. Essa flexibilidade permite que o YOLO11 tenha um bom desempenho em tarefas de uso geral e altamente especializadas.

A formação personalizada envolve a utilização do modelo YOLO11 pré-treinado e o seu ajuste fino num novo conjunto de dados. Ao fornecer exemplos rotulados específicos da sua tarefa, o modelo aprende a reconhecer e a segmentar objectos exclusivos do seu projeto. A formação personalizada garante uma maior precisão e relevância em comparação com a utilização de pesos genéricos pré-treinados.

A configuração do YOLO11 para treino personalizado é simples. Com uma configuração mínima, pode carregar o modelo e o conjunto de dados, iniciar o treino e monitorizar métricas como a perda e a precisão durante o processo. O YOLO11 também inclui ferramentas integradas para validação e avaliação, facilitando a avaliação do desempenho do seu modelo. 

Executar o Ultralytics YOLO11 no Google Colab

Quando se faz a formação personalizada do YOLO11, existem algumas opções diferentes para configurar um ambiente. Uma das opções mais acessíveis e convenientes é o Google Colab. Eis algumas vantagens de utilizar o Google Colab para a formação YOLO11:

  • Acesso gratuito a recursos: O Google Colab fornece GPUs (Unidades de Processamento Gráfico) e TPUs (Unidades de Processamento Tensor), permitindo-lhe treinar o YOLO11 sem hardware dispendioso.
  • Ambiente de colaboração: O Google Colab ajuda-o a partilhar blocos de notas, a armazenar trabalho no Google Drive e a simplificar o trabalho em equipa através de uma colaboração fácil e do acompanhamento de versões.
  • Bibliotecas pré-instaladas: Com ferramentas pré-instaladas, como o PyTorch e o TensorFlow, o Google Colab simplifica o processo de configuração e ajuda-o a começar rapidamente.
  • Integração na nuvem: Pode carregar facilmente conjuntos de dados do Google Drive, do GitHub ou de outras fontes na nuvem, simplificando a preparação e o armazenamento de dados.
__wf_reserved_inherit
Fig. 2. O bloco de notas YOLO11 do Google Colab.

A Ultralytics também oferece um notebook Google Colab pré-configurado especificamente para a formação YOLO11. Este bloco de notas inclui tudo o que é necessário, desde a formação do modelo até à avaliação do desempenho, tornando o processo simples e fácil de seguir. É um excelente ponto de partida e permite-lhe concentrar-se no ajuste fino do modelo para as suas necessidades específicas sem se preocupar com passos de configuração complicados.

Uma visão geral do conjunto de dados de segmentação de peças de automóvel Roboflow

Depois de decidir sobre o seu ambiente de treino, o próximo passo é reunir dados ou escolher um conjunto de dados adequado para segmentar peças de automóveis. O Roboflow Carparts Segmentation Dataset, disponível no Roboflow Universe, é mantido pela Roboflow, uma plataforma que fornece ferramentas para construir, treinar e implementar modelos de visão computacional. Este conjunto de dados inclui 3.156 imagens de treino, 401 imagens de validação e 276 imagens de teste, todas com anotações de alta qualidade para peças de automóveis como para-choques, portas, espelhos e rodas.

Normalmente, seria necessário descarregar o conjunto de dados do Roboflow Universe e configurá-lo manualmente para treino no Google Collab. No entanto, o pacote Ultralytics Python simplifica este processo, oferecendo uma integração perfeita e ferramentas pré-configuradas.

__wf_reserved_inherit
Fig. 3. Exemplos do conjunto de dados de segmentação de peças de automóveis.

Com o Ultralytics, o conjunto de dados está pronto para ser utilizado através de um ficheiro YAML pré-configurado que inclui caminhos para o conjunto de dados, rótulos de classe e outros parâmetros de treino. Isto trata da configuração por si, para que possa carregar rapidamente o conjunto de dados e começar diretamente a treinar o seu modelo. Além disso, o conjunto de dados é estruturado com conjuntos dedicados de treinamento, validação e teste, facilitando o monitoramento do progresso e a avaliação do desempenho.

Ao tirar partido do conjunto de dados de segmentação Roboflow Carparts com as ferramentas fornecidas pelo Ultralytics YOLO11, dispõe de um fluxo de trabalho perfeito para criar modelos de segmentação de forma eficiente em plataformas como o Google Colab. Esta abordagem reduz o tempo de configuração e permite-lhe concentrar-se no aperfeiçoamento do seu modelo para aplicações reais.

Aplicações reais da segmentação de peças automóveis

A segmentação de peças automóveis tem uma variedade de utilizações práticas em diferentes sectores. Por exemplo, nas oficinas de reparação, pode ajudar a identificar e categorizar rapidamente os componentes danificados para tornar o processo de reparação mais rápido e eficiente. Do mesmo modo, na indústria dos seguros, os modelos de segmentação podem automatizar as avaliações de sinistros, analisando imagens de veículos danificados para identificar as peças afectadas. Isto acelera o processo de sinistros, reduz os erros e poupa tempo às seguradoras e aos clientes.

__wf_reserved_inherit
Fig. 4. Segmentação de peças de automóveis utilizando YOLO.

No que diz respeito ao fabrico, a segmentação apoia o controlo de qualidade, inspeccionando as peças dos automóveis para detetar defeitos, garantindo a consistência e reduzindo o desperdício. Estas aplicações mostram como a segmentação de peças automóveis pode transformar as indústrias, tornando os processos mais seguros, mais rápidos e mais precisos.

Guia passo-a-passo: utilizar o YOLO11 no Google Colab 

Agora que já abordámos todos os pormenores, está na altura de juntar tudo. Para começar, pode consultar o nosso vídeo no YouTube, que o orienta ao longo de todo o processo de configuração, formação e validação de um modelo YOLO11 para segmentação de peças automóveis.

Segue-se uma breve descrição das etapas envolvidas:

  • Configure o seu ambiente no Google Colab: Active o suporte para GPU e instale o pacote Ultralytics Python para se preparar para a formação de modelos.
  • Carregue o modelo YOLO11: Comece com um modelo de segmentação YOLO11 pré-treinado para economizar tempo e aproveitar os recursos existentes para a segmentação de peças de automóveis.
  • Treine o modelo com o conjunto de dados: Use o arquivo "carparts-seg.yaml" durante o treinamento para baixar, configurar e usar automaticamente o conjunto de dados de segmentação de peças de carro Roboflow. Ajuste parâmetros como épocas, tamanho da imagem e tamanho do lote para ajustar o modelo.
  • Monitorizar o progresso da formação: Acompanhe as principais métricas de desempenho, como a perda de segmentação e a precisão média média (mAP), para garantir que o modelo melhora como esperado.
  • Validar e implementar o modelo: Testar o modelo treinado no conjunto de validação para confirmar a sua precisão e exportá-lo para aplicações reais, como o controlo de qualidade ou o processamento de reclamações de seguros.

Vantagens da utilização do YOLO11 para a segmentação de peças automóveis

O YOLO11 é uma ferramenta fiável e eficiente para a segmentação de peças de automóveis, oferecendo uma série de vantagens que o tornam ideal para várias aplicações do mundo real. Aqui estão os principais benefícios:

  • Velocidade e eficiência: O YOLO11 processa imagens rapidamente, mantendo uma elevada precisão, o que o torna adequado para tarefas em tempo real, como controlo de qualidade e veículos autónomos.
  • Elevada precisão: O modelo é excelente na deteção e segmentação de vários objectos numa única imagem, garantindo uma identificação precisa das peças do automóvel.
  • Escalabilidade: O YOLO11 pode lidar com grandes conjuntos de dados e tarefas de segmentação complexas, tornando-o escalável para aplicações industriais.
  • Múltiplas integrações: O Ultralytics suporta integrações com plataformas como o Google Colab, o Ultralytics Hub e outras ferramentas populares, aumentando a flexibilidade e a acessibilidade para os programadores.

Sugestões para trabalhar com o YOLO11 no Google Collab

Embora o Google Colab torne os fluxos de trabalho de aprendizagem automática muito mais fáceis de manusear, pode demorar algum tempo a habituar-se a ele se for novo. Navegar na configuração baseada na nuvem, nas definições de tempo de execução e nos limites de sessão pode parecer complicado no início, mas existem algumas dicas que podem tornar as coisas muito mais fáceis.

Eis algumas considerações a ter em conta:

  • Comece por ativar a aceleração da GPU nas definições de tempo de execução para acelerar o treino.
  • Uma vez que o Colab é executado na nuvem, certifique-se de que tem uma ligação estável à Internet para aceder a recursos como conjuntos de dados e repositórios.
  • Organize seus arquivos e conjuntos de dados no Google Drive ou no GitHub para facilitar o carregamento e o gerenciamento no Colab.
  • Se você tiver limitações de memória na camada gratuita do Colab, tente reduzir o tamanho da imagem ou o tamanho do lote durante o treinamento.
  • Lembre-se de guardar o seu modelo e os resultados regularmente, pois as sessões do Colab têm limites de tempo e não quer perder o seu progresso. 

Conseguir mais com YOLO11

O Ultralytics YOLO11, combinado com plataformas como o Google Colab e conjuntos de dados como o Roboflow Carparts Segmentation dataset, torna a segmentação de imagens simples e acessível. Com as suas ferramentas intuitivas, modelos pré-treinados e configuração fácil, o YOLO11 permite-lhe mergulhar em tarefas avançadas de visão computacional com facilidade. 

Quer esteja a melhorar a segurança automóvel, a otimizar o fabrico ou a criar aplicações de IA inovadoras, esta combinação fornece as ferramentas para o ajudar a ter sucesso. Com o Ultralytics YOLO11, não está apenas a construir modelos - está a preparar o caminho para soluções mais inteligentes e eficientes no mundo real.

Para saber mais, consulte o nosso repositório GitHub e participe na nossa comunidade. Explore aplicações de IA em carros autónomos e visão computacional para a agricultura nas nossas páginas de soluções. 🚀

Vamos construir juntos o futuro
da IA!

Comece a sua viagem com o futuro da aprendizagem automática

Comece gratuitamente
Ligação copiada para a área de transferência