Sintonize na YOLO Vision 2025!
25 de setembro de 2025
10:00 — 18:00 BST
Evento híbrido
Yolo Vision 2024

Treinamento personalizado do Ultralytics YOLO11 com conjuntos de dados de visão computacional

Abirami Vina

4 min de leitura

7 de janeiro de 2025

Descubra como a integração com Roboflow pode simplificar o treinamento personalizado do Ultralytics YOLO11, tornando os conjuntos de dados de visão computacional de código aberto facilmente acessíveis.

Treinar um modelo de visão computacional como o Ultralytics YOLO11 normalmente envolve coletar imagens para seu conjunto de dados, anotá-las, preparar os dados e ajustar o modelo para atender aos seus requisitos específicos. Embora o pacote Ultralytics Python torne essas etapas diretas e fáceis de usar, o desenvolvimento de Visão de IA ainda pode ser demorado.

Isso se torna particularmente verdadeiro quando você está trabalhando com um prazo apertado ou desenvolvendo um protótipo. Nessas situações, ter ferramentas ou integrações que simplifiquem partes do processo - como agilizar a preparação do conjunto de dados ou automatizar tarefas repetitivas - pode fazer uma grande diferença. Ao reduzir o tempo e o esforço necessários, essas soluções ajudam você a se concentrar na construção e no refinamento do seu modelo. É exatamente isso que a integração com Roboflow oferece.

A integração com Roboflow permite que você acesse facilmente conjuntos de dados do Roboflow Universe, uma grande biblioteca de conjuntos de dados de visão computacional de código aberto. Em vez de gastar horas coletando e organizando dados, você pode encontrar e usar rapidamente conjuntos de dados existentes para dar um pontapé inicial no seu processo de treinamento YOLO11. Essa integração torna muito mais rápido e simples experimentar e iterar no desenvolvimento do seu modelo de visão computacional.

Neste artigo, vamos mergulhar em como você pode aproveitar a integração com Roboflow para um desenvolvimento de modelo mais rápido. Vamos começar!

O que é Roboflow Universe?

Roboflow Universe é uma plataforma mantida pela Roboflow, uma empresa focada em simplificar o desenvolvimento de visão computacional. Consiste em mais de 350 milhões de imagens, 500.000 conjuntos de dados e 100.000 modelos ajustados para tarefas como detecção de objetos, classificação de imagens e segmentação. Com contribuições de desenvolvedores e pesquisadores em todo o mundo, o Roboflow Universe é um centro colaborativo para quem busca iniciar ou aprimorar seus projetos de visão computacional.

Fig 1. Exemplos de conjuntos de dados de detecção de objetos no Roboflow Universe.

O Roboflow Universe inclui os seguintes recursos principais:

  • Ferramentas de exploração de conjuntos de dados: Explore, filtre e visualize conjuntos de dados para encontrar rapidamente os recursos que se alinham aos requisitos do seu projeto.
  • Opções de exportação: Exporte dados em formatos como COCO, YOLO, TFRecord, CSV e muito mais para se adequar ao seu fluxo de trabalho.
  • Análise de conjuntos de dados: Obtenha insights sobre vários conjuntos de dados com ferramentas de análise que fornecem visualizações de distribuições de rótulos, desequilíbrios de classes e qualidade do conjunto de dados.
  • Rastreamento de versão: Visualize e acesse diferentes versões de conjuntos de dados enviados por colaboradores, permitindo que você rastreie atualizações, compare alterações e escolha a versão que melhor se adapta às necessidades do seu projeto. 

A integração com Roboflow ajuda você a encontrar os dados certos

Encontrar o dataset certo é, muitas vezes, um dos maiores desafios na construção de um modelo de visão computacional. Criar um dataset geralmente envolve coletar grandes quantidades de imagens, garantir que sejam relevantes para sua tarefa e, em seguida, rotulá-las com precisão. 

Este processo pode consumir muito tempo e recursos, especialmente se você estiver experimentando diferentes abordagens em um curto período. Mesmo encontrar datasets pré-existentes pode ser complicado, pois geralmente estão espalhados por diversas plataformas, não estão documentados adequadamente ou carecem das anotações específicas de que você precisa.

Por exemplo, se você estiver criando um aplicativo de visão computacional para detectar ervas daninhas em campos agrícolas, pode querer testar diferentes abordagens de Visão de IA, como detecção de objetos versus segmentação de instâncias. Isso permite que você experimente e descubra qual método funciona melhor antes de gastar tempo e esforço coletando e rotulando seu próprio dataset.

Fig 2. Detecção de peças de automóveis usando YOLO11.

Usando a integração com o Roboflow, você pode navegar por uma variedade de datasets relacionados à agricultura, incluindo aqueles focados na detecção de ervas daninhas, saúde das plantações ou monitoramento de campos. Esses datasets prontos para uso permitem que você experimente diferentes técnicas e refine seu modelo sem o esforço inicial de criar seus próprios dados. 

Como funciona a integração com o Roboflow

Agora que discutimos como você pode usar a integração com o Roboflow para encontrar os datasets certos, vamos ver como ela se encaixa no seu fluxo de trabalho. Depois de escolher um dataset do Roboflow Universe, você pode exportá-lo ou baixá-lo no formato YOLO11. Após a exportação do seu dataset, você pode usá-lo para treinar o YOLO11 de forma personalizada usando o pacote Ultralytics Python. 

Ao baixar seu dataset, você pode notar que o Roboflow Universe também oferece suporte a outros formatos para treinar diferentes modelos. Então, por que você deveria escolher treinar o Ultralytics YOLO11 de forma personalizada? 

YOLO11 é a versão mais recente dos modelos Ultralytics YOLO e foi construído para fornecer detecção de objetos mais rápida e precisa. Ele usa 22% menos parâmetros (os valores internos que um modelo ajusta durante o treinamento para fazer previsões) do que o YOLOv8m, mas atinge uma precisão média (mAP) mais alta no dataset COCO. Esse equilíbrio entre velocidade e precisão torna o YOLO11 uma escolha versátil para uma ampla gama de aplicações de visão computacional, especialmente ao personalizar modelos de treinamento para atender a tarefas específicas.

Aqui está uma visão mais detalhada de como o treinamento personalizado do YOLO11 funciona:

  • Alimentação de dados: O modelo YOLO11 processa seu dataset, aprendendo a detectar e classificar objetos a partir das imagens e suas anotações.
  • Previsão e feedback: O modelo faz previsões sobre objetos nas imagens e as compara com as respostas corretas fornecidas no dataset.
  • Rastreamento de desempenho: Métricas como precisão (detecções corretas), recall (detecções perdidas) e perda (erros de previsão) são monitoradas para avaliar o progresso.
  • Aprendizado iterativo: O modelo ajusta seus parâmetros ao longo de várias rodadas (épocas) para melhorar a precisão da detecção e minimizar erros.
  • Saída do modelo final: Após o treinamento, o modelo otimizado é salvo e está pronto para implantação.

Outras integrações focadas no desenvolvimento de visão computacional

Ao explorar a integração com o Roboflow, você notará outras integrações mencionadas na documentação do Ultralytics. Oferecemos suporte a uma variedade de integrações relacionadas a vários estágios do desenvolvimento de visão computacional. 

Isso é para fornecer à nossa comunidade uma variedade de opções, para que você possa escolher o que funciona melhor para seu fluxo de trabalho específico.

Fig 3. Uma visão geral das integrações suportadas pelo Ultralytics.

Além de datasets, outras integrações suportadas pelo Ultralytics se concentram em várias partes do processo de visão computacional, como treinamento, implantação e otimização. Aqui estão alguns exemplos de outras integrações que oferecemos suporte:

  • Integrações de treinamento: Integrações como Amazon SageMaker e Paperspace Gradient otimizam os fluxos de trabalho de treinamento, oferecendo plataformas baseadas em nuvem para desenvolvimento e teste de modelos eficientes.
  • Integrações de rastreamento de fluxo de trabalho e experimentos: ClearML, MLFlow e Weights & Biases (W&B) ajudam a automatizar fluxos de trabalho, rastrear experimentos e melhorar a colaboração, facilitando o gerenciamento de projetos de aprendizado de máquina.
  • Integrações de otimização e implantação: CoreML, ONNX e OpenVINO permitem a implantação otimizada em vários dispositivos e frameworks, garantindo um desempenho eficiente em plataformas como hardware Apple e CPUs Intel.
  • Integrações de monitoramento e visualização: TensorBoard e Weights & Biases fornecem ferramentas para visualizar o progresso do treinamento e monitorar o desempenho, fornecendo insights detalhados para refinar modelos.

Aplicações YOLO11 e o papel das integrações

As integrações que suportam o desenvolvimento de visão computacional, combinadas com os recursos confiáveis do YOLO11, facilitam a resolução de desafios do mundo real. Considere inovações como a visão computacional na indústria, onde a visão de IA é usada para detectar defeitos em uma linha de produção, como arranhões em peças de metal ou componentes ausentes. Coletar os dados certos para essas tarefas pode ser lento e desafiador, exigindo acesso a ambientes especializados. 

Normalmente, envolve a instalação de câmeras ou sensores ao longo das linhas de produção para capturar imagens dos produtos. Essas imagens precisam ser capturadas em grandes volumes, geralmente sob iluminação e ângulos consistentes, para garantir clareza e uniformidade. 

Uma vez capturadas, as imagens devem ser meticulosamente anotadas com rótulos precisos para cada tipo de defeito, como arranhões, amassados ou componentes ausentes. Este processo requer tempo e recursos substanciais, bem como experiência, para garantir que o conjunto de dados reflita com precisão a variabilidade do mundo real. Fatores como diferentes tamanhos, formas e materiais de defeitos devem ser considerados para criar um conjunto de dados robusto e confiável.

As integrações que fornecem conjuntos de dados prontos facilitam tarefas como o controle de qualidade industrial e, com as habilidades de detecção em tempo real do YOLO11, os fabricantes podem monitorar as linhas de produção, detectar defeitos instantaneamente e melhorar a eficiência.

Fig 4. Um exemplo de uso do Ultralytics YOLO11 para detectar e contar latas sendo fabricadas.

Além da fabricação, as integrações relacionadas a conjuntos de dados podem ser usadas em muitos outros setores. Ao combinar a velocidade e a precisão do YOLO11 com conjuntos de dados de fácil acesso, as empresas podem desenvolver e implementar rapidamente soluções adaptadas às suas necessidades específicas. Veja, por exemplo, a área da saúde: as integrações de conjuntos de dados podem ajudar a desenvolver soluções para analisar imagens médicas para detectar anormalidades como tumores. Da mesma forma, na direção autônoma, essas integrações podem ajudar a identificar veículos, pedestres e sinais de trânsito para aumentar a segurança.

Principais conclusões

Encontrar o conjunto de dados certo é geralmente uma das partes mais demoradas da construção de um modelo de visão computacional. No entanto, a integração do Roboflow facilita a localização do melhor conjunto de dados para o treinamento personalizado de seus modelos Ultralytics YOLO, mesmo que você seja novo em visão computacional. 

Com acesso a uma vasta coleção de conjuntos de dados para tarefas de visão computacional, como detecção de objetos, classificação de imagens ou segmentação de instâncias, o Roboflow Universe elimina o incômodo do processo de descoberta de dados. Ele ajuda você a começar rapidamente e se concentrar na construção de seu modelo, em vez de gastar tempo coletando e organizando dados. Essa abordagem simplificada permite que os desenvolvedores criem protótipos, iterem e desenvolvam soluções de visão computacional com mais eficiência.

Para saber mais, visite nosso repositório GitHub e interaja com nossa comunidade. Explore inovações em áreas como IA em carros autônomos e visão computacional na agricultura em nossas páginas de soluções. 🚀

Vamos construir o futuro
da IA juntos!

Comece sua jornada com o futuro do aprendizado de máquina

Comece gratuitamente
Link copiado para a área de transferência