Ao clicar em "Aceitar todos os cookies", concorda com o armazenamento de cookies no seu dispositivo para melhorar a navegação no site, analisar a utilização do site e ajudar nos nossos esforços de marketing. Mais informações
Definições de cookies
Ao clicar em "Aceitar todos os cookies", concorda com o armazenamento de cookies no seu dispositivo para melhorar a navegação no site, analisar a utilização do site e ajudar nos nossos esforços de marketing. Mais informações
Descubra como a integração do Roboflow pode simplificar a formação personalizada do Ultralytics YOLO11, tornando os conjuntos de dados de visão computacional de código aberto facilmente acessíveis.
O treino de um modelo de visão computacional como o Ultralytics YOLO11 envolve normalmente a recolha de imagens para o seu conjunto de dados, a sua anotação, a preparação dos dados e o ajuste fino do modelo para satisfazer os seus requisitos específicos. Embora o pacote Python do Ultralytics torne estes passos simples e fáceis de utilizar, o desenvolvimento da IA de visão pode ainda assim ser moroso.
Isto torna-se particularmente verdadeiro quando se está a trabalhar com um prazo apertado ou a desenvolver um protótipo. Nestas situações, dispor de ferramentas ou integrações que simplifiquem partes do processo - como a otimização da preparação do conjunto de dados ou a automatização de tarefas repetitivas - pode fazer uma grande diferença. Ao reduzir o tempo e o esforço necessários, estas soluções ajudam-no a concentrar-se na construção e no aperfeiçoamento do seu modelo. É exatamente isso que a integração do Roboflow oferece.
A integração do Roboflow permite-lhe aceder facilmente a conjuntos de dados do Roboflow Universe, uma grande biblioteca de conjuntos de dados de visão computacional de código aberto. Em vez de passar horas a recolher e organizar dados, pode encontrar e utilizar rapidamente conjuntos de dados existentes para iniciar o seu processo de formação YOLO11. Esta integração torna muito mais rápida e simples a experimentação e a iteração no desenvolvimento do seu modelo de visão computacional.
Neste artigo, vamos ver como pode aproveitar a integração do Roboflow para um desenvolvimento de modelos mais rápido. Vamos começar!
O que é o Roboflow Universe?
O Roboflow Universe é uma plataforma mantida pela Roboflow, uma empresa centrada na simplificação do desenvolvimento da visão computacional. Consiste em mais de 350 milhões de imagens, 500.000 conjuntos de dados e 100.000 modelos aperfeiçoados para tarefas como deteção de objectos, classificação de imagens e segmentação. Com contribuições de programadores e investigadores de todo o mundo, o Roboflow Universe é um centro de colaboração para quem procura iniciar ou melhorar os seus projectos de visão computacional.
Fig. 1. Exemplos de conjuntos de dados de deteção de objectos no Universo Roboflow.
O Roboflow Universe inclui as seguintes caraterísticas principais:
Ferramentas de exploração de conjuntos de dados: Explore, filtre e visualize conjuntos de dados para encontrar rapidamente os recursos que se alinham com os requisitos do seu projeto.
Opções de exportação: Exportar dados em formatos como COCO, YOLO, TFRecord, CSV e muito mais para se adequar ao seu fluxo de trabalho.
Análise de conjuntos de dados: Obtenha informações sobre vários conjuntos de dados com ferramentas de análise que fornecem visualizações de distribuições de rótulos, desequilíbrios de classe e qualidade do conjunto de dados.
Controlo de versões: Veja e aceda a diferentes versões de conjuntos de dados carregados por colaboradores, permitindo-lhe acompanhar actualizações, comparar alterações e escolher a versão que melhor se adequa às necessidades do seu projeto.
A integração do Roboflow ajuda-o a encontrar os dados certos
Encontrar o conjunto de dados correto é frequentemente uma das partes mais difíceis da construção de um modelo de visão por computador. A criação de um conjunto de dados envolve normalmente a recolha de grandes quantidades de imagens, certificando-se de que são relevantes para a sua tarefa e rotulando-as com precisão.
Este processo pode consumir muito tempo e recursos, especialmente se estiver a experimentar diferentes abordagens num curto espaço de tempo. Até mesmo encontrar conjuntos de dados pré-existentes pode ser complicado, uma vez que muitas vezes estão dispersos por várias plataformas, não estão devidamente documentados ou não têm as anotações específicas de que necessita.
Por exemplo, se estiver a criar uma aplicação de visão computacional para detetar ervas daninhas em campos agrícolas, poderá querer testar diferentes abordagens de IA de visão, como a deteção de objectos versus a segmentação de instâncias. Isto permite-lhe experimentar e descobrir qual o método que funciona melhor antes de gastar tempo e esforço na recolha e rotulagem do seu próprio conjunto de dados.
Fig. 2. Deteção de peças de automóveis utilizando o YOLO11.
Utilizando a integração do Roboflow, pode navegar por uma variedade de conjuntos de dados relacionados com a agricultura, incluindo os que se centram na deteção de ervas daninhas, saúde das culturas ou monitorização de campos. Estes conjuntos de dados prontos a utilizar permitem-lhe experimentar diferentes técnicas e aperfeiçoar o seu modelo sem o esforço inicial de criar os seus próprios dados.
Como funciona a integração do Roboflow
Agora que já discutimos a forma como pode utilizar a integração do Roboflow para encontrar os conjuntos de dados certos, vamos ver como se encaixa no seu fluxo de trabalho. Depois de ter escolhido um conjunto de dados do Universo Roboflow, pode exportá-lo ou descarregá-lo no formato YOLO11. Depois de exportar o seu conjunto de dados, pode utilizá-lo para treinar o YOLO11 de forma personalizada utilizando o pacote Ultralytics Python.
Ao descarregar o seu conjunto de dados, poderá reparar que o Roboflow Universe também suporta outros formatos para treinar diferentes modelos. Então, porque é que deve escolher treinar o Ultralytics YOLO11 à medida?
O YOLO11 é a versão mais recente dos modelos YOLO da Ultralytics e foi concebido para proporcionar uma deteção de objectos mais rápida e precisa. Utiliza menos 22% de parâmetros (os valores internos que um modelo ajusta durante o treino para fazer previsões) do que o YOLOv8m, mas atinge uma precisão média superior (mAP) no conjunto de dados COCO. Este equilíbrio entre velocidade e precisão faz do YOLO11 uma escolha versátil para uma vasta gama de aplicações de visão por computador, especialmente quando se trata de modelos de treino personalizados para tarefas específicas.
Alimentação de dados: O modelo YOLO11 processa o seu conjunto de dados, aprendendo a detetar e classificar objectos a partir das imagens e das suas anotações.
Previsão e feedback: O modelo faz previsões sobre objectos nas imagens e compara-as com as respostas corretas fornecidas no conjunto de dados.
Controlo do desempenho: Métricas como a precisão (detecções corretas), a recuperação (detecções perdidas) e a perda (erros de previsão) são monitorizadas para avaliar o progresso.
Aprendizagem iterativa: O modelo ajusta os seus parâmetros em várias rondas (épocas) para melhorar a precisão da deteção e minimizar os erros.
Saída do modelo final: Após o treino, o modelo optimizado é guardado e está pronto para ser implementado.
Outras integrações centradas no desenvolvimento da visão computacional
Ao explorar a integração do Roboflow, irá reparar noutras integrações mencionadas na documentação do Ultralytics. Apoiamos uma variedade de integrações relacionadas com várias fases do desenvolvimento da visão computacional.
O objetivo é fornecer à nossa comunidade uma gama de opções, para que possa escolher o que funciona melhor para o seu fluxo de trabalho específico.
Figura 3. Uma visão geral das integrações suportadas pelo Ultralytics.
Para além dos conjuntos de dados, outras integrações suportadas pela Ultralytics centram-se em várias partes do processo de visão por computador, como a formação, a implementação e a otimização. Aqui estão alguns exemplos de outras integrações que apoiamos:
Integrações de formação: Integrações como Amazon SageMaker e Paperspace Gradient simplificam os fluxos de trabalho de treinamento, oferecendo plataformas baseadas em nuvem para desenvolvimento e teste eficientes de modelos.
Integrações de fluxo de trabalho e controlo de experiências: ClearML, MLFlow e Weights & Biases (W&B) ajudam a automatizar fluxos de trabalho, rastrear experiências e melhorar a colaboração, facilitando a gestão de projectos de aprendizagem automática.
Integrações de otimização e implementação: CoreML, ONNX e OpenVINO permitem uma implementação optimizada em vários dispositivos e estruturas, garantindo um desempenho eficiente em plataformas como o hardware da Apple e CPUs Intel.
Integrações de monitorização e visualização: O TensorBoard e o Weights & Biases fornecem ferramentas para visualizar o progresso do treino e monitorizar o desempenho, fornecendo informações detalhadas para aperfeiçoar os modelos.
Aplicações YOLO11 e o papel das integrações
As integrações que suportam o desenvolvimento da visão computacional, combinadas com as capacidades fiáveis do YOLO11, facilitam a resolução de desafios do mundo real. Considere inovações como a visão computacional na fabricação, onde a IA de visão é usada para detetar defeitos em uma linha de produção - como arranhões em peças de metal ou componentes ausentes. A recolha dos dados certos para essas tarefas pode ser muitas vezes lenta e desafiante, exigindo acesso a ambientes especializados.
Normalmente, envolve a instalação de câmaras ou sensores ao longo das linhas de produção para captar imagens dos produtos. Estas imagens têm de ser captadas em grandes volumes, frequentemente sob iluminação e ângulos consistentes, para garantir clareza e uniformidade.
Uma vez captadas, as imagens têm de ser meticulosamente anotadas com etiquetas precisas para cada tipo de defeito, como riscos, amolgadelas ou componentes em falta. Este processo requer tempo e recursos substanciais, bem como conhecimentos especializados, para garantir que o conjunto de dados reflecte com precisão a variabilidade do mundo real. Factores como diferentes tamanhos, formas e materiais dos defeitos devem ser tidos em conta para criar um conjunto de dados robusto e fiável.
As integrações que fornecem conjuntos de dados prontos a utilizar facilitam tarefas como o controlo da qualidade industrial e, com as capacidades de deteção em tempo real do YOLO11, os fabricantes podem monitorizar as linhas de produção, detetar defeitos instantaneamente e melhorar a eficiência.
Fig. 4. Um exemplo de utilização do Ultralytics YOLO11 para detetar e contar as latas que estão a ser fabricadas.
Para além da indústria transformadora, as integrações relacionadas com os conjuntos de dados podem ser utilizadas em muitas outras indústrias. Ao combinar a velocidade e a precisão do YOLO11 com conjuntos de dados facilmente acessíveis, as empresas podem desenvolver e implementar rapidamente soluções adaptadas às suas necessidades específicas. Tomemos, por exemplo, os cuidados de saúde - as integrações de conjuntos de dados podem ajudar a desenvolver soluções para analisar imagens médicas para detetar anomalias como tumores. Do mesmo modo, na condução autónoma, essas integrações podem ajudar a identificar veículos, peões e sinais de trânsito para aumentar a segurança.
Principais conclusões
Encontrar o conjunto de dados certo é muitas vezes uma das partes mais demoradas da construção de um modelo de visão computacional. No entanto, a integração do Roboflow facilita a procura do melhor conjunto de dados para o treino personalizado dos seus modelos Ultralytics YOLO, mesmo que seja um novato na visão computacional.
Com acesso a uma vasta coleção de conjuntos de dados para tarefas de visão computacional, como deteção de objetos, classificação de imagens ou segmentação de instâncias, o Roboflow Universe elimina o incômodo do processo de descoberta de dados. Ajuda-o a começar rapidamente e a concentrar-se na construção do seu modelo, em vez de perder tempo a recolher e organizar dados. Essa abordagem simplificada permite que os desenvolvedores criem protótipos, iterem e desenvolvam soluções de visão computacional com mais eficiência.