Ao clicar em “Aceitar todos os cookies”, concorda com o armazenamento de cookies no seu dispositivo para melhorar a navegação no site, analisar a utilização do site e ajudar nos nossos esforços de marketing. Mais informações
Definições de cookies
Ao clicar em “Aceitar todos os cookies”, concorda com o armazenamento de cookies no seu dispositivo para melhorar a navegação no site, analisar a utilização do site e ajudar nos nossos esforços de marketing. Mais informações
Junte-se a nós enquanto exploramos a necessidade de dados de alta qualidade ao construir modelos de visão computacional. Descubra como a qualidade dos dados pode impactar o desempenho do modelo.
Em 2019, a adoção de inteligência artificial (IA) empresarial aumentou 270% em relação aos quatro anos anteriores. Esse crescimento impulsionou a rápida integração de aplicações de visão computacional (CV) - sistemas de IA que permitem que as máquinas interpretem e analisem dados visuais do mundo ao seu redor. Essas aplicações alimentam uma ampla gama de tecnologias, desde a detecção de doenças em imagens médicas e a viabilização de veículos autônomos até a otimização do fluxo de tráfego no transporte e o aprimoramento da vigilância em sistemas de segurança.
A notável precisão e o desempenho incomparável de modelos de visão computacional de ponta, como o Ultralytics YOLO11, impulsionaram amplamente esse crescimento exponencial. No entanto, o desempenho desses modelos depende muito da qualidade e da quantidade dos dados usados para treinar, validar e testar os modelos.
Sem dados de alta qualidade suficientes, os modelos de visão computacional podem ser difíceis de treinar e ajustar efetivamente para atender aos padrões da indústria. Neste artigo, exploraremos o papel vital dos dados na criação de modelos de visão computacional e por que dados de alta qualidade são tão importantes na visão computacional. Também apresentaremos algumas dicas para ajudá-lo a criar conjuntos de dados de alta qualidade enquanto trabalha no treinamento de modelos de visão computacional personalizados. Vamos começar!
O papel dos dados na construção de modelos de visão computacional
Os modelos de visão computacional podem ser treinados em grandes conjuntos de dados de imagens e vídeos para reconhecer padrões e fazer previsões precisas. Por exemplo, um modelo de deteção de objetos pode ser treinado em centenas - ou mesmo milhares - de imagens e vídeos rotulados para identificar objetos com precisão.
A qualidade e a quantidade desses dados de treinamento influenciam o desempenho do modelo.
Como os modelos de visão computacional só podem aprender com os dados a que são expostos, fornecer dados de alta qualidade e exemplos diversos é crucial para o seu sucesso. Sem conjuntos de dados suficientes e diversificados, estes modelos podem não conseguir analisar cenários do mundo real com precisão e podem produzir resultados enviesados ou imprecisos.
É por isso que é importante entender claramente o papel dos dados no treino do modelo. Antes de analisarmos as características dos dados de alta qualidade, vamos entender os tipos de conjuntos de dados que você pode encontrar ao treinar modelos de visão computacional.
Tipos de conjuntos de dados de Visão Computacional
Em visão computacional, os dados usados no processo de treinamento são categorizados em três tipos, cada um servindo a um propósito específico. Aqui está uma visão rápida de cada tipo:
Dados de Treinamento: Este é o conjunto de dados primário usado para treinar o modelo do zero. Consiste em imagens e vídeos com rótulos predefinidos, permitindo que o modelo aprenda padrões e reconheça objetos.
Dados de Validação: Este é um conjunto de dados usado para verificar o desempenho de um modelo durante o treinamento. Ajuda a garantir que o modelo funcione corretamente com dados novos e não vistos.
Dados de Teste: Um conjunto separado de dados usado para avaliar o desempenho final de um modelo treinado. Ele verifica o quão bem o modelo pode fazer previsões em dados completamente novos e não vistos.
Fig 1. Como os dados são categorizados em visão computacional.
As 5 principais características de conjuntos de dados de visão computacional de alta qualidade
Independentemente do tipo de conjunto de dados, dados de alta qualidade são essenciais para construir modelos de visão computacional bem-sucedidos. Aqui estão algumas das principais características que tornam um conjunto de dados de alta qualidade:
Precisão: Idealmente, os dados devem refletir de perto as situações do mundo real e incluir rótulos corretos. Por exemplo, quando se trata de Visão de IA na área da saúde, as imagens de raios-X ou exames devem ser rotuladas com precisão para ajudar o modelo a aprender corretamente.
Diversidade: Um bom conjunto de dados inclui uma variedade de exemplos para ajudar o modelo a ter um bom desempenho em diferentes situações. Por exemplo, se um modelo está aprendendo a detectar carros, o conjunto de dados deve incluir carros de diferentes formas, tamanhos e cores em várias configurações (dia, noite, chuva, etc.).
Consistência: Datasets de alta qualidade seguem um formato uniforme e padrões de qualidade. Por exemplo, as imagens devem ter resoluções semelhantes (não algumas borradas e outras nítidas) e passar pelas mesmas etapas de pré-processamento, como redimensionamento ou ajustes de cor, para que o modelo aprenda com informações consistentes.
Atualidade: Conjuntos de dados que são atualizados regularmente podem acompanhar as mudanças do mundo real. Digamos que você esteja treinando um modelo para detectar todos os tipos de veículos. Se novos, como scooters elétricas, forem introduzidos, eles devem ser adicionados ao conjunto de dados para garantir que o modelo permaneça preciso e atualizado.
Privacidade: Se um conjunto de dados incluir informações confidenciais, como fotos de pessoas, ele deve seguir as regras de privacidade. Técnicas como anonimização (remoção de detalhes identificáveis) e mascaramento de dados (ocultação de partes confidenciais) podem proteger a privacidade, ao mesmo tempo em que tornam possível usar os dados com segurança.
Desafios causados por dados de baixa qualidade
Embora entender as características de dados de alta qualidade seja importante, é igualmente vital considerar como dados de baixa qualidade podem afetar seus modelos de visão computacional.
Problemas como overfitting e underfitting podem impactar severamente o desempenho do modelo. Overfitting acontece quando um modelo tem um bom desempenho em dados de treinamento, mas tem dificuldades com dados novos ou não vistos, geralmente porque o conjunto de dados carece de variedade. Underfitting, por outro lado, ocorre quando o conjunto de dados não fornece exemplos ou qualidade suficientes para o modelo aprender padrões significativos. Para evitar esses problemas, é essencial manter conjuntos de dados diversos, imparciais e de alta qualidade, garantindo um desempenho confiável tanto no treinamento quanto em aplicações do mundo real.
Dados de baixa qualidade também podem dificultar a extração e o aprendizado de padrões significativos a partir de dados brutos pelos modelos, um processo conhecido como extração de recursos. Se o conjunto de dados estiver incompleto, irrelevante ou carecer de diversidade, o modelo pode ter dificuldades para ter um desempenho eficaz.
Às vezes, dados de baixa qualidade podem ser o resultado da simplificação dos dados. Simplificar os dados pode ajudar a economizar espaço de armazenamento e reduzir os custos de processamento, mas a simplificação excessiva pode remover detalhes importantes de que o modelo precisa para funcionar bem. É por isso que é tão importante manter dados de alta qualidade durante todo o processo de visão computacional, desde a coleta até a implantação. Como regra geral, os conjuntos de dados devem incluir recursos essenciais, mantendo-se diversos e precisos para garantir previsões de modelo confiáveis.
Dicas para manter a qualidade do seu conjunto de dados de visão computacional
Agora que entendemos a importância de dados de alta qualidade e o impacto de dados de baixa qualidade, vamos explorar como garantir que seu conjunto de dados atenda a altos padrões.
Tudo começa com uma coleta de dados confiável. Usar diversas fontes, como crowdsourcing, dados de variadas regiões geográficas e geração de dados sintéticos reduz o viés e ajuda os modelos a lidar com cenários do mundo real. Uma vez que os dados são coletados, o pré-processamento é fundamental. Técnicas como normalização, que dimensiona os valores dos pixels para um intervalo consistente, e aumento, que aplica transformações como rotação, inversão e zoom, aprimoram o conjunto de dados. Essas etapas ajudam seu modelo a generalizar melhor e se tornar mais robusto, reduzindo o risco de overfitting.
Dividir os conjuntos de dados corretamente é outro passo fundamental. Uma abordagem comum é alocar 70% dos dados para treinamento, 15% para validação e 15% para teste. Verificar se não há sobreposição entre esses conjuntos evita a fuga de dados e garante uma avaliação precisa do modelo.
Figura 4. Uma divisão de dados comum entre treinamento, validação e teste.
Você também pode usar modelos pré-treinados como o YOLO11 para economizar tempo e recursos computacionais. O YOLO11, treinado em grandes conjuntos de dados e projetado para várias tarefas de visão computacional, pode ser ajustado em seu conjunto de dados específico para atender às suas necessidades. Ao ajustar o modelo aos seus dados, você pode evitar o overfitting e manter um forte desempenho.
O caminho a seguir para conjuntos de dados de visão computacional
A comunidade de IA tradicionalmente se concentrou em melhorar o desempenho construindo modelos mais profundos com mais camadas. No entanto, à medida que a IA continua a evoluir, o foco está mudando da otimização de modelos para a melhoria da qualidade dos conjuntos de dados. Andrew Ng, muitas vezes referido como o “pai da IA”, acredita que "a mudança mais importante que o mundo da IA precisa passar nesta década será uma mudança para a IA centrada em dados."
Esta abordagem enfatiza o refinamento de conjuntos de dados, melhorando a precisão das etiquetas, removendo exemplos ruidosos e garantindo a diversidade. Para visão computacional, estes princípios são cruciais para abordar questões como o viés e dados de baixa qualidade, permitindo que os modelos tenham um desempenho confiável em cenários do mundo real.
Olhando para o futuro, o avanço da visão computacional dependerá da criação de conjuntos de dados menores e de alta qualidade, em vez de coletar grandes quantidades de dados. De acordo com Andrew Ng, "A melhoria dos dados não é uma etapa única de pré-processamento; é uma parte essencial do processo iterativo de desenvolvimento de modelos de aprendizado de máquina." Ao focar em princípios centrados em dados, a visão computacional continuará a se tornar mais acessível, eficiente e impactante em vários setores.
Principais conclusões
Os dados desempenham um papel fundamental ao longo do ciclo de vida de um modelo de visão. Desde a coleta de dados até o pré-processamento, treinamento, validação e teste, a qualidade dos dados impacta diretamente o desempenho e a confiabilidade do modelo. Ao priorizar dados de alta qualidade e rotulagem precisa, podemos construir modelos de visão computacional robustos que fornecem resultados confiáveis e precisos.
À medida que avançamos para um futuro orientado por dados, é essencial abordar considerações éticas para mitigar os riscos relacionados com o viés e os regulamentos de privacidade. Em última análise, garantir a integridade e a justiça dos dados é fundamental para desbloquear todo o potencial das tecnologias de visão computacional.