Conheça o YOLO26: IA de visão de próxima geração.
Ultralytics
Voltar para o Glossário da Ultralytics

Data Cleaning

Domina a limpeza de dados para melhorar a precisão do modelo de IA. Aprende técnicas para remover erros, tratar valores em falta e preparar conjuntos de dados limpos para o Ultralytics YOLO26.

A limpeza de dados é o processo crítico de detectar e corrigir (ou remover) registros corrompidos, imprecisos ou irrelevantes de um conjunto de registros, tabela ou banco de dados. No campo da inteligência artificial (IA) e do aprendizado de máquina (ML), esta etapa é frequentemente considerada a parte mais demorada, porém essencial, do fluxo de trabalho. Antes que um modelo como o YOLO26 possa aprender efetivamente a reconhecer objetos, os dados de treinamento devem ser limpos de erros para evitar o fenômeno "Garbage In, Garbage Out" (lixo entra, lixo sai), onde dados de entrada de baixa qualidade levam a resultados não confiáveis.

Link to this sectionA importância da integridade dos dados na IA#

Modelos de visão computacional de alto desempenho dependem fortemente da qualidade dos conjuntos de dados que consomem. Se um conjunto de dados contiver imagens rotuladas incorretamente, duplicatas ou arquivos corrompidos, o modelo terá dificuldade em generalizar padrões, levando ao sobreajuste ou a uma baixa precisão de inferência. Uma limpeza de dados eficaz melhora a confiabilidade dos modelos preditivos e garante que o algoritmo aprenda a partir de sinais válidos em vez de ruído.

Link to this sectionTécnicas comuns de limpeza de dados#

Profissionais empregam várias estratégias para refinar seus conjuntos de dados usando ferramentas como o Pandas para dados tabulares ou ferramentas de visão especializadas.

  • Tratamento de valores ausentes: Isso envolve remover registros com dados ausentes ou usar técnicas de imputação para preencher lacunas com base em médias estatísticas ou vizinhos mais próximos.
  • Remoção de duplicatas: Imagens duplicadas em um conjunto de treinamento podem inadvertidamente enviesar o modelo. Removê-las garante que o modelo não memorize exemplos específicos, ajudando a mitigar o viés do conjunto de dados.
  • Detecção de outliers: Identificar e lidar com anomalias ou outliers que se desviam significativamente da norma é crucial, pois estes podem distorcer a análise estatística e os pesos do modelo.
  • Reparo estrutural: Isso inclui corrigir erros de digitação em rótulos de classe (por exemplo, corrigir "Car" vs. "car") para garantir a consistência de classe.

Link to this sectionAplicações no Mundo Real#

A limpeza de dados é fundamental em diversos setores onde a IA é implementada.

  • Análise de imagens médicas: Em aplicações de IA na saúde, os conjuntos de dados frequentemente contêm exames com artefatos, metadados de pacientes incorretos ou ruído de fundo irrelevante. Limpar esses dados garante que os modelos de análise de imagens médicas foquem apenas nos marcadores biológicos relevantes para o diagnóstico.
  • Gerenciamento de inventário no varejo: Para IA no varejo, os conjuntos de dados de produtos podem conter itens obsoletos ou imagens com proporções incorretas. Limpar esses conjuntos de dados garante que os modelos de detecção de objetos possam identificar com precisão os níveis de estoque e reduzir falsos positivos em um ambiente real.

Link to this sectionDistinguindo a limpeza de dados do pré-processamento#

Embora frequentemente usados como sinônimos, a limpeza de dados é distinta do pré-processamento de dados. A limpeza de dados foca em corrigir erros e remover dados "ruins". Em contraste, o pré-processamento envolve transformar dados limpos em um formato adequado para o modelo, como redimensionamento de imagem, normalização ou aplicação de aumento de dados para aumentar a variedade.

Link to this sectionAutomatizando verificações de qualidade#

Fluxos de trabalho modernos, como os disponíveis na Plataforma Ultralytics, integram verificações automatizadas para identificar imagens corrompidas ou inconsistências de rótulos antes que o treinamento comece. Abaixo está um exemplo simples em Python demonstrando como verificar e identificar arquivos de imagem corrompidos usando a biblioteca padrão Pillow, um passo comum antes de fornecer dados a um modelo como o YOLO26.

from pathlib import Path

from PIL import Image


def verify_images(dataset_path):
    """Iterates through a directory to identify corrupt images."""
    for img_path in Path(dataset_path).glob("*.jpg"):
        try:
            with Image.open(img_path) as img:
                img.verify()  # Checks file integrity
        except (OSError, SyntaxError):
            print(f"Corrupt file found: {img_path}")


# Run verification on your dataset
verify_images("./coco8/images/train")

Explore solutions

Real-time AI that works with your team

IA em robótica

Potencialize máquinas mais inteligentes com modelos Ultralytics YOLO. A IA de visão em robótica impulsiona a navegação autônoma, percepção, rastreamento de objetos e controle em tempo real.

Sabe mais
Real-time AI that works with your team

IA na Logística

Otimize a logística com modelos Ultralytics YOLO. A IA de visão permite a inspeção de pacotes, triagem, rastreamento de veículos e monitoramento de segurança em armazéns em tempo real.

Sabe mais
Real-time AI that works with your team

IA no varejo

Reinvente o varejo com modelos Ultralytics YOLO. A IA de visão impulsiona o rastreamento de inventário, monitoramento de prateleiras, gerenciamento de filas e percepções mais inteligentes sobre o cliente.

Sabe mais
Real-time AI that works with your team

IA na Saúde

Constrói soluções de saúde com modelos Ultralytics YOLO. A visão AI na saúde impulsiona imagens médicas mais rápidas, diagnósticos mais inteligentes e monitorização do paciente.

Sabe mais
Real-time AI that works with your team

IA na Fabricação

Otimize a fabricação com modelos Ultralytics YOLO. A IA de visão impulsiona o controle de qualidade, detecção de defeitos, conformidade com EPI e automação de linhas de montagem.

Sabe mais
Real-time AI that works with your operation

IA no Setor Automóvel

Aplica visão computacional no setor automóvel com modelos Ultralytics YOLO. A visão AI eleva a segurança rodoviária, a assistência ao condutor e a automação de veículos para estradas mais inteligentes.

Sabe mais
Real-time AI tailored to your operation

IA na Agricultura

Leva a visão AI para a agricultura inteligente com os modelos Ultralytics YOLO. Potencia a monitorização de culturas, o seguimento de gado e a agricultura de precisão para colheitas maiores e mais inteligentes.

Sabe mais
Real-time AI that works with your team

IA em robótica

Potencialize máquinas mais inteligentes com modelos Ultralytics YOLO. A IA de visão em robótica impulsiona a navegação autônoma, percepção, rastreamento de objetos e controle em tempo real.

Sabe mais
Real-time AI that works with your team

IA na Logística

Otimize a logística com modelos Ultralytics YOLO. A IA de visão permite a inspeção de pacotes, triagem, rastreamento de veículos e monitoramento de segurança em armazéns em tempo real.

Sabe mais
Real-time AI that works with your team

IA no varejo

Reinvente o varejo com modelos Ultralytics YOLO. A IA de visão impulsiona o rastreamento de inventário, monitoramento de prateleiras, gerenciamento de filas e percepções mais inteligentes sobre o cliente.

Sabe mais
Real-time AI that works with your team

IA na Saúde

Constrói soluções de saúde com modelos Ultralytics YOLO. A visão AI na saúde impulsiona imagens médicas mais rápidas, diagnósticos mais inteligentes e monitorização do paciente.

Sabe mais
Real-time AI that works with your team

IA na Fabricação

Otimize a fabricação com modelos Ultralytics YOLO. A IA de visão impulsiona o controle de qualidade, detecção de defeitos, conformidade com EPI e automação de linhas de montagem.

Sabe mais
Real-time AI that works with your operation

IA no Setor Automóvel

Aplica visão computacional no setor automóvel com modelos Ultralytics YOLO. A visão AI eleva a segurança rodoviária, a assistência ao condutor e a automação de veículos para estradas mais inteligentes.

Sabe mais
Real-time AI tailored to your operation

IA na Agricultura

Leva a visão AI para a agricultura inteligente com os modelos Ultralytics YOLO. Potencia a monitorização de culturas, o seguimento de gado e a agricultura de precisão para colheitas maiores e mais inteligentes.

Sabe mais
Real-time AI that works with your team

IA em robótica

Potencialize máquinas mais inteligentes com modelos Ultralytics YOLO. A IA de visão em robótica impulsiona a navegação autônoma, percepção, rastreamento de objetos e controle em tempo real.

Sabe mais
Real-time AI that works with your team

IA na Logística

Otimize a logística com modelos Ultralytics YOLO. A IA de visão permite a inspeção de pacotes, triagem, rastreamento de veículos e monitoramento de segurança em armazéns em tempo real.

Sabe mais
Real-time AI that works with your team

IA no varejo

Reinvente o varejo com modelos Ultralytics YOLO. A IA de visão impulsiona o rastreamento de inventário, monitoramento de prateleiras, gerenciamento de filas e percepções mais inteligentes sobre o cliente.

Sabe mais
Real-time AI that works with your team

IA na Saúde

Constrói soluções de saúde com modelos Ultralytics YOLO. A visão AI na saúde impulsiona imagens médicas mais rápidas, diagnósticos mais inteligentes e monitorização do paciente.

Sabe mais
Real-time AI that works with your team

IA na Fabricação

Otimize a fabricação com modelos Ultralytics YOLO. A IA de visão impulsiona o controle de qualidade, detecção de defeitos, conformidade com EPI e automação de linhas de montagem.

Sabe mais
Real-time AI that works with your operation

IA no Setor Automóvel

Aplica visão computacional no setor automóvel com modelos Ultralytics YOLO. A visão AI eleva a segurança rodoviária, a assistência ao condutor e a automação de veículos para estradas mais inteligentes.

Sabe mais
Real-time AI tailored to your operation

IA na Agricultura

Leva a visão AI para a agricultura inteligente com os modelos Ultralytics YOLO. Potencia a monitorização de culturas, o seguimento de gado e a agricultura de precisão para colheitas maiores e mais inteligentes.

Sabe mais

Vamos construir o futuro da IA juntos!

Começa a tua jornada com o futuro da aprendizagem automática