Conheça o YOLO26: IA de visão de próxima geração.
Ultralytics
Voltar para o Glossário da Ultralytics

Dataset Bias

Explora as causas do enviesamento de conjuntos de dados em IA e aprende a mitigar a distorção. Descobre como usar a Ultralytics Platform e o Ultralytics YOLO26 para melhorar a justiça.

O viés de conjunto de dados ocorre quando as informações usadas para treinar modelos de machine learning (ML) contêm erros sistemáticos ou distribuições distorcidas, levando o sistema de IA resultante a favorecer certos resultados em detrimento de outros. Como os modelos funcionam como motores de reconhecimento de padrões, eles dependem inteiramente de sua entrada; se os dados de treinamento não refletirem com precisão a diversidade do ambiente do mundo real, o modelo herdará esses pontos cegos. Esse fenômeno frequentemente resulta em uma generalização ruim, onde uma IA pode obter pontuações altas durante o teste, mas falhar significativamente ao ser implantada para inferência em tempo real em cenários diversos ou inesperados.

Link to this sectionFontes comuns de distorção de dados#

O viés pode se infiltrar em um conjunto de dados em vários estágios do ciclo de vida de desenvolvimento, decorrendo frequentemente de decisões humanas durante a coleta ou anotação.

  • Viés de seleção: Isso surge quando os dados coletados não representam aleatoriamente a população-alvo. Por exemplo, criar um conjunto de dados de reconhecimento facial usando predominantemente imagens de celebridades pode distorcer o modelo em direção a maquiagem pesada e iluminação profissional, fazendo com que ele falhe em imagens comuns de webcam.
  • Erros de rotulagem: A subjetividade durante a rotulagem de dados pode introduzir preconceitos humanos. Se os anotadores classificarem incorretamente objetos ambíguos de forma consistente devido à falta de diretrizes claras, o modelo tratará esses erros como verdade absoluta.
  • Viés de representação: Mesmo se selecionados aleatoriamente, grupos minoritários podem ser estatisticamente abafados pela classe majoritária. Em detecção de objetos, um conjunto de dados com 10.000 imagens de carros, mas apenas 100 imagens de bicicletas, resultará em um modelo que é tendencioso para a detecção de carros.

Link to this sectionAplicações no Mundo Real e Consequências#

O impacto do viés de conjunto de dados é significativo em vários setores, particularmente onde sistemas automatizados tomam decisões de alto risco ou interagem com o mundo físico.

Na indústria automotiva, IA automotiva depende de câmeras para identificar pedestres e obstáculos. Se um carro autônomo for treinado principalmente com dados coletados em climas ensolarados e secos, ele poderá exibir degradação de desempenho ao operar na neve ou sob chuva forte. Este é um exemplo clássico da distribuição de treinamento não corresponder à distribuição operacional, levando a riscos de segurança.

Da mesma forma, na análise de imagens médicas, modelos de diagnóstico são frequentemente treinados em dados históricos de pacientes. Se um modelo projetado para detectar condições de pele for treinado em um conjunto de dados dominado por tons de pele mais claros, ele poderá demonstrar uma precisão significativamente menor ao diagnosticar pacientes com tons de pele mais escuros. Abordar isso requer um esforço conjunto para curar conjuntos de dados diversos que garantam a justiça na IA em todos os grupos demográficos.

Link to this sectionEstratégias para mitigação#

Desenvolvedores podem reduzir o viés de conjunto de dados empregando auditoria rigorosa e estratégias de treinamento avançadas. Técnicas como aumento de dados ajudam a equilibrar os conjuntos de dados criando artificialmente variações de exemplos sub-representados (por exemplo, invertendo, rotacionando ou ajustando o brilho). Além disso, gerar dados sintéticos pode preencher lacunas onde dados do mundo real são escassos ou difíceis de coletar.

Gerenciar esses conjuntos de dados de forma eficaz é crucial. A Plataforma Ultralytics permite que as equipes visualizem distribuições de classe e identifiquem desequilíbrios antes que o treinamento comece. Além disso, seguir diretrizes como o NIST AI Risk Management Framework ajuda as organizações a estruturar sua abordagem para identificar e mitigar esses riscos sistematicamente.

Link to this sectionViés de conjunto de dados vs. conceitos relacionados#

É útil distinguir o viés de conjunto de dados de termos semelhantes para entender onde o erro se origina:

  • vs. Viés algorítmico: O viés de conjunto de dados é centrado nos dados; implica que os "ingredientes" estão com defeito. O viés algorítmico é centrado no modelo; ele surge do design do próprio algoritmo ou do algoritmo de otimização, que pode priorizar classes majoritárias para maximizar métricas globais em detrimento de grupos minoritários.
  • vs. Desvio do modelo: O viés de conjunto de dados é um problema estático presente no momento do treinamento. O desvio do modelo (ou desvio de dados) ocorre quando os dados do mundo real mudam com o tempo após o modelo ter sido implantado, exigindo monitoramento de modelo contínuo.

Link to this sectionExemplo de código: Aumento para reduzir o viés#

O exemplo a seguir demonstra como aplicar o aumento de dados durante o treinamento com YOLO26. Ao aumentar os aumentos geométricos, o modelo aprende a generalizar melhor, reduzindo potencialmente o viés em relação a orientações ou posições específicas de objetos encontradas no conjunto de treinamento.

from ultralytics import YOLO

# Load YOLO26n, a high-efficiency model ideal for edge deployment
model = YOLO("yolo26n.pt")

# Train with increased augmentation to improve generalization
# 'fliplr' (flip left-right) and 'scale' help the model see diverse variations
results = model.train(
    data="coco8.yaml",
    epochs=50,
    fliplr=0.5,  # 50% probability of horizontal flip
    scale=0.5,  # +/- 50% image scaling
)

Explore solutions

Real-time AI that works with your team

IA em robótica

Potencialize máquinas mais inteligentes com modelos Ultralytics YOLO. A IA de visão em robótica impulsiona a navegação autônoma, percepção, rastreamento de objetos e controle em tempo real.

Sabe mais
Real-time AI that works with your team

IA na Logística

Otimize a logística com modelos Ultralytics YOLO. A IA de visão permite a inspeção de pacotes, triagem, rastreamento de veículos e monitoramento de segurança em armazéns em tempo real.

Sabe mais
Real-time AI that works with your team

IA no varejo

Reinvente o varejo com modelos Ultralytics YOLO. A IA de visão impulsiona o rastreamento de inventário, monitoramento de prateleiras, gerenciamento de filas e percepções mais inteligentes sobre o cliente.

Sabe mais
Real-time AI that works with your team

IA na Saúde

Constrói soluções de saúde com modelos Ultralytics YOLO. A visão AI na saúde impulsiona imagens médicas mais rápidas, diagnósticos mais inteligentes e monitorização do paciente.

Sabe mais
Real-time AI that works with your team

IA na Fabricação

Otimize a fabricação com modelos Ultralytics YOLO. A IA de visão impulsiona o controle de qualidade, detecção de defeitos, conformidade com EPI e automação de linhas de montagem.

Sabe mais
Real-time AI that works with your operation

IA no Setor Automóvel

Aplica visão computacional no setor automóvel com modelos Ultralytics YOLO. A visão AI eleva a segurança rodoviária, a assistência ao condutor e a automação de veículos para estradas mais inteligentes.

Sabe mais
Real-time AI tailored to your operation

IA na Agricultura

Leva a visão AI para a agricultura inteligente com os modelos Ultralytics YOLO. Potencia a monitorização de culturas, o seguimento de gado e a agricultura de precisão para colheitas maiores e mais inteligentes.

Sabe mais
Real-time AI that works with your team

IA em robótica

Potencialize máquinas mais inteligentes com modelos Ultralytics YOLO. A IA de visão em robótica impulsiona a navegação autônoma, percepção, rastreamento de objetos e controle em tempo real.

Sabe mais
Real-time AI that works with your team

IA na Logística

Otimize a logística com modelos Ultralytics YOLO. A IA de visão permite a inspeção de pacotes, triagem, rastreamento de veículos e monitoramento de segurança em armazéns em tempo real.

Sabe mais
Real-time AI that works with your team

IA no varejo

Reinvente o varejo com modelos Ultralytics YOLO. A IA de visão impulsiona o rastreamento de inventário, monitoramento de prateleiras, gerenciamento de filas e percepções mais inteligentes sobre o cliente.

Sabe mais
Real-time AI that works with your team

IA na Saúde

Constrói soluções de saúde com modelos Ultralytics YOLO. A visão AI na saúde impulsiona imagens médicas mais rápidas, diagnósticos mais inteligentes e monitorização do paciente.

Sabe mais
Real-time AI that works with your team

IA na Fabricação

Otimize a fabricação com modelos Ultralytics YOLO. A IA de visão impulsiona o controle de qualidade, detecção de defeitos, conformidade com EPI e automação de linhas de montagem.

Sabe mais
Real-time AI that works with your operation

IA no Setor Automóvel

Aplica visão computacional no setor automóvel com modelos Ultralytics YOLO. A visão AI eleva a segurança rodoviária, a assistência ao condutor e a automação de veículos para estradas mais inteligentes.

Sabe mais
Real-time AI tailored to your operation

IA na Agricultura

Leva a visão AI para a agricultura inteligente com os modelos Ultralytics YOLO. Potencia a monitorização de culturas, o seguimento de gado e a agricultura de precisão para colheitas maiores e mais inteligentes.

Sabe mais
Real-time AI that works with your team

IA em robótica

Potencialize máquinas mais inteligentes com modelos Ultralytics YOLO. A IA de visão em robótica impulsiona a navegação autônoma, percepção, rastreamento de objetos e controle em tempo real.

Sabe mais
Real-time AI that works with your team

IA na Logística

Otimize a logística com modelos Ultralytics YOLO. A IA de visão permite a inspeção de pacotes, triagem, rastreamento de veículos e monitoramento de segurança em armazéns em tempo real.

Sabe mais
Real-time AI that works with your team

IA no varejo

Reinvente o varejo com modelos Ultralytics YOLO. A IA de visão impulsiona o rastreamento de inventário, monitoramento de prateleiras, gerenciamento de filas e percepções mais inteligentes sobre o cliente.

Sabe mais
Real-time AI that works with your team

IA na Saúde

Constrói soluções de saúde com modelos Ultralytics YOLO. A visão AI na saúde impulsiona imagens médicas mais rápidas, diagnósticos mais inteligentes e monitorização do paciente.

Sabe mais
Real-time AI that works with your team

IA na Fabricação

Otimize a fabricação com modelos Ultralytics YOLO. A IA de visão impulsiona o controle de qualidade, detecção de defeitos, conformidade com EPI e automação de linhas de montagem.

Sabe mais
Real-time AI that works with your operation

IA no Setor Automóvel

Aplica visão computacional no setor automóvel com modelos Ultralytics YOLO. A visão AI eleva a segurança rodoviária, a assistência ao condutor e a automação de veículos para estradas mais inteligentes.

Sabe mais
Real-time AI tailored to your operation

IA na Agricultura

Leva a visão AI para a agricultura inteligente com os modelos Ultralytics YOLO. Potencia a monitorização de culturas, o seguimento de gado e a agricultura de precisão para colheitas maiores e mais inteligentes.

Sabe mais

Vamos construir o futuro da IA juntos!

Começa a tua jornada com o futuro da aprendizagem automática