Conheça o YOLO26: IA de visão de próxima geração.
Ultralytics
Voltar para o Glossário da Ultralytics

Data Leakage

Explora o que é vazamento de dados em aprendizado de máquina e aprende como preveni-lo. Descobre as melhores práticas para manter o teu pipeline Ultralytics YOLO seguro.

O vazamento de dados em machine learning (ML) ocorre quando informações externas aos dados de treinamento são usadas inadequadamente para criar um modelo. Essa falha algorítmica oculta cria uma ilusão enganosa de desempenho excepcional durante o treinamento e testes de modelo, mas resulta em uma falha grave de generalização quando o modelo enfrenta dados reais e inéditos. Diferente das definições tradicionais de segurança cibernética, onde um vazamento de dados se refere à exposição não autorizada de dados, a definição de vazamento de dados em machine learning concentra-se inteiramente na contaminação do treinamento e na integridade preditiva comprometida.

Link to this sectionComo ocorre o vazamento de dados#

Para entender o que é vazamento de dados em machine learning, ajuda observar os dois mecanismos principais pelos quais este ponto de falha se manifesta em pipelines modernos:

  • Contaminação de Treino-Teste: Isso acontece quando os dados de teste entram acidentalmente no conjunto de treinamento. Uma causa comum é realizar pré-processamento de dados (como normalização ou cálculo de valores médios) em todo o conjunto de dados antes de dividi-lo, em vez de aplicar essas transformações de forma independente.
  • Vazamento de Alvo: Isso ocorre quando características preditivas incluem informações que logicamente não estariam disponíveis no momento da inferência. Por exemplo, incluir uma característica que é uma consequência direta da variável alvo fornece inerentemente ao modelo o gabarito das respostas antecipadamente.

Link to this sectionExemplos reais de vazamento de dados#

Entender como identificar e prevenir vazamentos é fundamental para construir uma IA confiável. Aqui estão dois exemplos concretos de como esse conceito prejudica implantações em produção:

  • IA na Saúde: Se uma instalação médica treina um algoritmo para detectar doenças pulmonares usando raios-X de pacientes, mas todos os exames positivos contêm marcadores cirúrgicos colocados por médicos após um diagnóstico, ocorre vazamento de alvo. O modelo simplesmente aprende a identificar o marcador cirúrgico em vez dos sinais biológicos da doença.
  • Análise de Vídeo em Visão Computacional: Em tarefas visuais como reconhecimento de ação, dividir aleatoriamente quadros de vídeo adjacentes em conjuntos de treinamento e validação causa uma contaminação massiva de treino-teste. Como quadros consecutivos são quase idênticos, o modelo memoriza os fundos sobrepostos em vez de aprender a complexa ação humana, violando as práticas de avaliação de modelos da OpenAI.

Link to this sectionPrevenção e proteção contra vazamento de dados#

A proteção contra vazamento de dados baseia-se em manter uma higiene rigorosa dos dados e utilizar ambientes estruturados ao longo de todo o ciclo de vida de engenharia.

from ultralytics import YOLO

# Load the recommended Ultralytics YOLO26 model
model = YOLO("yolo26n.pt")

# Train the model using a strict dataset configuration (data.yaml)
# The YAML file enforces rigid, isolated paths for 'train' and 'val' directories,
# ensuring data leakage protection between the learning and evaluation phases.
results = model.train(data="dataset.yaml", epochs=50, imgsz=640)

Link to this sectionDiferenciando vazamento de dados de conceitos relacionados#

Como a terminologia frequentemente se sobrepõe entre ciência de dados e segurança cibernética, é importante distinguir o vazamento de dados de ideias intimamente relacionadas.

Explore solutions

Real-time AI that works with your team

IA em robótica

Potencialize máquinas mais inteligentes com modelos Ultralytics YOLO. A IA de visão em robótica impulsiona a navegação autônoma, percepção, rastreamento de objetos e controle em tempo real.

Sabe mais
Real-time AI that works with your team

IA na Logística

Otimize a logística com modelos Ultralytics YOLO. A IA de visão permite a inspeção de pacotes, triagem, rastreamento de veículos e monitoramento de segurança em armazéns em tempo real.

Sabe mais
Real-time AI that works with your team

IA no varejo

Reinvente o varejo com modelos Ultralytics YOLO. A IA de visão impulsiona o rastreamento de inventário, monitoramento de prateleiras, gerenciamento de filas e percepções mais inteligentes sobre o cliente.

Sabe mais
Real-time AI that works with your team

IA na Saúde

Constrói soluções de saúde com modelos Ultralytics YOLO. A visão AI na saúde impulsiona imagens médicas mais rápidas, diagnósticos mais inteligentes e monitorização do paciente.

Sabe mais
Real-time AI that works with your team

IA na Fabricação

Otimize a fabricação com modelos Ultralytics YOLO. A IA de visão impulsiona o controle de qualidade, detecção de defeitos, conformidade com EPI e automação de linhas de montagem.

Sabe mais
Real-time AI that works with your operation

IA no Setor Automóvel

Aplica visão computacional no setor automóvel com modelos Ultralytics YOLO. A visão AI eleva a segurança rodoviária, a assistência ao condutor e a automação de veículos para estradas mais inteligentes.

Sabe mais
Real-time AI tailored to your operation

IA na Agricultura

Leva a visão AI para a agricultura inteligente com os modelos Ultralytics YOLO. Potencia a monitorização de culturas, o seguimento de gado e a agricultura de precisão para colheitas maiores e mais inteligentes.

Sabe mais
Real-time AI that works with your team

IA em robótica

Potencialize máquinas mais inteligentes com modelos Ultralytics YOLO. A IA de visão em robótica impulsiona a navegação autônoma, percepção, rastreamento de objetos e controle em tempo real.

Sabe mais
Real-time AI that works with your team

IA na Logística

Otimize a logística com modelos Ultralytics YOLO. A IA de visão permite a inspeção de pacotes, triagem, rastreamento de veículos e monitoramento de segurança em armazéns em tempo real.

Sabe mais
Real-time AI that works with your team

IA no varejo

Reinvente o varejo com modelos Ultralytics YOLO. A IA de visão impulsiona o rastreamento de inventário, monitoramento de prateleiras, gerenciamento de filas e percepções mais inteligentes sobre o cliente.

Sabe mais
Real-time AI that works with your team

IA na Saúde

Constrói soluções de saúde com modelos Ultralytics YOLO. A visão AI na saúde impulsiona imagens médicas mais rápidas, diagnósticos mais inteligentes e monitorização do paciente.

Sabe mais
Real-time AI that works with your team

IA na Fabricação

Otimize a fabricação com modelos Ultralytics YOLO. A IA de visão impulsiona o controle de qualidade, detecção de defeitos, conformidade com EPI e automação de linhas de montagem.

Sabe mais
Real-time AI that works with your operation

IA no Setor Automóvel

Aplica visão computacional no setor automóvel com modelos Ultralytics YOLO. A visão AI eleva a segurança rodoviária, a assistência ao condutor e a automação de veículos para estradas mais inteligentes.

Sabe mais
Real-time AI tailored to your operation

IA na Agricultura

Leva a visão AI para a agricultura inteligente com os modelos Ultralytics YOLO. Potencia a monitorização de culturas, o seguimento de gado e a agricultura de precisão para colheitas maiores e mais inteligentes.

Sabe mais
Real-time AI that works with your team

IA em robótica

Potencialize máquinas mais inteligentes com modelos Ultralytics YOLO. A IA de visão em robótica impulsiona a navegação autônoma, percepção, rastreamento de objetos e controle em tempo real.

Sabe mais
Real-time AI that works with your team

IA na Logística

Otimize a logística com modelos Ultralytics YOLO. A IA de visão permite a inspeção de pacotes, triagem, rastreamento de veículos e monitoramento de segurança em armazéns em tempo real.

Sabe mais
Real-time AI that works with your team

IA no varejo

Reinvente o varejo com modelos Ultralytics YOLO. A IA de visão impulsiona o rastreamento de inventário, monitoramento de prateleiras, gerenciamento de filas e percepções mais inteligentes sobre o cliente.

Sabe mais
Real-time AI that works with your team

IA na Saúde

Constrói soluções de saúde com modelos Ultralytics YOLO. A visão AI na saúde impulsiona imagens médicas mais rápidas, diagnósticos mais inteligentes e monitorização do paciente.

Sabe mais
Real-time AI that works with your team

IA na Fabricação

Otimize a fabricação com modelos Ultralytics YOLO. A IA de visão impulsiona o controle de qualidade, detecção de defeitos, conformidade com EPI e automação de linhas de montagem.

Sabe mais
Real-time AI that works with your operation

IA no Setor Automóvel

Aplica visão computacional no setor automóvel com modelos Ultralytics YOLO. A visão AI eleva a segurança rodoviária, a assistência ao condutor e a automação de veículos para estradas mais inteligentes.

Sabe mais
Real-time AI tailored to your operation

IA na Agricultura

Leva a visão AI para a agricultura inteligente com os modelos Ultralytics YOLO. Potencia a monitorização de culturas, o seguimento de gado e a agricultura de precisão para colheitas maiores e mais inteligentes.

Sabe mais

Vamos construir o futuro da IA juntos!

Começa a tua jornada com o futuro da aprendizagem automática