Conoce YOLO26: IA de visión de nueva generación.
Ultralytics
Volver al glosario de Ultralytics

Data Leakage

Explora qué es la fuga de datos en aprendizaje automático y aprende cómo prevenirla. Descubre las mejores prácticas para mantener seguro tu flujo de trabajo de Ultralytics YOLO.

La fuga de datos en aprendizaje automático (ML) ocurre cuando se utiliza información externa a los datos de entrenamiento de forma inapropiada para crear un modelo. Este fallo algorítmico oculto crea una ilusión engañosa de un rendimiento excepcional durante el entrenamiento y las pruebas del modelo, pero resulta en un grave fallo de generalización cuando el modelo se enfrenta a datos reales no vistos. A diferencia de las definiciones tradicionales de ciberseguridad, donde una fuga de datos se refiere a la exposición de datos no autorizada, la definición de fuga de datos en aprendizaje automático se centra totalmente en la contaminación del entrenamiento y en la integridad predictiva comprometida.

Link to this sectionCómo ocurre la fuga de datos#

Para entender qué es la fuga de datos en el aprendizaje automático, ayuda observar los dos mecanismos principales mediante los cuales este punto de fallo se manifiesta en las canalizaciones modernas:

  • Contaminación entre entrenamiento y pruebas: Esto ocurre cuando los datos de prueba se filtran accidentalmente al conjunto de entrenamiento. Una causa común es realizar el preprocesamiento de datos (como la normalización o el cálculo de valores medios) en todo el conjunto de datos antes de dividirlo, en lugar de aplicar estas transformaciones de forma independiente.
  • Fuga de objetivo: Esto ocurre cuando las características predictivas incluyen información que no estará disponible lógicamente en el momento de la inferencia. Por ejemplo, incluir una característica que sea una consecuencia directa de la variable objetivo le da al modelo la clave de respuestas de antemano.

Link to this sectionEjemplos reales de fuga de datos#

Entender cómo detectar y prevenir la fuga es fundamental para construir una IA fiable. Aquí tienes dos ejemplos concretos de cómo este concepto interrumpe las implementaciones en producción:

  • IA en el sector sanitario: Si un centro médico entrena un algoritmo para detectar enfermedades pulmonares mediante radiografías de pacientes, pero todos los escaneos positivos contienen marcadores quirúrgicos colocados por los médicos después de un diagnóstico, se produce una fuga de objetivo. El modelo simplemente aprende a identificar el marcador quirúrgico en lugar de los signos biológicos de la enfermedad.
  • Análisis de vídeo por visión artificial: En tareas visuales como el reconocimiento de acciones, dividir aleatoriamente fotogramas de vídeo adyacentes tanto en los conjuntos de entrenamiento como en los de validación causa una enorme contaminación entre entrenamiento y pruebas. Debido a que los fotogramas consecutivos son casi idénticos, el modelo memoriza los fondos superpuestos en lugar de aprender la compleja acción humana, violando las prácticas estándar de evaluación de modelos de OpenAI.

Link to this sectionPrevención y protección contra la fuga de datos#

La protección contra la fuga de datos depende de mantener una higiene de datos estricta y de utilizar entornos estructurados a lo largo de todo el ciclo de vida de la ingeniería.

from ultralytics import YOLO

# Load the recommended Ultralytics YOLO26 model
model = YOLO("yolo26n.pt")

# Train the model using a strict dataset configuration (data.yaml)
# The YAML file enforces rigid, isolated paths for 'train' and 'val' directories,
# ensuring data leakage protection between the learning and evaluation phases.
results = model.train(data="dataset.yaml", epochs=50, imgsz=640)

Link to this sectionDiferenciar la fuga de datos de conceptos relacionados#

Debido a que la terminología a menudo se solapa entre la ciencia de datos y la ciberseguridad, es importante distinguir la fuga de datos de ideas estrechamente relacionadas.

Explore solutions

Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.

Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.

Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.

Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.

Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.

Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.

Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.

Más información
Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.

Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.

Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.

Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.

Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.

Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.

Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.

Más información
Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.

Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.

Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.

Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.

Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.

Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.

Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.

Más información

¡Construyamos juntos el futuro de la IA!

Comienza tu viaje con el futuro del aprendizaje automático