Découvre YOLO26 : l'IA de vision de nouvelle génération.
Ultralytics
Retour au glossaire Ultralytics

Data Leakage

Explore ce qu'est la fuite de données en apprentissage automatique et apprends comment la prévenir. Découvre les meilleures pratiques pour sécuriser ton pipeline Ultralytics YOLO.

La fuite de données en machine learning (ML) se produit lorsque des informations provenant de l'extérieur des données d'entraînement sont utilisées de manière inappropriée pour créer un modèle. Ce défaut algorithmique caché crée une illusion trompeuse de performance exceptionnelle pendant l'entraînement et le test du modèle, mais entraîne un échec sévère de généralisation lorsque le modèle est confronté à des données réelles et inédites. Contrairement aux définitions traditionnelles de la cybersécurité où une fuite de données fait référence à une exposition non autorisée de données, la définition de la fuite de données en machine learning se concentre entièrement sur la contamination de l'entraînement et l'intégrité prédictive compromise.

Link to this sectionComment se produit la fuite de données#

Pour comprendre ce qu'est la fuite de données en machine learning, il est utile d'examiner les deux mécanismes principaux par lesquels ce point de défaillance se manifeste dans les pipelines modernes :

  • Contamination entre l'entraînement et le test : Cela se produit lorsque les données de test se retrouvent accidentellement dans l'ensemble d'entraînement. Une cause fréquente est l'exécution du prétraitement des données (comme la normalisation ou le calcul des valeurs moyennes) sur l'ensemble du jeu de données avant de le diviser, plutôt que d'appliquer ces transformations indépendamment.
  • Fuite de cible : Cela se produit lorsque les caractéristiques prédictives incluent des informations qui ne seront logiquement pas disponibles au moment de l'inférence. Par exemple, inclure une caractéristique qui est une conséquence directe de la variable cible donne intrinsèquement la réponse au modèle à l'avance.

Link to this sectionExemples concrets de fuite de données#

Comprendre comment repérer et prévenir la fuite est crucial pour construire une IA digne de confiance. Voici deux exemples concrets de la manière dont ce concept perturbe les déploiements en production :

  • IA dans la santé : Si un établissement médical entraîne un algorithme à détecter une maladie pulmonaire en utilisant des radiographies de patients, mais que tous les scans positifs contiennent des marqueurs chirurgicaux placés par les médecins après un diagnostic, une fuite de cible se produit. Le modèle apprend simplement à identifier le marqueur chirurgical plutôt que les signes biologiques de la maladie.
  • Analyse vidéo par vision par ordinateur : Dans des tâches visuelles comme la reconnaissance d'actions, diviser aléatoirement des images vidéo adjacentes à la fois dans les ensembles d'entraînement et de validation provoque une contamination massive entre l'entraînement et le test. Parce que les images consécutives sont presque identiques, le modèle mémorise les arrière-plans qui se chevauchent au lieu d'apprendre l'action humaine complexe, violant les pratiques d'évaluation des modèles OpenAI standard.

Link to this sectionPrévention et protection contre la fuite de données#

La protection contre la fuite de données repose sur le maintien d'une hygiène rigoureuse des données et l'utilisation d'environnements structurés tout au long du cycle de vie de l'ingénierie.

from ultralytics import YOLO

# Load the recommended Ultralytics YOLO26 model
model = YOLO("yolo26n.pt")

# Train the model using a strict dataset configuration (data.yaml)
# The YAML file enforces rigid, isolated paths for 'train' and 'val' directories,
# ensuring data leakage protection between the learning and evaluation phases.
results = model.train(data="dataset.yaml", epochs=50, imgsz=640)

Link to this sectionDifférencier la fuite de données des concepts connexes#

Parce que la terminologie se chevauche souvent entre la science des données et la cybersécurité, il est important de distinguer la fuite de données d'idées étroitement liées.

Explore solutions

Real-time AI that works with your team

IA dans la robotique

Équipe tes machines plus intelligentes avec les modèles Ultralytics YOLO. La vision par IA dans la robotique propulse la navigation autonome, la perception, le suivi d'objets et le contrôle en temps réel.

En savoir plus
Real-time AI that works with your team

IA dans la logistique

Simplifie la logistique avec les modèles Ultralytics YOLO. La vision par IA permet l'inspection des colis, le tri, le suivi des véhicules et la surveillance de la sécurité des entrepôts en temps réel.

En savoir plus
Real-time AI that works with your team

IA dans le commerce de détail

Réinvente le commerce de détail avec les modèles Ultralytics YOLO. La vision par IA alimente le suivi des stocks, la surveillance des étagères, la gestion des files d'attente et des informations plus intelligentes sur les clients.

En savoir plus
Real-time AI that works with your team

IA dans la santé

Construis des solutions de santé avec les modèles Ultralytics YOLO. L'IA de vision dans la santé permet une imagerie médicale plus rapide, des diagnostics plus intelligents et une surveillance des patients.

En savoir plus
Real-time AI that works with your team

IA dans la fabrication

Optimise la fabrication avec les modèles Ultralytics YOLO. La vision par IA favorise le contrôle qualité, la détection des défauts, la conformité aux EPI et l'automatisation des chaînes de montage.

En savoir plus
Real-time AI that works with your operation

IA dans l'automobile

Applique la vision par ordinateur dans l'automobile avec les modèles Ultralytics YOLO. L'IA de vision améliore la sécurité routière, l'assistance à la conduite et l'automatisation des véhicules pour des routes plus intelligentes.

En savoir plus
Real-time AI tailored to your operation

IA en agriculture

Intègre l'IA de vision à l'agriculture intelligente avec les modèles Ultralytics YOLO. Optimise la surveillance des cultures, le suivi du bétail et l'agriculture de précision pour des rendements plus élevés et plus intelligents.

En savoir plus
Real-time AI that works with your team

IA dans la robotique

Équipe tes machines plus intelligentes avec les modèles Ultralytics YOLO. La vision par IA dans la robotique propulse la navigation autonome, la perception, le suivi d'objets et le contrôle en temps réel.

En savoir plus
Real-time AI that works with your team

IA dans la logistique

Simplifie la logistique avec les modèles Ultralytics YOLO. La vision par IA permet l'inspection des colis, le tri, le suivi des véhicules et la surveillance de la sécurité des entrepôts en temps réel.

En savoir plus
Real-time AI that works with your team

IA dans le commerce de détail

Réinvente le commerce de détail avec les modèles Ultralytics YOLO. La vision par IA alimente le suivi des stocks, la surveillance des étagères, la gestion des files d'attente et des informations plus intelligentes sur les clients.

En savoir plus
Real-time AI that works with your team

IA dans la santé

Construis des solutions de santé avec les modèles Ultralytics YOLO. L'IA de vision dans la santé permet une imagerie médicale plus rapide, des diagnostics plus intelligents et une surveillance des patients.

En savoir plus
Real-time AI that works with your team

IA dans la fabrication

Optimise la fabrication avec les modèles Ultralytics YOLO. La vision par IA favorise le contrôle qualité, la détection des défauts, la conformité aux EPI et l'automatisation des chaînes de montage.

En savoir plus
Real-time AI that works with your operation

IA dans l'automobile

Applique la vision par ordinateur dans l'automobile avec les modèles Ultralytics YOLO. L'IA de vision améliore la sécurité routière, l'assistance à la conduite et l'automatisation des véhicules pour des routes plus intelligentes.

En savoir plus
Real-time AI tailored to your operation

IA en agriculture

Intègre l'IA de vision à l'agriculture intelligente avec les modèles Ultralytics YOLO. Optimise la surveillance des cultures, le suivi du bétail et l'agriculture de précision pour des rendements plus élevés et plus intelligents.

En savoir plus
Real-time AI that works with your team

IA dans la robotique

Équipe tes machines plus intelligentes avec les modèles Ultralytics YOLO. La vision par IA dans la robotique propulse la navigation autonome, la perception, le suivi d'objets et le contrôle en temps réel.

En savoir plus
Real-time AI that works with your team

IA dans la logistique

Simplifie la logistique avec les modèles Ultralytics YOLO. La vision par IA permet l'inspection des colis, le tri, le suivi des véhicules et la surveillance de la sécurité des entrepôts en temps réel.

En savoir plus
Real-time AI that works with your team

IA dans le commerce de détail

Réinvente le commerce de détail avec les modèles Ultralytics YOLO. La vision par IA alimente le suivi des stocks, la surveillance des étagères, la gestion des files d'attente et des informations plus intelligentes sur les clients.

En savoir plus
Real-time AI that works with your team

IA dans la santé

Construis des solutions de santé avec les modèles Ultralytics YOLO. L'IA de vision dans la santé permet une imagerie médicale plus rapide, des diagnostics plus intelligents et une surveillance des patients.

En savoir plus
Real-time AI that works with your team

IA dans la fabrication

Optimise la fabrication avec les modèles Ultralytics YOLO. La vision par IA favorise le contrôle qualité, la détection des défauts, la conformité aux EPI et l'automatisation des chaînes de montage.

En savoir plus
Real-time AI that works with your operation

IA dans l'automobile

Applique la vision par ordinateur dans l'automobile avec les modèles Ultralytics YOLO. L'IA de vision améliore la sécurité routière, l'assistance à la conduite et l'automatisation des véhicules pour des routes plus intelligentes.

En savoir plus
Real-time AI tailored to your operation

IA en agriculture

Intègre l'IA de vision à l'agriculture intelligente avec les modèles Ultralytics YOLO. Optimise la surveillance des cultures, le suivi du bétail et l'agriculture de précision pour des rendements plus élevés et plus intelligents.

En savoir plus

Construisons ensemble le futur de l'IA !

Commence ton aventure avec le futur de l'apprentissage automatique