Scopri YOLO26: vision AI di prossima generazione.
Ultralytics
Torna al glossario Ultralytics

Data Leakage

Esplora cosa sia il data leakage nel machine learning e impara come prevenirlo. Scopri le migliori pratiche per mantenere sicura la tua pipeline Ultralytics YOLO.

Il data leakage nel machine learning (ML) si verifica quando informazioni esterne ai training data vengono utilizzate in modo inappropriato per creare un modello. Questo difetto algoritmico nascosto crea una falsa illusione di prestazioni eccezionali durante l'addestramento e il model testing, ma porta a un grave fallimento nella generalizzazione quando il modello affronta dati reali e mai visti prima. A differenza delle definizioni tradizionali di sicurezza informatica, dove una perdita di dati si riferisce a un'esposizione non autorizzata dei dati, la definizione di data leakage nel machine learning si concentra interamente sulla contaminazione dell'addestramento e sulla compromissione dell'integrità predittiva.

Link to this sectionCome avviene il Data Leakage#

Per capire cos'è il data leakage nel machine learning, è utile guardare ai due meccanismi principali attraverso i quali questo punto di fallimento si manifesta nelle pipeline moderne:

  • Train-Test Contamination: Accade quando i test data finiscono accidentalmente nel set di addestramento. Una causa comune è l'esecuzione del data preprocessing (come la normalizzazione o il calcolo dei valori medi) sull'intero dataset prima di suddividerlo, invece di applicare queste trasformazioni in modo indipendente.
  • Target Leakage: Si verifica quando le feature predittive includono informazioni che logicamente non saranno disponibili al momento dell'inferenza. Ad esempio, includere una feature che è una conseguenza diretta della variabile target fornisce intrinsecamente al modello la soluzione in anticipo.

Link to this sectionEsempi reali di Data Leakage#

Capire come individuare e prevenire il leakage è fondamentale per costruire un'AI affidabile. Ecco due esempi concreti di come questo concetto comprometta le implementazioni in produzione:

  • AI in Healthcare: Se una struttura medica addestra un algoritmo per rilevare malattie polmonari utilizzando raggi X dei pazienti, ma tutte le scansioni positive contengono marcatori chirurgici inseriti dai medici dopo una diagnosi, si verifica un target leakage. Il modello impara semplicemente a identificare il marcatore chirurgico invece dei segni biologici della malattia.
  • Computer Vision Video Analysis: In attività visive come l'action recognition, dividere casualmente i frame video adiacenti sia nel set di addestramento che in quello di validazione causa una massiccia train-test contamination. Poiché i frame consecutivi sono quasi identici, il modello memorizza gli sfondi sovrapposti invece di imparare la complessa azione umana, violando le standard OpenAI model evaluation practices.

Link to this sectionPrevenzione e protezione dal Data Leakage#

La protezione dal data leakage si basa sul mantenimento di una rigorosa igiene dei dati e sull'utilizzo di ambienti strutturati durante tutto il ciclo di vita ingegneristico.

from ultralytics import YOLO

# Load the recommended Ultralytics YOLO26 model
model = YOLO("yolo26n.pt")

# Train the model using a strict dataset configuration (data.yaml)
# The YAML file enforces rigid, isolated paths for 'train' and 'val' directories,
# ensuring data leakage protection between the learning and evaluation phases.
results = model.train(data="dataset.yaml", epochs=50, imgsz=640)

Link to this sectionDifferenziare il Data Leakage da concetti correlati#

Poiché la terminologia spesso si sovrappone tra data science e sicurezza informatica, è importante distinguere il data leakage da idee strettamente correlate.

Explore solutions

Real-time AI that works with your team

AI nella Robotica

Potenzia macchine più intelligenti con i modelli Ultralytics YOLO. La Vision AI nella robotica guida la navigazione autonoma, la percezione, il tracciamento degli oggetti e il controllo in tempo reale.

Scopri di più
Real-time AI that works with your team

IA nella logistica

Semplifica la logistica con i modelli Ultralytics YOLO. La Vision AI abilita l'ispezione dei pacchi, lo smistamento, il tracciamento dei veicoli e il monitoraggio della sicurezza in magazzino in tempo reale.

Scopri di più
Real-time AI that works with your team

AI nel settore Retail

Reimmagina il retail con i modelli Ultralytics YOLO. La Vision AI alimenta il tracciamento dell'inventario, il monitoraggio degli scaffali, la gestione delle code e insight più intelligenti sui clienti.

Scopri di più
Real-time AI that works with your team

IA nel settore sanitario

Crea soluzioni sanitarie con i modelli Ultralytics YOLO. La vision AI nella sanità potenzia l'imaging medico più rapido, diagnosi più intelligenti e il monitoraggio dei pazienti.

Scopri di più
Real-time AI that works with your team

IA nella produzione

Ottimizza la produzione con i modelli Ultralytics YOLO. La Vision AI guida il controllo qualità, il rilevamento dei difetti, la conformità ai DPI e l'automazione della linea di assemblaggio.

Scopri di più
Real-time AI that works with your operation

AI nel settore automobilistico

Applica la computer vision al settore automobilistico con i modelli Ultralytics YOLO. La vision AI migliora la sicurezza stradale, l'assistenza alla guida e l'automazione dei veicoli per strade più intelligenti.

Scopri di più
Real-time AI tailored to your operation

AI in Agricoltura

Porta la vision AI nell'agricoltura intelligente con i modelli Ultralytics YOLO. Potenzia il monitoraggio delle colture, il tracciamento del bestiame e l'agricoltura di precisione per rese più elevate e intelligenti.

Scopri di più
Real-time AI that works with your team

AI nella Robotica

Potenzia macchine più intelligenti con i modelli Ultralytics YOLO. La Vision AI nella robotica guida la navigazione autonoma, la percezione, il tracciamento degli oggetti e il controllo in tempo reale.

Scopri di più
Real-time AI that works with your team

IA nella logistica

Semplifica la logistica con i modelli Ultralytics YOLO. La Vision AI abilita l'ispezione dei pacchi, lo smistamento, il tracciamento dei veicoli e il monitoraggio della sicurezza in magazzino in tempo reale.

Scopri di più
Real-time AI that works with your team

AI nel settore Retail

Reimmagina il retail con i modelli Ultralytics YOLO. La Vision AI alimenta il tracciamento dell'inventario, il monitoraggio degli scaffali, la gestione delle code e insight più intelligenti sui clienti.

Scopri di più
Real-time AI that works with your team

IA nel settore sanitario

Crea soluzioni sanitarie con i modelli Ultralytics YOLO. La vision AI nella sanità potenzia l'imaging medico più rapido, diagnosi più intelligenti e il monitoraggio dei pazienti.

Scopri di più
Real-time AI that works with your team

IA nella produzione

Ottimizza la produzione con i modelli Ultralytics YOLO. La Vision AI guida il controllo qualità, il rilevamento dei difetti, la conformità ai DPI e l'automazione della linea di assemblaggio.

Scopri di più
Real-time AI that works with your operation

AI nel settore automobilistico

Applica la computer vision al settore automobilistico con i modelli Ultralytics YOLO. La vision AI migliora la sicurezza stradale, l'assistenza alla guida e l'automazione dei veicoli per strade più intelligenti.

Scopri di più
Real-time AI tailored to your operation

AI in Agricoltura

Porta la vision AI nell'agricoltura intelligente con i modelli Ultralytics YOLO. Potenzia il monitoraggio delle colture, il tracciamento del bestiame e l'agricoltura di precisione per rese più elevate e intelligenti.

Scopri di più
Real-time AI that works with your team

AI nella Robotica

Potenzia macchine più intelligenti con i modelli Ultralytics YOLO. La Vision AI nella robotica guida la navigazione autonoma, la percezione, il tracciamento degli oggetti e il controllo in tempo reale.

Scopri di più
Real-time AI that works with your team

IA nella logistica

Semplifica la logistica con i modelli Ultralytics YOLO. La Vision AI abilita l'ispezione dei pacchi, lo smistamento, il tracciamento dei veicoli e il monitoraggio della sicurezza in magazzino in tempo reale.

Scopri di più
Real-time AI that works with your team

AI nel settore Retail

Reimmagina il retail con i modelli Ultralytics YOLO. La Vision AI alimenta il tracciamento dell'inventario, il monitoraggio degli scaffali, la gestione delle code e insight più intelligenti sui clienti.

Scopri di più
Real-time AI that works with your team

IA nel settore sanitario

Crea soluzioni sanitarie con i modelli Ultralytics YOLO. La vision AI nella sanità potenzia l'imaging medico più rapido, diagnosi più intelligenti e il monitoraggio dei pazienti.

Scopri di più
Real-time AI that works with your team

IA nella produzione

Ottimizza la produzione con i modelli Ultralytics YOLO. La Vision AI guida il controllo qualità, il rilevamento dei difetti, la conformità ai DPI e l'automazione della linea di assemblaggio.

Scopri di più
Real-time AI that works with your operation

AI nel settore automobilistico

Applica la computer vision al settore automobilistico con i modelli Ultralytics YOLO. La vision AI migliora la sicurezza stradale, l'assistenza alla guida e l'automazione dei veicoli per strade più intelligenti.

Scopri di più
Real-time AI tailored to your operation

AI in Agricoltura

Porta la vision AI nell'agricoltura intelligente con i modelli Ultralytics YOLO. Potenzia il monitoraggio delle colture, il tracciamento del bestiame e l'agricoltura di precisione per rese più elevate e intelligenti.

Scopri di più

Costruiamo insieme il futuro dell'AI!

Inizia il tuo viaggio con il futuro del machine learning