Sintonizzati su YOLO Vision 2025!
25 settembre 2025
10:00 — 18:00 BST
Evento ibrido
Yolo Vision 2024
Glossario

Data Augmentation

Migliora i tuoi modelli di machine learning con la data augmentation. Scopri le tecniche per aumentare l'accuratezza, ridurre l'overfitting e migliorare la robustezza.

L'aumento dei dati è una tecnica fondamentale nel machine learning (ML) utilizzata per incrementare artificialmente le dimensioni e la diversità di un dataset di training. Ciò si ottiene creando versioni modificate, ma realistiche, dei campioni di dati esistenti. L'obiettivo principale è migliorare le prestazioni e la robustezza dei modelli di IA, in particolare nella computer vision (CV), esponendoli a una più ampia varietà di condizioni durante il training. Questo aiuta a prevenire l'overfitting, dove un modello impara troppo bene i dati di training ma non riesce a generalizzare a nuovi dati non visti, portando in definitiva a una maggiore accuratezza del modello.

Come funziona l'aumento dei dati (Data Augmentation)

Nella computer vision, l'aumento dei dati comporta l'applicazione di una serie di trasformazioni alle immagini. Queste trasformazioni sono progettate per simulare le variazioni del mondo reale che un modello potrebbe incontrare dopo il deployment. Le tecniche comuni includono:

  • Trasformazioni geometriche: Queste alterano l'orientamento spaziale di un'immagine. Gli esempi includono rotazioni casuali, ridimensionamento, traslazioni (spostamento), ritaglio e capovolgimento (orizzontale o verticale). Questi insegnano al modello a essere invariante rispetto alla posizione e all'orientamento dell'oggetto.
  • Trasformazioni dello spazio colore: Queste modificano le proprietà del colore di un'immagine. Le regolazioni di luminosità, contrasto, saturazione e tonalità rendono il modello più resistente ai cambiamenti nelle condizioni di illuminazione.
  • Tecniche avanzate: Metodi più complessi comportano l'alterazione del contenuto dell'immagine in modo più significativo. Questi possono includere l'aggiunta di rumore casuale (come il rumore gaussiano), l'applicazione di effetti di sfocatura o l'utilizzo di metodi come Mixup, che crea nuove immagini combinando linearmente due immagini esistenti, e Cutout, che rimuove casualmente regioni di un'immagine. Puoi saperne di più su questi metodi nella Guida definitiva all'aumento dei dati.

Molti framework di deep learning, come PyTorch e TensorFlow, forniscono strumenti per l'aumento dei dati. Librerie specializzate come Albumentations offrono una vasta raccolta di tecniche di aumento ad alte prestazioni e sono integrate con modelli come Ultralytics YOLO11 per diversificare i dati di training senza problemi.

Applicazioni nel mondo reale

L'aumento dei dati è una pratica standard in molti settori per costruire sistemi di IA più affidabili.

  1. IA nel settore sanitario: Nell'analisi di immagini mediche, i dataset sono spesso di piccole dimensioni a causa delle normative sulla privacy dei pazienti e della rarità di alcune malattie. Per addestrare un modello per il rilevamento di tumori nelle scansioni, le tecniche di augmentation come la rotazione, il ridimensionamento e le modifiche di luminosità creano un insieme più diversificato di esempi di addestramento. Ciò aiuta il modello a identificare accuratamente le anomalie indipendentemente dalle variazioni nelle apparecchiature di imaging o nel posizionamento del paziente, migliorando l'affidabilità diagnostica.
  2. IA per l'automotive: Lo sviluppo di sistemi robusti di object detection per veicoli autonomi richiede dati provenienti da innumerevoli scenari di guida. Invece di raccogliere dati per ogni possibile condizione, l'aumento dei dati può simulare diverse condizioni meteorologiche (ad esempio, aggiungendo pioggia o neve sintetica), illuminazione (giorno, crepuscolo, notte) e occlusioni (ad esempio, un pedone parzialmente nascosto da un'altra auto). Ciò rende il sistema di percezione del veicolo più affidabile in ambienti reali imprevedibili.

Altre applicazioni significative includono l'IA nella produzione per il controllo qualità e l'IA in agricoltura per il rilevamento di malattie delle colture in diverse condizioni di campo.

Aumento dei dati vs. Concetti correlati

È importante distinguere l'aumento dei dati da altre tecniche correlate ai dati.

  • Dati sintetici: Sebbene entrambi i metodi migliorino i set di dati, operano in modo diverso. L'aumento dei dati modifica i dati reali esistenti. Al contrario, la generazione di dati sintetici crea dati artificiali completamente nuovi da zero utilizzando simulazioni o modelli generativi come i GAN. Mentre l'aumento espande la varianza attorno ai dati osservati, i dati sintetici possono creare scenari nuovi non presenti nel set di dati originale, un concetto esplorato in questa panoramica dei dati sintetici nella computer vision.
  • Data Cleaning: La data cleaning è una parte della più ampia pipeline di pre-elaborazione dei dati che si concentra sull'identificazione e la correzione di errori, incongruenze e imprecisioni in un dataset. Il suo obiettivo è migliorare la qualità dei dati. La data augmentation, d'altra parte, riguarda l'aumento della quantità e della varietà dei dati. Un dataset pulito è il punto di partenza ideale prima di applicare l'augmentation.
  • Transfer Learning: Questa tecnica prevede l'utilizzo di un modello pre-addestrato su un ampio set di dati di riferimento come ImageNet e quindi il suo fine-tuning su un set di dati più piccolo e specifico per l'attività. L'aumento dei dati viene spesso utilizzato durante la fase di fine-tuning per migliorare ulteriormente le prestazioni e prevenire l'overfitting sui nuovi dati.

Piattaforme come Ultralytics HUB semplificano l'intero processo di training del modello, incorporando l'aumento dei dati come passaggio chiave per aiutare gli utenti a creare modelli di vision AI potenti e all'avanguardia.

Unisciti alla community di Ultralytics

Entra nel futuro dell'AI. Connettiti, collabora e cresci con innovatori globali

Iscriviti ora
Link copiato negli appunti