Scopri YOLO26: vision AI di prossima generazione.
Ultralytics
Guide

Migliora la robustezza del modello AI con la data augmentation

Scopri come l'aggiunta di variazioni realistiche ai dati di addestramento tramite data augmentation aiuti a migliorare la robustezza del modello AI e le prestazioni nel mondo reale.

ABAbirami Vina
4 min read
Migliorare la robustezza del modello AI con la data augmentation

Il testing è una parte cruciale della creazione di qualsiasi soluzione tecnologica. Mostra ai team come funziona realmente un sistema prima che vada online e permette loro di risolvere i problemi in anticipo. Questo vale in molti campi, inclusa l'IA, dove ci si aspetta che i modelli gestiscano condizioni imprevedibili del mondo reale una volta distribuiti.

Ad esempio, la computer vision è un ramo dell'IA che insegna alle macchine a comprendere immagini e video. I modelli di computer vision come Ultralytics YOLO26 supportano attività come il rilevamento di oggetti, la segmentazione di istanze e la classificazione di immagini.

Possono essere utilizzati in molti settori per applicazioni come il monitoraggio dei pazienti, l'analisi del traffico, il checkout automatizzato e l'ispezione di qualità nella produzione. Tuttavia, anche con modelli avanzati e dati di addestramento di alta qualità, le soluzioni di vision AI possono ancora avere difficoltà una volta affrontate variazioni del mondo reale come cambiamenti di illuminazione, movimento o oggetti parzialmente ostruiti.

Questo accade perché i modelli imparano dagli esempi che vengono forniti durante l'addestramento. Se non hanno mai visto condizioni come abbagliamento, motion blur o visibilità parziale, hanno meno probabilità di riconoscere correttamente gli oggetti in quegli scenari.

Un modo per migliorare la robustezza del modello è attraverso la data augmentation. Invece di raccogliere grandi quantità di nuovi dati, gli ingegneri possono apportare piccole e significative modifiche alle immagini esistenti, come regolare l'illuminazione, ritagliare o mescolare le immagini. Questo aiuta il modello a imparare a riconoscere gli stessi oggetti in una gamma più ampia di situazioni.

In questo articolo esploreremo come la data augmentation migliori la robustezza del modello e l'affidabilità dei sistemi di vision AI quando distribuiti al di fuori di contesti controllati. Iniziamo!

Link to this sectionCome verificare la robustezza di un modello#

Prima di addentrarci nella data augmentation, discutiamo di come capire se un computer vision model è davvero pronto per l'uso nel mondo reale.

Un modello robusto continua a funzionare bene anche quando le condizioni cambiano, invece di funzionare solo su immagini pulite e perfettamente etichettate. Ecco alcuni fattori pratici da considerare quando si valuta la robustezza del modello IA:

  • Cambiamenti di illuminazione: I modelli possono comportarsi in modo diverso se esposti a luce intensa, luce scarsa, abbagliamento o ombre, il che può influire sulla sicurezza con cui vengono rilevati gli oggetti.
  • Occlusione parziale: Nelle scene quotidiane, gli oggetti sono spesso bloccati da altri elementi o sono solo parzialmente visibili. Un modello più robusto è in grado di riconoscerli anche con informazioni visive mancanti.
  • Scene affollate: Ambienti con molti oggetti sovrapposti possono rendere il rilevamento più impegnativo. I modelli che funzionano bene in questi casi sono in genere più affidabili in contesti complessi.

Buoni risultati su immagini pulite e perfettamente catturate non si traducono sempre in prestazioni solide nel mondo reale. Un test regolare in condizioni variabili aiuta a mostrare quanto bene un modello regge una volta distribuito.

Link to this sectionCos'è la data augmentation?#

Il modo in cui un oggetto appare in una foto può cambiare a seconda dell'illuminazione, dell'angolazione, della distanza o dello sfondo. Quando un modello di computer vision viene addestrato, il dataset da cui impara deve includere questo tipo di variazione in modo che possa funzionare bene in ambienti imprevedibili.

La data augmentation espande un dataset di addestramento creando esempi aggiuntivi dalle immagini che già possiedi. Questo viene fatto applicando cambiamenti intenzionali come ruotare o capovolgere un'immagine, regolare la luminosità o ritagliarne una parte.

Ad esempio, immagina di avere solo una foto di un gatto. Se ruoti l'immagine o ne cambi la luminosità, puoi creare diverse nuove versioni da quella singola immagine. Ogni versione sembra leggermente diversa, ma è comunque una foto dello stesso gatto. Queste variazioni aiutano a insegnare al modello che un oggetto può apparire diverso pur essendo la stessa cosa.

Uno sguardo all'aumento di un'immagine di un gatto

Fig 1. Uno sguardo all'aumento di un'immagine di un gatto (Source)

Link to this sectionCome la data augmentation migliora le prestazioni del modello#

Durante l'addestramento del modello, la data augmentation può essere integrata direttamente nella pipeline di addestramento. Invece di creare e memorizzare manualmente nuove copie di immagini, è possibile applicare trasformazioni casuali ogni volta che un'immagine viene caricata.

Ciò significa che il modello vede una versione leggermente diversa dell'immagine ogni volta, che appaia più luminosa, capovolta o parzialmente nascosta. Tecniche come il random erasing possono persino rimuovere piccole regioni dell'immagine per simulare situazioni del mondo reale in cui un oggetto è bloccato o solo parzialmente visibile.

Esempi di aumento basato su random erasing

Fig 2. Esempi di data augmentation basata su random erasing (Source)

Vedere molte versioni diverse della stessa immagine rende possibile per il modello imparare quali caratteristiche sono importanti, piuttosto che dipendere da un unico esempio perfetto. Questa varietà costruisce la robustezza del modello IA in modo che possa funzionare in modo più affidabile in condizioni del mondo reale.

Link to this sectionTecniche comuni di data augmentation#

Ecco alcune tecniche di data augmentation utilizzate per introdurre variazione nelle immagini di addestramento:

  • Trasformazioni geometriche: Queste tecniche cambiano l'aspetto spaziale di un oggetto all'interno di un'immagine. Ruotare, capovolgere, ridimensionare, ritagliare o spostare un'immagine consente al modello di capire come un oggetto può essere visualizzato da diverse angolazioni o distanze.
  • Regolazioni di colore e illuminazione: L'illuminazione nel mondo reale è raramente coerente. Le immagini possono essere troppo luminose, troppo scure o leggermente alterate nel colore, a seconda dell'ambiente o della fotocamera utilizzata. Regolare luminosità, contrasto, tonalità e saturazione consente ai modelli di gestire questi cambiamenti visivi e funzionare bene in scene diverse.
  • Variazioni della qualità dell'immagine: La sfocatura o il rumore visivo possono rendere le immagini poco chiare. Aggiungere sfocatura o rumore durante l'addestramento aiuta il modello a imparare a far fronte al motion blur, a immagini in condizioni di scarsa illuminazione o a risultati di fotocamere di qualità inferiore, rendendolo meno sensibile a difetti visivi.
  • Augmentation basate su occlusione: Negli ambienti reali, gli oggetti sono spesso parzialmente bloccati da altri oggetti. Questo viene definito come occlusione dell'immagine. Nascondere o mascherare piccole aree di un'immagine durante l'addestramento supporta il modello nell'imparare a rilevare gli oggetti anche quando ne è visibile solo una parte.
  • Augmentation multi-immagine: Queste tecniche combinano parti di più immagini in un unico esempio di addestramento, il che può aumentare il numero di oggetti in vista e migliorare la capacità del modello di gestire scene complesse o affollate.

Un esempio di aumento multi-immagine

Fig 3. Un esempio di augmentation multi-immagine (Source)

Link to this sectionData augmentation resa facile con il pacchetto Python Ultralytics#

Gestire dataset, creare variazioni di immagini e scrivere codice di trasformazione può aggiungere passaggi extra alla costruzione di un'applicazione di computer vision. Il pacchetto Python Ultralytics aiuta a semplificare questo processo fornendo un'unica interfaccia per l'addestramento, l'esecuzione e la distribuzione di modelli Ultralytics YOLO come YOLO26. Come parte di questo sforzo per semplificare i flussi di lavoro di addestramento, il pacchetto include una data augmentation integrata e testata da Ultralytics, ottimizzata per i modelli YOLO.

Supporta inoltre utili integrazioni che eliminano la necessità di strumenti separati o codice personalizzato. Nello specifico, per la data augmentation, il pacchetto si integra con Albumentations, una libreria di augmentation delle immagini ampiamente utilizzata. Questa integrazione consente di applicare le augmentation automaticamente durante l'addestramento, senza bisogno di script aggiuntivi o codice personalizzato.

Link to this sectionGestione delle annotazioni e dei dataset aumentati#

Un altro fattore che influisce sulla robustezza del modello è la qualità dell'annotazione. Etichette pulite e precise, create e gestite con strumenti di annotazione come Roboflow, aiutano il modello a capire dove si trovano gli oggetti e che aspetto hanno.

Durante l'addestramento, le data augmentation come capovolgimenti, ritagli e rotazioni vengono applicate dinamicamente e le annotazioni vengono regolate automaticamente per corrispondere a questi cambiamenti. Quando le etichette sono precise, questo processo funziona senza problemi e fornisce al modello molti esempi realistici della stessa scena.

Se le annotazioni sono imprecise o incoerenti, tali errori possono finire per essere ripetuti su immagini aumentate, il che può rendere l'addestramento meno efficace. Iniziare con annotazioni accurate impedisce a questi errori di diffondersi e contribuisce a una migliore robustezza del modello.

Link to this sectionMigliorare le applicazioni di vision AI con la data augmentation#

Ora, esaminiamo esempi di come la data augmentation contribuisca alla robustezza del modello IA nelle applicazioni del mondo reale.

Link to this sectionAumentare la precisione del rilevamento di oggetti in ambienti reali#

Le immagini sintetiche sono spesso utilizzate per addestrare sistemi di object detection quando i dati reali sono limitati, sensibili o difficili da raccogliere. Consentono ai team di generare rapidamente esempi di prodotti, ambienti e angolazioni della telecamera senza dover catturare ogni scenario nella vita reale.

Tuttavia, i dataset sintetici possono a volte sembrare troppo puliti rispetto ai filmati del mondo reale, dove l'illuminazione cambia, gli oggetti si sovrappongono e le scene includono rumore di fondo. La data augmentation aiuta a colmare questo divario introducendo variazioni realistiche, come diverse illuminazioni, rumore o posizionamento degli oggetti, in modo che il modello impari a gestire i tipi di condizioni che vedrà una volta distribuito.

Ad esempio, in un recente studio, un modello YOLO11 è stato addestrato interamente su immagini sintetiche ed è stata aggiunta la data augmentation per introdurre una variazione extra. Ciò ha giocato un ruolo nel far sì che il modello imparasse a riconoscere gli oggetti in modo più ampio. Ha ottenuto buone prestazioni quando testato su immagini reali, anche se non aveva mai visto dati del mondo reale durante l'addestramento.

Link to this sectionRendere più affidabili le soluzioni di imaging medico#

I dataset di imaging medico sono spesso limitati e le scansioni stesse possono variare in base al tipo di attrezzatura, alle impostazioni di imaging o all'ambiente clinico. Differenze nell'anatomia del paziente, angolazioni, illuminazione o rumore visivo possono rendere difficile per i modelli di computer vision imparare pattern che si generalizzano bene tra pazienti e ospedali.

La data augmentation aiuta ad affrontare questo problema creando molteplici variazioni della stessa scansione durante l'addestramento, come l'aggiunta di rumore, lo spostamento leggero dell'immagine o l'applicazione di piccole distorsioni. Questi cambiamenti rendono i dati di addestramento più rappresentativi delle condizioni cliniche reali.

Ad esempio, in uno studio di imaging pediatrico, i ricercatori hanno utilizzato YOLO11 per la segmentazione anatomica e lo hanno addestrato su dati medici aumentati. Hanno introdotto variazioni come rumore aggiunto, lievi spostamenti di posizione e piccole distorsioni per rendere le immagini più realistiche.

Immagini mediche pediatriche originali e aumentate

Fig 4. Immagini mediche pediatriche originali e aumentate (Source)

Imparando da queste variazioni, il modello si è concentrato su caratteristiche anatomiche significative piuttosto che su differenze superficiali. Ciò ha reso i suoi risultati di segmentazione più stabili tra scansioni e casi di pazienti diversi.

Link to this sectionPunti chiave#

Raccogliere dati diversi è difficile, ma la data augmentation consente ai modelli di imparare da una gamma più ampia di condizioni visive. Ciò si traduce in una maggiore robustezza del modello quando si ha a che fare con occlusioni, cambiamenti di illuminazione e scene affollate. Nel complesso, questo li aiuta a funzionare in modo più affidabile al di fuori degli ambienti di addestramento controllati.

Unisciti alla nostra community ed esplora le ultime novità sulla vision AI nel nostro repository GitHub. Visita le nostre pagine dedicate alle soluzioni per scoprire come applicazioni come l'IA nella produzione e la computer vision nell'assistenza sanitaria stiano guidando il progresso e dai un'occhiata alle nostre opzioni di licenza per potenziare la tua prossima soluzione di IA.

Explore solutions

Real-time AI that works with your team

AI nella Robotica

Potenzia macchine più intelligenti con i modelli Ultralytics YOLO. La Vision AI nella robotica guida la navigazione autonoma, la percezione, il tracciamento degli oggetti e il controllo in tempo reale.
Scopri di più
Real-time AI that works with your team

IA nella logistica

Semplifica la logistica con i modelli Ultralytics YOLO. La Vision AI abilita l'ispezione dei pacchi, lo smistamento, il tracciamento dei veicoli e il monitoraggio della sicurezza in magazzino in tempo reale.
Scopri di più
Real-time AI that works with your team

AI nel settore Retail

Reimmagina il retail con i modelli Ultralytics YOLO. La Vision AI alimenta il tracciamento dell'inventario, il monitoraggio degli scaffali, la gestione delle code e insight più intelligenti sui clienti.
Scopri di più
Real-time AI that works with your team

IA nel settore sanitario

Crea soluzioni sanitarie con i modelli Ultralytics YOLO. La vision AI nella sanità potenzia l'imaging medico più rapido, diagnosi più intelligenti e il monitoraggio dei pazienti.
Scopri di più
Real-time AI that works with your team

IA nella produzione

Ottimizza la produzione con i modelli Ultralytics YOLO. La Vision AI guida il controllo qualità, il rilevamento dei difetti, la conformità ai DPI e l'automazione della linea di assemblaggio.
Scopri di più
Real-time AI that works with your operation

AI nel settore automobilistico

Applica la computer vision al settore automobilistico con i modelli Ultralytics YOLO. La vision AI migliora la sicurezza stradale, l'assistenza alla guida e l'automazione dei veicoli per strade più intelligenti.
Scopri di più
Real-time AI tailored to your operation

AI in Agricoltura

Porta la vision AI nell'agricoltura intelligente con i modelli Ultralytics YOLO. Potenzia il monitoraggio delle colture, il tracciamento del bestiame e l'agricoltura di precisione per rese più elevate e intelligenti.
Scopri di più
Real-time AI that works with your team

AI nella Robotica

Potenzia macchine più intelligenti con i modelli Ultralytics YOLO. La Vision AI nella robotica guida la navigazione autonoma, la percezione, il tracciamento degli oggetti e il controllo in tempo reale.
Scopri di più
Real-time AI that works with your team

IA nella logistica

Semplifica la logistica con i modelli Ultralytics YOLO. La Vision AI abilita l'ispezione dei pacchi, lo smistamento, il tracciamento dei veicoli e il monitoraggio della sicurezza in magazzino in tempo reale.
Scopri di più
Real-time AI that works with your team

AI nel settore Retail

Reimmagina il retail con i modelli Ultralytics YOLO. La Vision AI alimenta il tracciamento dell'inventario, il monitoraggio degli scaffali, la gestione delle code e insight più intelligenti sui clienti.
Scopri di più
Real-time AI that works with your team

IA nel settore sanitario

Crea soluzioni sanitarie con i modelli Ultralytics YOLO. La vision AI nella sanità potenzia l'imaging medico più rapido, diagnosi più intelligenti e il monitoraggio dei pazienti.
Scopri di più
Real-time AI that works with your team

IA nella produzione

Ottimizza la produzione con i modelli Ultralytics YOLO. La Vision AI guida il controllo qualità, il rilevamento dei difetti, la conformità ai DPI e l'automazione della linea di assemblaggio.
Scopri di più
Real-time AI that works with your operation

AI nel settore automobilistico

Applica la computer vision al settore automobilistico con i modelli Ultralytics YOLO. La vision AI migliora la sicurezza stradale, l'assistenza alla guida e l'automazione dei veicoli per strade più intelligenti.
Scopri di più
Real-time AI tailored to your operation

AI in Agricoltura

Porta la vision AI nell'agricoltura intelligente con i modelli Ultralytics YOLO. Potenzia il monitoraggio delle colture, il tracciamento del bestiame e l'agricoltura di precisione per rese più elevate e intelligenti.
Scopri di più
Real-time AI that works with your team

AI nella Robotica

Potenzia macchine più intelligenti con i modelli Ultralytics YOLO. La Vision AI nella robotica guida la navigazione autonoma, la percezione, il tracciamento degli oggetti e il controllo in tempo reale.
Scopri di più
Real-time AI that works with your team

IA nella logistica

Semplifica la logistica con i modelli Ultralytics YOLO. La Vision AI abilita l'ispezione dei pacchi, lo smistamento, il tracciamento dei veicoli e il monitoraggio della sicurezza in magazzino in tempo reale.
Scopri di più
Real-time AI that works with your team

AI nel settore Retail

Reimmagina il retail con i modelli Ultralytics YOLO. La Vision AI alimenta il tracciamento dell'inventario, il monitoraggio degli scaffali, la gestione delle code e insight più intelligenti sui clienti.
Scopri di più
Real-time AI that works with your team

IA nel settore sanitario

Crea soluzioni sanitarie con i modelli Ultralytics YOLO. La vision AI nella sanità potenzia l'imaging medico più rapido, diagnosi più intelligenti e il monitoraggio dei pazienti.
Scopri di più
Real-time AI that works with your team

IA nella produzione

Ottimizza la produzione con i modelli Ultralytics YOLO. La Vision AI guida il controllo qualità, il rilevamento dei difetti, la conformità ai DPI e l'automazione della linea di assemblaggio.
Scopri di più
Real-time AI that works with your operation

AI nel settore automobilistico

Applica la computer vision al settore automobilistico con i modelli Ultralytics YOLO. La vision AI migliora la sicurezza stradale, l'assistenza alla guida e l'automazione dei veicoli per strade più intelligenti.
Scopri di più
Real-time AI tailored to your operation

AI in Agricoltura

Porta la vision AI nell'agricoltura intelligente con i modelli Ultralytics YOLO. Potenzia il monitoraggio delle colture, il tracciamento del bestiame e l'agricoltura di precisione per rese più elevate e intelligenti.
Scopri di più

Costruiamo insieme il futuro dell'AI!

Inizia il tuo viaggio con il futuro del machine learning