Utilizzare le aumentazioni di Albumentations per diversificare i tuoi dati
Scopri come usare Albumentations per le aumentazioni quando addestri in modo personalizzato Ultralytics YOLO11 per migliorare le prestazioni del modello con dati di addestramento diversificati.

Quando sviluppi una soluzione di computer vision, raccogliere un set diversificato di immagini per l'addestramento di modelli di AI per la visione può essere una parte cruciale del processo. Spesso richiede molto tempo e denaro e, a volte, le immagini raccolte non sono ancora abbastanza varie per permettere ai modelli di apprendere in modo efficace.
Ad esempio, i modelli di computer vision come Ultralytics YOLO11 possono essere addestrati su misura su dataset di immagini per varie attività di computer vision legate a diverse applicazioni. Dati diversificati sono fondamentali perché aiutano il modello a generalizzare meglio, consentendogli di riconoscere oggetti e pattern in un'ampia gamma di scenari reali.
Se hai difficoltà a causa della mancanza di dati diversificati, le tecniche di data augmentation per immagini possono essere un'ottima soluzione. Metodi come la rotazione, il ribaltamento e la regolazione della luminosità possono aiutare ad aumentare la varietà del tuo dataset, migliorando la capacità del modello di gestire una gamma più ampia di condizioni.
Ecco perché Ultralytics supporta un'integrazione per la data augmentation delle immagini. Utilizzando Albumentations, uno strumento popolare che offre una raccolta di trasformazioni, puoi creare dati visivi diversificati. Questa integrazione semplifica il processo di addestramento di YOLO11 aumentando automaticamente le immagini di addestramento, portando a prestazioni migliori del modello.
In questo articolo, esploreremo come puoi utilizzare l'integrazione di Albumentations, i suoi vantaggi e il suo impatto sull'addestramento del modello.
Link to this sectionCos'è Albumentations?#
I modelli di computer vision possono imparare da un'ampia gamma di immagini di alta qualità per riconoscere oggetti in diversi ambienti. La raccolta di grandi dataset da fonti reali può essere lenta, costosa e inefficiente. Per semplificare questo compito, puoi utilizzare la data augmentation delle immagini per creare nuove variazioni di immagini esistenti, aiutando i modelli a imparare da scenari diversi senza dover raccogliere ulteriori dati.
Nello specifico, puoi sfruttare Albumentations, una libreria open-source introdotta per un'efficiente data augmentation delle immagini nel 2018. Supporta una varietà di operazioni, da semplici cambiamenti geometrici come rotazioni e ribaltamenti a regolazioni più complesse come luminosità, contrasto e aggiunta di rumore.

Fig 1. Esempi di diversi tipi di data augmentation delle immagini.
Link to this sectionCaratteristiche principali di Albumentations#
Albumentations è nota per le sue alte prestazioni, il che significa che può elaborare le immagini in modo rapido ed efficiente. Costruita su librerie ottimizzate come OpenCV e NumPy, gestisce grandi dataset con tempi di elaborazione minimi, rendendola ideale per una veloce data augmentation durante l'addestramento del modello.
Ecco alcune altre caratteristiche chiave di Albumentations:
- Ampia gamma di trasformazioni: Albumentations fornisce oltre 70 tipi di aumentazioni. Queste variazioni aiutano i modelli a imparare a rilevare oggetti nonostante i cambiamenti di illuminazione, angolazioni o sfondi.
- Ottimizzata per la velocità: Utilizza tecniche di ottimizzazione avanzate come SIMD (Single Instruction, Multiple Data), che elabora più punti dati contemporaneamente per velocizzare l'aumentazione delle immagini e gestire grandi dataset in modo efficiente.
- Tre livelli di aumentazioni: Migliora i dati in tre modi. Ad esempio, le aumentazioni a livello di pixel regolano la luminosità e il colore senza alterare gli oggetti. Nel frattempo, le aumentazioni a livello spaziale modificano il posizionamento degli oggetti preservando i dettagli chiave, e le aumentazioni a livello di mix mescolano parti di immagini diverse per creare nuovi campioni.
Link to this sectionPerché dovresti usare l'integrazione di Albumentations?#
Potresti chiederti: ci sono molti modi per applicare le aumentazioni a un dataset, e potresti persino crearne di tue usando strumenti come OpenCV. Allora, perché scegliere un'integrazione che supporta una libreria come Albumentations?
Creare manualmente le aumentazioni con strumenti come OpenCV può richiedere molto tempo e necessita di una certa esperienza. Può anche essere complicato mettere a punto le trasformazioni per ottenere i migliori risultati. L'integrazione di Albumentations rende questo processo più semplice. Offre molte trasformazioni pronte all'uso che possono farti risparmiare tempo e fatica durante la preparazione del tuo dataset.
Un altro motivo per scegliere l'integrazione di Albumentations è che funziona senza problemi con la pipeline di addestramento del modello di Ultralytics. Rende molto più semplice addestrare su misura YOLO11, poiché le aumentazioni vengono applicate automaticamente durante l'addestramento. Semplifica il processo, così puoi concentrarti maggiormente sul miglioramento del tuo modello piuttosto che sulla gestione della preparazione dei dati.
Link to this sectionIniziare con l'integrazione di Albumentations#
È interessante notare che utilizzare l'integrazione di Albumentations per addestrare YOLO11 è più semplice di quanto possa sembrare. Una volta configurate le librerie corrette, l'integrazione applica automaticamente le data augmentation delle immagini durante l'addestramento. Aiuta il modello a imparare da diverse variazioni di immagini utilizzando lo stesso dataset.
Ora, vediamo come installare e utilizzare l'integrazione di Albumentations durante l'addestramento su misura di YOLO11.
Link to this sectionInstallazione del pacchetto Python di Ultralytics e di Albumentations#
Prima di applicare le aumentazioni, è necessario installare sia il pacchetto Python di Ultralytics che Albumentations. L'integrazione è stata creata in modo che entrambe le librerie funzionino insieme senza problemi per impostazione predefinita, quindi non devi preoccuparti di configurazioni complesse.
L'intero processo di installazione può essere completato in pochi minuti con un singolo comando pip, che è uno strumento di gestione dei pacchetti per l'installazione di librerie Python, come mostrato nell'immagine sottostante.

Fig 2. Installazione di Ultralytics e Albumentations.
Una volta installata Albumentations, la modalità di addestramento del modello Ultralytics applica automaticamente le aumentazioni delle immagini durante l'addestramento. Se Albumentations non è installata, queste aumentazioni non verranno applicate. Per maggiori dettagli, puoi fare riferimento alla documentazione ufficiale di Ultralytics.
Link to this sectionAddestramento di YOLO11 con l'aiuto dell'integrazione di Albumentations#
Cerchiamo di capire meglio cosa succede dietro le quinte dell'integrazione di Albumentations.
Ecco uno sguardo più da vicino alle aumentazioni applicate durante l'addestramento di YOLO11:
- Sfocatura: Questa trasformazione aggiunge una leggera sfocatura a un'immagine. Aiuta il modello a rilevare gli oggetti anche quando sono fuori fuoco.
- Sfocatura mediana: Riduce il rumore casuale preservando i bordi degli oggetti in un'immagine. Ciò rende più facile per il modello rilevare gli oggetti in ambienti complessi.
- Scala di grigi: Convertendo un'immagine in bianco e nero, questa aumentazione può aiutare il modello a concentrarsi su forme e texture invece che sui colori.
- CLAHE (Contrast limited adaptive histogram equalization): Questa aumentazione aumenta il contrasto nelle immagini, in particolare nelle aree troppo scure o difficili da vedere, come in condizioni di scarsa illuminazione o foschia. Questo rende gli oggetti in quelle aree più chiari e facili da identificare per il modello.

Fig 3. Un esempio di un'aumentazione in scala di grigi applicata all'immagine di un gatto.
Link to this sectionApplicazioni di YOLO11 e dell'integrazione di Albumentations#
Se stai addestrando su misura YOLO11 per un'applicazione specifica, l'integrazione di Albumentations può aiutare a migliorare le prestazioni del modello adattandolo a varie condizioni. Discutiamo di alcune applicazioni reali e delle sfide che questa integrazione può risolvere.
Link to this sectionMigliorare l'imaging medico#
La Vision AI nel settore sanitario sta aiutando i medici ad analizzare le immagini mediche in modo più accurato per assistere nelle diagnosi e migliorare la cura del paziente. Infatti, circa un quinto delle organizzazioni sanitarie sta già utilizzando soluzioni di AI.
Tuttavia, la creazione di queste soluzioni di computer vision comporta una serie di sfide. Le scansioni mediche possono variare notevolmente tra gli ospedali, influenzate da fattori come diverse attrezzature, impostazioni e persino l'esperienza dei tecnici. Le variazioni di luminosità, contrasto ed esposizione possono influire sulla coerenza e sull'accuratezza dei modelli di Vision AI, rendendo difficile per loro funzionare in modo affidabile in diversi ambienti.
È qui che diventa essenziale l'integrazione di strumenti come Albumentations. Generando più versioni aumentate della stessa scansione, Albumentations consente al modello di imparare da una varietà di qualità d'immagine. Ciò aiuta il modello a diventare più robusto, consentendogli di rilevare le malattie con precisione sia in immagini di alta che di bassa qualità.

Fig 4. Immagini a raggi X aumentate.
Link to this sectionMigliorare la sicurezza e la sorveglianza#
Un'altra interessante applicazione della Vision AI è nella sicurezza e nella sorveglianza. Il rilevamento di oggetti in tempo reale può aiutare i team di sicurezza a identificare rapidamente potenziali minacce.
Una preoccupazione primaria legata a questa applicazione è che le telecamere di sicurezza catturano filmati in varie condizioni di illuminazione durante il giorno, e queste condizioni possono influenzare drasticamente il modo in cui un modello comprende tali immagini. Fattori come ambienti a scarsa illuminazione, riflessi o scarsa visibilità possono rendere difficile per i modelli di computer vision rilevare oggetti o riconoscere potenziali minacce in modo coerente.
L'integrazione di Albumentations aiuta applicando trasformazioni per simulare diverse condizioni di illuminazione. Questo permette al modello di imparare a rilevare oggetti sia in ambienti luminosi che in quelli a scarsa illuminazione, rendendolo più affidabile e migliorando i tempi di risposta in condizioni difficili.
Link to this sectionRidefinire i flussi di lavoro nel settore retail e l'esperienza del cliente#
Una fuoriuscita in una corsia del supermercato, un cane che corre in un negozio o un bambino che rovescia l'espositore di un prodotto sono solo alcuni esempi di eventi quotidiani che possono rappresentare casi limite per la Vision AI negli ambienti retail. La computer vision viene sempre più utilizzata per migliorare l'esperienza del cliente monitorando il comportamento degli acquirenti, il traffico pedonale e identificando i prodotti sugli scaffali. Tuttavia, queste situazioni reali possono essere difficili da comprendere ed elaborare accuratamente per i sistemi di AI.
Sebbene non ogni scenario possa essere rappresentato in un dataset di computer vision, l'integrazione di Albumentations aiuta aumentando i dati per coprire molte situazioni possibili, come illuminazione imprevista, angolazioni insolite o ostruzioni. Questo aiuta i modelli di computer vision ad adattarsi a varie condizioni, migliorando la loro capacità di gestire casi limite e fare previsioni accurate in ambienti retail dinamici.
Link to this sectionPunti chiave#
La raccolta di dati reali diversificati per l'addestramento del modello può essere complicata, ma Albumentations la rende più semplice creando variazioni di immagini che aiutano i modelli ad adattarsi a condizioni diverse.
L'integrazione di Albumentations supportata da Ultralytics semplifica il processo di applicazione di queste aumentazioni durante l'addestramento su misura di YOLO11. Ciò si traduce in una migliore qualità del dataset, a vantaggio di una vasta gamma di settori producendo modelli di Vision AI più accurati e affidabili.
Unisciti alla nostra community ed esplora il nostro repository GitHub per saperne di più sull'AI, e dai un'occhiata alle nostre opzioni di licenza per dare il via ai tuoi progetti di Vision AI. Interessato a innovazioni come l'AI nella produzione o la computer vision nella guida autonoma? Visita le nostre pagine dedicate alle soluzioni per scoprirne di più.






