Addestramento personalizzato di Ultralytics YOLO11 con set di dati di computer vision

Abirami Vina

4 minuti di lettura

7 gennaio 2025

Scoprite come l'integrazione di Roboflow può semplificare l'addestramento personalizzato di Ultralytics YOLO11 rendendo facilmente accessibili i dataset di computer vision open-source.

L'addestramento di un modello di computer vision come Ultralytics YOLO11 comporta in genere la raccolta di immagini per il set di dati, la loro annotazione, la preparazione dei dati e la messa a punto del modello per soddisfare i requisiti specifici. Sebbene il pacchetto Python di Ultralytics renda questi passaggi semplici e intuitivi, lo sviluppo di Vision AI può comunque richiedere molto tempo.

Ciò è particolarmente vero quando si lavora in tempi stretti o si sviluppa un prototipo. In queste situazioni, disporre di strumenti o integrazioni che semplificano parti del processo, come la preparazione dei set di dati o l'automazione di attività ripetitive, può fare una grande differenza. Riducendo il tempo e l'impegno necessari, queste soluzioni consentono di concentrarsi sulla costruzione e sul perfezionamento del modello. Questo è esattamente ciò che offre l'integrazione Roboflow.

L'integrazione con Roboflow consente di accedere facilmente ai set di dati di Roboflow Universe, un'ampia libreria di set di dati open-source per la computer vision. Invece di passare ore a raccogliere e organizzare i dati, è possibile trovare e utilizzare rapidamente i set di dati esistenti per avviare il processo di formazione di YOLO11. Questa integrazione rende molto più veloce e semplice la sperimentazione e l'iterazione dello sviluppo del modello di computer vision.

In questo articolo vedremo come sfruttare l'integrazione con Roboflow per accelerare lo sviluppo dei modelli. Iniziamo!

Che cos'è l'Universo Roboflow?

Roboflow Universe è una piattaforma gestita da Roboflow, un'azienda che si occupa di semplificare lo sviluppo della computer vision. Contiene oltre 350 milioni di immagini, 500.000 set di dati e 100.000 modelli ottimizzati per compiti come il rilevamento di oggetti, la classificazione di immagini e la segmentazione. Con i contributi di sviluppatori e ricercatori di tutto il mondo, Roboflow Universe è un centro di collaborazione per chiunque voglia avviare o migliorare i propri progetti di computer vision.

Figura 1. Esempi di set di dati per il rilevamento di oggetti su Roboflow Universe.

Roboflow Universe include le seguenti caratteristiche chiave:

  • Strumenti di esplorazione dei dataset: Esplorare, filtrare e visualizzare i set di dati per trovare rapidamente le risorse che soddisfano i requisiti del progetto.
  • Opzioni di esportazione: Esportazione dei dati in formati come COCO, YOLO, TFRecord, CSV e altri ancora per adattarsi al flusso di lavoro.
  • Analisi dei set di dati: Ottenere informazioni su vari set di dati con strumenti di analisi che forniscono visualizzazioni delle distribuzioni delle etichette, degli squilibri tra le classi e della qualità del set di dati.
  • Tracciamento delle versioni: Visualizzazione e accesso a diverse versioni dei set di dati caricati dai collaboratori, che consentono di monitorare gli aggiornamenti, confrontare le modifiche e scegliere la versione più adatta alle esigenze del progetto. 

L'integrazione di Roboflow vi aiuta a trovare i dati giusti

Trovare il set di dati giusto è spesso una delle parti più impegnative della costruzione di un modello di computer vision. La creazione di un set di dati comporta di solito la raccolta di grandi quantità di immagini, l'accertamento della loro pertinenza con il compito da svolgere e l'etichettatura accurata. 

Questo processo può richiedere molto tempo e risorse, soprattutto se si stanno sperimentando diversi approcci in un breve periodo. Anche il reperimento di set di dati preesistenti può essere complicato, perché spesso sono sparsi tra le varie piattaforme, non sono documentati correttamente o mancano delle annotazioni specifiche necessarie.

Ad esempio, se state costruendo un'applicazione di visione artificiale per rilevare le erbacce nei campi agricoli, potreste voler testare diversi approcci di Vision AI, come il rilevamento degli oggetti rispetto alla segmentazione delle istanze. In questo modo è possibile sperimentare e capire quale metodo funziona meglio prima di dedicare tempo e fatica alla raccolta e all'etichettatura del proprio set di dati.

Figura 2. Rilevamento di parti di automobili con YOLO11.

Grazie all'integrazione con Roboflow, è possibile sfogliare una serie di set di dati relativi all'agricoltura, tra cui quelli incentrati sul rilevamento delle erbe infestanti, sulla salute delle colture o sul monitoraggio dei campi. Questi set di dati pronti all'uso consentono di provare diverse tecniche e di perfezionare il modello senza dover creare i propri dati. 

Come funziona l'integrazione di Roboflow

Dopo aver discusso su come utilizzare l'integrazione Roboflow per trovare i set di dati giusti, vediamo come si inserisce nel flusso di lavoro. Una volta scelto un set di dati da Roboflow Universe, è possibile esportarlo o scaricarlo nel formato YOLO11. Una volta esportato il set di dati, è possibile utilizzarlo per addestrare YOLO11 utilizzando il pacchetto Ultralytics Python. 

Durante il download del set di dati, si può notare che Roboflow Universe supporta anche altri formati per l'addestramento di modelli diversi. Quindi, perché scegliere di addestrare Ultralytics YOLO11? 

YOLO11 è l'ultima versione dei modelli YOLO di Ultralytics ed è stata sviluppata per offrire un rilevamento degli oggetti più rapido e preciso. Utilizza il 22% in meno di parametri (i valori interni che un modello regola durante l'addestramento per fare previsioni) rispetto a YOLOv8m, ma raggiunge una precisione media superiore (mAP) sul set di dati COCO. Questo equilibrio tra velocità e precisione rende YOLO11 una scelta versatile per un'ampia gamma di applicazioni di computer vision, soprattutto quando si tratta di addestrare modelli personalizzati per soddisfare compiti specifici.

Ecco un approfondimento su come funziona l 'allenamento personalizzato YOLO11:

  • Alimentazione dei dati: Il modello YOLO11 elabora il set di dati, imparando a rilevare e classificare gli oggetti dalle immagini e dalle loro annotazioni.
  • Previsione e feedback: Il modello fa previsioni sugli oggetti presenti nelle immagini e le confronta con le risposte corrette fornite nel dataset.
  • Monitoraggio delle prestazioni: Metriche come precisione (rilevamenti corretti), richiamo (rilevamenti mancati) e perdita (errori di previsione) vengono monitorate per valutare i progressi.
  • Apprendimento iterativo: Il modello regola i suoi parametri in più round (epoche) per migliorare l'accuratezza del rilevamento e minimizzare gli errori.
  • Output finale del modello: Dopo l'addestramento, il modello ottimizzato viene salvato ed è pronto per essere distribuito.

Altre integrazioni incentrate sullo sviluppo della visione artificiale

Esplorando l'integrazione Roboflow, noterete altre integrazioni menzionate nella documentazione di Ultralytics. Supportiamo una serie di integrazioni relative a varie fasi dello sviluppo della computer vision. 

Questo per fornire alla nostra comunità una gamma di opzioni, in modo che possiate scegliere ciò che funziona meglio per il vostro specifico flusso di lavoro.

Figura 3. Panoramica delle integrazioni supportate da Ultralytics.

Oltre ai set di dati, altre integrazioni supportate da Ultralytics si concentrano su varie parti del processo di computer vision, come l'addestramento, la distribuzione e l'ottimizzazione. Ecco alcuni esempi di altre integrazioni che supportiamo:

  • Integrazioni per la formazione: Integrazioni come Amazon SageMaker e Paperspace Gradient semplificano i flussi di lavoro della formazione offrendo piattaforme basate sul cloud per lo sviluppo e il test efficiente dei modelli.
  • Integrazioni per il monitoraggio dei flussi di lavoro e degli esperimenti: ClearML, MLFlow e Weights & Biases (W&B) aiutano ad automatizzare i flussi di lavoro, a tracciare gli esperimenti e a migliorare la collaborazione, rendendo più semplice la gestione dei progetti di apprendimento automatico.
  • Ottimizzazione e integrazioni di distribuzione: CoreML, ONNX e OpenVINO consentono una distribuzione ottimizzata su vari dispositivi e framework, garantendo prestazioni efficienti su piattaforme come l'hardware Apple e le CPU Intel.
  • Integrazioni per il monitoraggio e la visualizzazione: TensorBoard e Weights & Biases forniscono strumenti per visualizzare i progressi dell'addestramento e monitorare le prestazioni, fornendo informazioni dettagliate per affinare i modelli.

Applicazioni YOLO11 e ruolo delle integrazioni

Le integrazioni che supportano lo sviluppo della computer vision, combinate con le affidabili capacità di YOLO11, rendono più facile risolvere le sfide del mondo reale. Si pensi a innovazioni come la computer vision nel settore manifatturiero, dove l'intelligenza artificiale viene utilizzata per rilevare i difetti su una linea di produzione, come graffi su parti metalliche o componenti mancanti. La raccolta dei dati giusti per queste attività può essere spesso lenta e impegnativa e richiede l'accesso ad ambienti specializzati. 

In genere si tratta di installare telecamere o sensori lungo le linee di produzione per acquisire immagini dei prodotti. Queste immagini devono essere scattate in grandi volumi, spesso in condizioni di illuminazione e angolazioni costanti, per garantire chiarezza e uniformità. 

Una volta acquisite, le immagini devono essere meticolosamente annotate con etichette precise per ogni tipo di difetto, come graffi, ammaccature o componenti mancanti. Questo processo richiede tempo e risorse considerevoli, oltre a competenze specifiche, per garantire che il set di dati rifletta accuratamente la variabilità del mondo reale. Per creare un set di dati solido e affidabile è necessario tenere conto di fattori quali le diverse dimensioni, forme e materiali dei difetti.

Le integrazioni che forniscono set di dati già pronti facilitano attività come il controllo della qualità industriale e, grazie alle capacità di rilevamento in tempo reale di YOLO11, i produttori possono monitorare le linee di produzione, individuare immediatamente i difetti e migliorare l'efficienza.

Figura 4. Un esempio di utilizzo di Ultralytics YOLO11 per rilevare e contare le lattine in produzione.

Oltre al settore manifatturiero, le integrazioni relative ai dataset possono essere utilizzate in molti altri settori. Combinando la velocità e l'accuratezza di YOLO11 con set di dati facilmente accessibili, le aziende possono sviluppare e implementare rapidamente soluzioni su misura per le loro esigenze specifiche. Prendiamo ad esempio il settore sanitario: le integrazioni di set di dati possono aiutare a sviluppare soluzioni per analizzare le immagini mediche e rilevare anomalie come i tumori. Allo stesso modo, nella guida autonoma, tali integrazioni possono aiutare a identificare veicoli, pedoni e segnali stradali per migliorare la sicurezza.

Punti di forza

Trovare il set di dati giusto è spesso una delle fasi più lunghe della costruzione di un modello di computer vision. Tuttavia, l'integrazione con Roboflow rende più facile trovare il set di dati migliore per l'addestramento personalizzato dei modelli Ultralytics YOLO, anche se non si è esperti di computer vision. 

Con l'accesso a una vasta collezione di set di dati per attività di computer vision come il rilevamento di oggetti, la classificazione di immagini o la segmentazione di istanze, Roboflow Universe elimina il problema del processo di scoperta dei dati. Consente di iniziare rapidamente a lavorare e di concentrarsi sulla costruzione del modello, anziché dedicare tempo alla raccolta e all'organizzazione dei dati. Questo approccio semplificato consente agli sviluppatori di prototipare, iterare e sviluppare soluzioni di computer vision in modo più efficiente.

Per saperne di più, visitate il nostro repository GitHub e partecipate alla nostra comunità. Esplorate le innovazioni in settori come l'IA nelle auto a guida autonoma e la computer vision in agricoltura sulle nostre pagine dedicate alle soluzioni. 🚀

Costruiamo insieme il futuro
dell'IA!

Iniziate il vostro viaggio nel futuro dell'apprendimento automatico

Iniziare gratuitamente
Link copiato negli appunti