Yolo Vision Shenzhen
Shenzhen
Iscriviti ora

Addestramento personalizzato di Ultralytics YOLO11 con dataset di computer vision

Abirami Vina

4 minuti di lettura

7 gennaio 2025

Scopri come l'integrazione di Roboflow può semplificare l'addestramento personalizzato di Ultralytics YOLO11 rendendo facilmente accessibili i set di dati di computer vision open source.

L'addestramento di un modello di computer vision come Ultralytics YOLO11 in genere comporta la raccolta di immagini per il dataset, l'annotazione, la preparazione dei dati e la messa a punto del modello per soddisfare i requisiti specifici. Sebbene il pacchetto Python di Ultralytics renda questi passaggi semplici e intuitivi, lo sviluppo di Vision AI può comunque richiedere molto tempo.

Questo è particolarmente vero quando si lavora con scadenze ravvicinate o si sviluppa un prototipo. In queste situazioni, disporre di strumenti o integrazioni che semplificano alcune parti del processo, come la semplificazione della preparazione del set di dati o l'automazione di attività ripetitive, può fare una grande differenza. Riducendo i tempi e gli sforzi necessari, queste soluzioni ti aiutano a concentrarti sulla costruzione e sul perfezionamento del tuo modello. Questo è esattamente ciò che offre l'integrazione di Roboflow.

L'integrazione di Roboflow ti consente di accedere facilmente ai dataset di Roboflow Universe, una vasta libreria di dataset di computer vision open-source. Invece di passare ore a raccogliere e organizzare i dati, puoi trovare e utilizzare rapidamente i dataset esistenti per dare il via al tuo processo di addestramento YOLO11. Questa integrazione rende molto più veloce e semplice sperimentare e iterare sullo sviluppo del tuo modello di computer vision.

In questo articolo, approfondiremo come puoi sfruttare l'integrazione di Roboflow per uno sviluppo del modello più rapido. Iniziamo!

Cos'è Roboflow Universe?

Roboflow Universe è una piattaforma gestita da Roboflow, un'azienda focalizzata sulla semplificazione dello sviluppo della computer vision. Comprende oltre 350 milioni di immagini, 500.000 dataset e 100.000 modelli ottimizzati per attività come il rilevamento di oggetti, la classificazione delle immagini e la segmentazione. Grazie ai contributi di sviluppatori e ricercatori di tutto il mondo, Roboflow Universe è un hub collaborativo per chiunque desideri avviare o migliorare i propri progetti di computer vision.

Fig. 1. Esempi di dataset di object detection su Roboflow Universe.

Roboflow Universe include le seguenti funzionalità chiave:

  • Strumenti di esplorazione del dataset: Esplora, filtra e visualizza i dataset per trovare rapidamente le risorse che si allineano ai requisiti del tuo progetto.
  • Opzioni di esportazione: Esporta i dati in formati come COCO, YOLO, TFRecord, CSV e altri per adattarsi al tuo flusso di lavoro.
  • Analisi del dataset: Ottieni informazioni dettagliate su vari dataset con strumenti di analisi che forniscono visualizzazioni delle distribuzioni delle etichette, degli squilibri di classe e della qualità del dataset. 
  • Monitoraggio delle versioni: Visualizza e accedi a diverse versioni di dataset caricati dai collaboratori, consentendoti di monitorare gli aggiornamenti, confrontare le modifiche e scegliere la versione più adatta alle esigenze del tuo progetto. 

L'integrazione di Roboflow ti aiuta a trovare i dati giusti

Trovare il dataset giusto è spesso una delle parti più impegnative della creazione di un modello di visione artificiale. La creazione di un dataset di solito comporta la raccolta di grandi quantità di immagini, assicurandosi che siano pertinenti al tuo compito, e quindi etichettandole accuratamente. 

Questo processo può richiedere molto tempo e risorse, soprattutto se si sperimentano approcci diversi in un breve periodo. Anche trovare dataset preesistenti può essere complicato, poiché sono spesso sparsi su diverse piattaforme, non adeguatamente documentati o privi delle annotazioni specifiche necessarie.

Ad esempio, se stai creando un'applicazione di computer vision per rilevare le erbacce nei campi agricoli, potresti voler testare diversi approcci di Vision AI, come l'object detection rispetto all'instance segmentation. Questo ti consente di sperimentare e capire quale metodo funziona meglio prima di dedicare tempo e impegno alla raccolta e all'etichettatura del tuo dataset.

Fig. 2. Rilevamento di componenti di auto tramite YOLO11.

Utilizzando l'integrazione Roboflow, puoi sfogliare una varietà di set di dati relativi all'agricoltura, compresi quelli focalizzati sul rilevamento delle erbacce, sulla salute delle colture o sul monitoraggio dei campi. Questi set di dati pronti all'uso ti consentono di provare diverse tecniche e perfezionare il tuo modello senza lo sforzo iniziale di creare i tuoi dati. 

Come funziona l'integrazione con Roboflow

Ora che abbiamo discusso di come è possibile utilizzare l'integrazione di Roboflow per trovare i set di dati giusti, vediamo come si inserisce nel tuo flusso di lavoro. Una volta scelto un set di dati da Roboflow Universe, puoi esportarlo o scaricarlo nel formato YOLO11. Dopo aver esportato il set di dati, puoi utilizzarlo per eseguire il training personalizzato di YOLO11 utilizzando il pacchetto Python Ultralytics. 

Durante il download del set di dati, potresti notare che Roboflow Universe supporta anche altri formati per l'addestramento di diversi modelli. Quindi, perché dovresti scegliere di addestrare in modo personalizzato Ultralytics YOLO11? 

YOLO11 è l'ultima versione dei modelli Ultralytics YOLO ed è costruito per fornire un rilevamento di oggetti più veloce e preciso. Utilizza il 22% di parametri in meno (i valori interni che un modello regola durante l'addestramento per fare previsioni) rispetto a YOLOv8m, ma raggiunge una precisione media superiore (mAP) sul dataset COCO. Questo equilibrio tra velocità e precisione rende YOLO11 una scelta versatile per un'ampia gamma di applicazioni di computer vision, soprattutto quando si addestrano modelli personalizzati per adattarsi a compiti specifici.

Ecco uno sguardo più da vicino a come funziona il training personalizzato di YOLO11:

  • Data feeding: Il modello YOLO11 elabora il tuo dataset, imparando a rilevare e classificare gli oggetti dalle immagini e dalle loro annotazioni.
  • Previsione e feedback: Il modello fa previsioni sugli oggetti nelle immagini e le confronta con le risposte corrette fornite nel dataset.
  • Monitoraggio delle prestazioni: Vengono monitorate metriche come precisione (rilevamenti corretti), richiamo (rilevamenti mancati) e perdita (errori di previsione) per valutare i progressi.
  • Apprendimento iterativo: Il modello regola i suoi parametri su più round (epoche) per migliorare l'accuratezza del rilevamento e ridurre al minimo gli errori.
  • Output finale del modello: Dopo il training, il modello ottimizzato viene salvato e preparato per il deployment.

Altre integrazioni incentrate sullo sviluppo della computer vision

Mentre esplorate l'integrazione di Roboflow, noterete altre integrazioni menzionate nella documentazione di Ultralytics. Supportiamo una varietà di integrazioni relative alle varie fasi dello sviluppo della computer vision. 

Questo per fornire alla nostra comunità una gamma di opzioni, in modo che possiate scegliere ciò che funziona meglio per il vostro specifico flusso di lavoro.

Fig 3. Panoramica delle integrazioni supportate da Ultralytics.

Oltre ai dataset, altre integrazioni supportate da Ultralytics si concentrano su varie parti del processo di computer vision, come il training, il deployment e l'ottimizzazione. Ecco alcuni esempi di altre integrazioni che supportiamo:

  • Integrazioni di addestramento: Integrazioni come Amazon SageMaker e Paperspace Gradient semplificano i flussi di lavoro di addestramento offrendo piattaforme basate su cloud per lo sviluppo e il test efficienti dei modelli.
  • Integrazioni per il tracciamento del flusso di lavoro e degli esperimenti: ClearML, MLFlow e Weights & Biases (W&B) aiutano ad automatizzare i flussi di lavoro, tracciare gli esperimenti e migliorare la collaborazione, semplificando la gestione dei progetti di machine learning.
  • Integrazioni per l'ottimizzazione e il deployment: CoreML, ONNX e OpenVINO consentono un deployment ottimizzato su vari dispositivi e framework, garantendo prestazioni efficienti su piattaforme come hardware Apple e CPU Intel.
  • Integrazioni per il monitoraggio e la visualizzazione: TensorBoard e Weights & Biases forniscono strumenti per visualizzare l'avanzamento del training e monitorare le prestazioni, offrendo informazioni dettagliate per la rifinitura dei modelli.

Applicazioni di YOLO11 e il ruolo delle integrazioni

Le integrazioni che supportano lo sviluppo della computer vision, combinate con le affidabili capacità di YOLO11, semplificano la risoluzione di sfide del mondo reale. Si considerino innovazioni come la computer vision nella produzione, dove la vision AI viene utilizzata per rilevare difetti su una linea di produzione, come graffi su parti metalliche o componenti mancanti. La raccolta dei dati giusti per tali attività può spesso essere lenta e impegnativa, richiedendo l'accesso a ambienti specializzati. 

In genere, comporta l'installazione di telecamere o sensori lungo le linee di produzione per acquisire immagini dei prodotti. Queste immagini devono essere scattate in grandi volumi, spesso con illuminazione e angolazioni coerenti, per garantire chiarezza e uniformità. 

Una volta acquisite, le immagini devono essere meticolosamente annotate con etichette precise per ogni tipo di difetto, come graffi, ammaccature o componenti mancanti. Questo processo richiede tempo e risorse considerevoli, nonché competenze, per garantire che il dataset rifletta accuratamente la variabilità del mondo reale. Fattori come le diverse dimensioni, forme e materiali dei difetti devono essere presi in considerazione per creare un dataset robusto e affidabile.

Le integrazioni che forniscono dataset pronti all'uso facilitano attività come il controllo qualità industriale e, grazie alle capacità di rilevamento in tempo reale di YOLO11, i produttori possono monitorare le linee di produzione, individuare immediatamente i difetti e migliorare l'efficienza.

Fig. 4. Un esempio di utilizzo di Ultralytics YOLO11 per rilevare e contare le lattine in produzione.

Oltre alla produzione, le integrazioni relative ai dataset possono essere utilizzate in molti altri settori. Combinando la velocità e la precisione di YOLO11 con dataset facilmente accessibili, le aziende possono sviluppare e implementare rapidamente soluzioni su misura per le loro esigenze specifiche. Prendiamo, ad esempio, l'assistenza sanitaria: le integrazioni di dataset possono aiutare a sviluppare soluzioni per analizzare immagini mediche per rilevare anomalie come i tumori. Allo stesso modo, nella guida autonoma, tali integrazioni possono aiutare a identificare veicoli, pedoni e segnali stradali per migliorare la sicurezza.

Punti chiave

Trovare il dataset giusto è spesso una delle parti più dispendiose in termini di tempo della creazione di un modello di visione artificiale. Tuttavia, l'integrazione di Roboflow semplifica la ricerca del miglior dataset per l'addestramento personalizzato dei tuoi modelli Ultralytics YOLO, anche se sei nuovo alla visione artificiale. 

Con l'accesso a una vasta raccolta di dataset per attività di computer vision come il rilevamento di oggetti, la classificazione di immagini o la segmentazione di istanze, Roboflow Universe elimina la difficoltà del processo di scoperta dei dati. Ti aiuta a iniziare rapidamente e a concentrarti sulla costruzione del tuo modello anziché dedicare tempo alla raccolta e all'organizzazione dei dati. Questo approccio semplificato consente agli sviluppatori di prototipare, iterare e sviluppare soluzioni di computer vision in modo più efficiente.

Per saperne di più, visita il nostro repository GitHub e interagisci con la nostra community. Esplora le innovazioni in aree come l'IA nelle auto a guida autonoma e la computer vision in agricoltura nelle nostre pagine dedicate alle soluzioni. 🚀

Costruiamo insieme il futuro
dell'AI!

Inizia il tuo viaggio con il futuro del machine learning

Inizia gratis
Link copiato negli appunti