Tutto quello che c'è da sapere su Ultralytics YOLO11 e le sue applicazioni

Abirami Vina

4 minuti di lettura

4 ottobre 2024

Scoprite il nuovo modello Ultralytics YOLO11, le sue caratteristiche e le applicazioni in tempo reale in vari settori. Vi spiegheremo tutto quello che c'è da sapere.

Lunedì 30 settembre Ultralytics ha lanciato ufficialmente Ultralytics YOLO11, l'ultima novità nel campo della computer vision, dopo il suo debutto a YOLO Vision 2024 (YV24), l'evento ibrido annuale di Ultralytics. La comunità dell'intelligenza artificiale è in fibrillazione per l'esplorazione delle capacità del modello. Grazie a un'elaborazione più rapida, a una maggiore precisione e a modelli ottimizzati sia per i dispositivi edge che per l'implementazione nel cloud, YOLO11 ridefinisce le possibilità delle applicazioni di computer vision in tempo reale.

In un'intervista, il fondatore e CEO di Ultralytics Glenn Jocher ha dichiarato: "Il mondo si sta muovendo verso l'energia pulita, ma non abbastanza velocemente. Vogliamo che i nostri modelli siano addestrabili in un minor numero di epoche, con meno incrementi e meno dati, quindi stiamo lavorando sodo su questo aspetto. Il modello di rilevamento degli oggetti più piccolo, YOLO11n, ha solo 2,6 milioni di parametri, circa la dimensione di un JPEG, il che è davvero pazzesco. Il modello di rilevamento degli oggetti più grande, YOLO11x, ha circa 56 milioni di parametri, e anche questo è incredibilmente piccolo rispetto ad altri modelli. È possibile addestrarli su una GPU economica, come una GPU Nvidia di cinque anni fa, con un po' di entusiasmo e un po' di caffè".

In questo articolo daremo un'occhiata più da vicino a YOLO11, esplorando le sue caratteristiche, i miglioramenti, i benchmark delle prestazioni e le applicazioni reali per aiutarvi a capire cosa può fare questo modello. Iniziamo!

Capire YOLO11: miglioramenti rispetto alle versioni precedenti

YOLO11 è l'ultima novità della serie di modelli di computer vision YOLO (You Only Look Once) e offre miglioramenti significativi rispetto alle versioni precedenti, come YOLOv5 e YOLOv8. Il team di Ultralytics ha incorporato il feedback della comunità e la ricerca all'avanguardia per rendere YOLO11 più veloce, più preciso e più efficiente. YOLO11 supporta anche le stesse attività di computer vision di YOLOv8, tra cui il rilevamento di oggetti, la segmentazione di istanze e la classificazione di immagini. In effetti, gli utenti possono passare facilmente a YOLO11 senza dover modificare i flussi di lavoro esistenti.

Uno dei punti salienti di YOLO11 è la sua performance superiore sia in termini di precisione che di velocità rispetto ai suoi predecessori. Con il 22% di parametri in meno rispetto a YOLOv8m, YOLO11m raggiunge una precisione media superiore (mAP) sul set di dati COCO, il che significa che è in grado di rilevare gli oggetti in modo più preciso ed efficiente. In termini di velocità di elaborazione, YOLO11 supera i modelli precedenti, rendendolo ideale per le applicazioni in tempo reale, dove il rilevamento e la risposta rapidi sono fondamentali e ogni millisecondo conta.

Il grafico di benchmarking sottostante illustra come YOLO11 si distingua dai modelli precedenti. Sull'asse orizzontale è riportata la precisione media (AP) del COCO Box, che misura l'accuratezza del rilevamento degli oggetti. L'asse verticale mostra la latenza utilizzando TensorRT10 FP16 su una GPU NVIDIA T4, indicando la velocità con cui il modello elabora i dati. 

__wf_reserved_inherit
Figura 1. YOLO11 offre capacità di rilevamento degli oggetti in tempo reale all'avanguardia.

Lancio del modello YOLO11: Opzioni open-source e aziendali

Con il lancio di Ultralytics YOLO11, Ultralytics amplia la serie YOLO offrendo modelli open-source e aziendali per soddisfare la crescente domanda dei settori industriali.

__wf_reserved_inherit
Figura 2. Con questo lancio, Ultralytics offre 30 nuovi modelli.

YOLO11 presenta cinque modelli di dimensioni diverse: Nano, Small, Medium, Large e X. Gli utenti possono scegliere il modello migliore in base alle esigenze specifiche della loro applicazione di visione artificiale. Le cinque dimensioni offrono flessibilità per compiti quali la classificazione di immagini, il rilevamento di oggetti, la segmentazione di istanze, il tracciamento, la stima della posa e il rilevamento di oggetti orientati (OBB, oriented bounding boxes). Per ogni dimensione è disponibile un modello per ogni compito, per un totale di 25 modelli open-source che costituiscono il nucleo dell'offerta di Ultralytics. Questi modelli sono ideali per un'ampia gamma di applicazioni, dalle attività leggere sui dispositivi edge, dove il modello YOLO11n offre un'efficienza impressionante, alle applicazioni su larga scala che richiedono i modelli YOLO11l e YOLO11x.

Per la prima volta, Ultralytics introduce modelli aziendali, segnando un'importante pietra miliare nella nostra offerta di prodotti, e siamo entusiasti di condividere queste novità con i nostri utenti. YOLO11 introduce cinque modelli proprietari progettati specificamente per casi d'uso commerciali. Questi modelli aziendali, che saranno disponibili dal mese prossimo, sono addestrati sul nuovo set di dati proprietario di Ultralytics, composto da oltre 1 milione di immagini, che offre modelli pre-addestrati più robusti. Sono stati progettati per applicazioni esigenti e reali, come l'analisi di immagini mediche e l'elaborazione di immagini satellitari, in cui il rilevamento preciso degli oggetti è fondamentale.

Esplorazione delle caratteristiche di YOLO11 di nuova generazione

Ora che abbiamo discusso di ciò che offre YOLO11, diamo un'occhiata a ciò che rende YOLO11 così speciale.

Una delle sfide principali nello sviluppo di YOLO11 è stata quella di trovare il giusto equilibrio tra priorità concorrenti: rendere i modelli più piccoli, più veloci e più precisi. Come ha spiegato Glenn Jocher, fondatore e CEO di Ultralytics, "Lavorare alla ricerca e allo sviluppo di YOLO è davvero impegnativo perché si vuole andare in tre direzioni diverse: si vogliono rendere i modelli più piccoli, più precisi, ma anche più veloci su piattaforme diverse come CPU e GPU. Tutti questi interessi sono in competizione, quindi bisogna scendere a compromessi e scegliere dove apportare le modifiche". Nonostante queste sfide, YOLO11 raggiunge un equilibrio impressionante, offrendo miglioramenti in termini di velocità e precisione rispetto alle versioni precedenti, come YOLOv8.

__wf_reserved_inherit
Figura 3. Un esempio di utilizzo di YOLO11 per il rilevamento degli oggetti.

YOLO11 apporta miglioramenti sostanziali, come una migliore estrazione delle caratteristiche grazie a un'architettura ridisegnata della spina dorsale e del collo, che porta a un rilevamento più preciso degli oggetti. Il modello è inoltre ottimizzato per la velocità e l'efficienza, offrendo tempi di elaborazione più rapidi pur mantenendo un'elevata precisione. Oltre a questi vantaggi, YOLO11 è altamente adattabile a diversi ambienti e funziona perfettamente su dispositivi edge, piattaforme cloud e sistemi che utilizzano GPU NVIDIA. Questa adattabilità lo rende una scelta ideale per gli utenti che necessitano di opzioni di distribuzione flessibili su diverse configurazioni hardware, dai dispositivi mobili ai server su larga scala.

Applicazioni YOLO11 in tempo reale

La versatilità di YOLO11 lo rende uno strumento affidabile in molti settori, soprattutto quando si tratta di casi d'uso complessi. Ad esempio, funziona perfettamente sui dispositivi edge e può essere utilizzato per applicazioni che richiedono analisi in tempo reale in ambienti con potenza di calcolo limitata. Un esempio eccellente è la guida autonoma, dove i veicoli devono prendere decisioni in una frazione di secondo per garantire la sicurezza di tutti. YOLO11 aiuta a rilevare e analizzare gli oggetti sulla strada, come pedoni o altre auto, anche in condizioni difficili come la scarsa illuminazione o quando gli oggetti sono parzialmente nascosti. Un rilevamento rapido e accurato aiuta a prevenire gli incidenti e garantisce ai veicoli a guida autonoma una navigazione sicura.

__wf_reserved_inherit
Figura 4. Glenn Jocher sul palco di YV24, mentre parla delle applicazioni di YOLO11.

Un altro esempio interessante della gamma di YOLO11 è la sua capacità di gestire le bounding box orientate (OBB). È essenziale per rilevare gli oggetti non perfettamente allineati. Il rilevamento di oggetti OBB è una funzione particolarmente utile in settori come l'agricoltura, la mappatura e la sorveglianza, dove le immagini contengono spesso oggetti ruotati come colture o edifici in immagini aeree o satellitari. A differenza dei modelli tradizionali, YOLO11 è in grado di identificare gli oggetti a qualsiasi angolazione e di fornire risultati molto più accurati per le attività che richiedono precisione.

YOLO11 per gli sviluppatori di intelligenza artificiale: Provatelo voi stessi

Iniziare a lavorare con YOLO11 è semplice e accessibile, sia che si preferisca la codifica che l'opzione no-code. Per lavorare con YOLO11 attraverso il codice, è possibile utilizzare il pacchetto Ultralytics Python per addestrare e distribuire facilmente i modelli. Se si preferisce un approccio senza codice, Ultralytics HUB consente di provare YOLO11 con pochi clic.

Codice YOLO11

Per utilizzare YOLO11 con Python, è necessario installare il pacchetto Ultralytics. A seconda delle preferenze, è possibile farlo utilizzando pip, conda o Docker. Per istruzioni dettagliate e buone pratiche relative al processo di installazione, consultare la nostra Guida all'installazione di Ultralytics. Durante l'installazione dei pacchetti necessari per YOLO11, se si incontrano difficoltà, consultare la nostra Guida ai problemi comuni per trovare soluzioni e suggerimenti.

Una volta installato il pacchetto Ultralytics, l'utilizzo di YOLO11 è semplice. Il seguente frammento di codice illustra il processo di caricamento di un modello, l'addestramento, la verifica delle prestazioni e l'esportazione in formato ONNX. Per esempi più approfonditi e per un utilizzo avanzato, si consiglia di consultare la documentazione ufficiale di Ultralytics, dove si trovano guide dettagliate e best practice per ottenere il massimo da YOLO11.

__wf_reserved_inherit
Figura 5. Utilizzo di YOLO11 attraverso il pacchetto Ultralytics. 

Per gli utenti che preferiscono un approccio senza codice, Ultralytics HUB offre un modo semplice per addestrare e distribuire i modelli YOLO11 con pochi clic. Per iniziare a utilizzare HUB, è sufficiente creare un account sulla piattaforma Ultralytics HUB per iniziare a formare e gestire i modelli attraverso un'interfaccia intuitiva.

YOLO11: Il futuro dell'intelligenza artificiale della visione

La comunità dell'intelligenza artificiale fa costantemente progredire il campo della computer vision cercando di sviluppare modelli più veloci e accurati per le applicazioni del mondo reale. Ultralytics YOLO11 è un'importante pietra miliare in questo sforzo, con una maggiore velocità, precisione e flessibilità. È stato progettato per le applicazioni in tempo reale e per le applicazioni edge, rendendolo ideale per settori come la sanità e la guida autonoma. Sia che si utilizzi il pacchetto Ultralytics Python o l'Ultralytics Hub senza codice, YOLO11 semplifica le complesse attività di Vision AI. Offre potenti funzionalità di computer vision, che lo rendono un'ottima scelta per sviluppatori e aziende.

Consultate il nostro repository GitHub e unitevi alla nostra attiva comunità per saperne di più sull'IA. Scoprite come Vision AI sta guidando l'innovazione in settori come la sanità e l'agricoltura.

Costruiamo insieme il futuro
dell'IA!

Iniziate il vostro viaggio nel futuro dell'apprendimento automatico

Iniziare gratuitamente
Link copiato negli appunti