Facendo clic su "Accetta tutti i cookie", l'utente accetta la memorizzazione dei cookie sul proprio dispositivo per migliorare la navigazione del sito, analizzarne l'utilizzo e contribuire alle nostre iniziative di marketing. Per saperne di più
Impostazioni dei cookie
Facendo clic su "Accetta tutti i cookie", l'utente accetta la memorizzazione dei cookie sul proprio dispositivo per migliorare la navigazione del sito, analizzarne l'utilizzo e contribuire alle nostre iniziative di marketing. Per saperne di più
Scoprite il nuovo modello Ultralytics YOLO11, le sue caratteristiche e le applicazioni in tempo reale in vari settori. Vi spiegheremo tutto quello che c'è da sapere.
Lunedì 30 settembre Ultralytics ha lanciato ufficialmente Ultralytics YOLO11, l'ultima novità nel campo della computer vision, dopo il suo debutto a YOLO Vision 2024 (YV24), l'evento ibrido annuale di Ultralytics. La comunità dell'intelligenza artificiale è in fibrillazione per l'esplorazione delle capacità del modello. Grazie a un'elaborazione più rapida, a una maggiore precisione e a modelli ottimizzati sia per i dispositivi edge che per l'implementazione nel cloud, YOLO11 ridefinisce le possibilità delle applicazioni di computer vision in tempo reale.
In un'intervista, il fondatore e CEO di Ultralytics Glenn Jocher ha dichiarato: "Il mondo si sta muovendo verso l'energia pulita, ma non abbastanza velocemente. Vogliamo che i nostri modelli siano addestrabili in un minor numero di epoche, con meno incrementi e meno dati, quindi stiamo lavorando sodo su questo aspetto. Il modello di rilevamento degli oggetti più piccolo, YOLO11n, ha solo 2,6 milioni di parametri, circa la dimensione di un JPEG, il che è davvero pazzesco. Il modello di rilevamento degli oggetti più grande, YOLO11x, ha circa 56 milioni di parametri, e anche questo è incredibilmente piccolo rispetto ad altri modelli. È possibile addestrarli su una GPU economica, come una GPU Nvidia di cinque anni fa, con un po' di entusiasmo e un po' di caffè".
In questo articolo daremo un'occhiata più da vicino a YOLO11, esplorando le sue caratteristiche, i miglioramenti, i benchmark delle prestazioni e le applicazioni reali per aiutarvi a capire cosa può fare questo modello. Iniziamo!
Capire YOLO11: miglioramenti rispetto alle versioni precedenti
YOLO11 è l'ultima novità della serie di modelli di computer vision YOLO (You Only Look Once) e offre miglioramenti significativi rispetto alle versioni precedenti, come YOLOv5 e YOLOv8. Il team di Ultralytics ha incorporato il feedback della comunità e la ricerca all'avanguardia per rendere YOLO11 più veloce, più preciso e più efficiente. YOLO11 supporta anche le stesse attività di computer vision di YOLOv8, tra cui il rilevamento di oggetti, la segmentazione di istanze e la classificazione di immagini. In effetti, gli utenti possono passare facilmente a YOLO11 senza dover modificare i flussi di lavoro esistenti.
Uno dei punti salienti di YOLO11 è la sua performance superiore sia in termini di precisione che di velocità rispetto ai suoi predecessori. Con il 22% di parametri in meno rispetto a YOLOv8m, YOLO11m raggiunge una precisione media superiore (mAP) sul set di dati COCO, il che significa che è in grado di rilevare gli oggetti in modo più preciso ed efficiente. In termini di velocità di elaborazione, YOLO11 supera i modelli precedenti, rendendolo ideale per le applicazioni in tempo reale, dove il rilevamento e la risposta rapidi sono fondamentali e ogni millisecondo conta.
Il grafico di benchmarking sottostante illustra come YOLO11 si distingua dai modelli precedenti. Sull'asse orizzontale è riportata la precisione media (AP) del COCO Box, che misura l'accuratezza del rilevamento degli oggetti. L'asse verticale mostra la latenza utilizzando TensorRT10 FP16 su una GPU NVIDIA T4, indicando la velocità con cui il modello elabora i dati.
Figura 1. YOLO11 offre capacità di rilevamento degli oggetti in tempo reale all'avanguardia.
Lancio del modello YOLO11: Opzioni open-source e aziendali
Per la prima volta, Ultralytics introduce modelli aziendali, segnando un'importante pietra miliare nella nostra offerta di prodotti, e siamo entusiasti di condividere queste novità con i nostri utenti. YOLO11 introduce cinque modelli proprietari progettati specificamente per casi d'uso commerciali. Questi modelli aziendali, che saranno disponibili dal mese prossimo, sono addestrati sul nuovo set di dati proprietario di Ultralytics, composto da oltre 1 milione di immagini, che offre modelli pre-addestrati più robusti. Sono stati progettati per applicazioni esigenti e reali, come l'analisi di immagini mediche e l'elaborazione di immagini satellitari, in cui il rilevamento preciso degli oggetti è fondamentale.
Esplorazione delle caratteristiche di YOLO11 di nuova generazione
Ora che abbiamo discusso di ciò che offre YOLO11, diamo un'occhiata a ciò che rende YOLO11 così speciale.
Una delle sfide principali nello sviluppo di YOLO11 è stata quella di trovare il giusto equilibrio tra priorità concorrenti: rendere i modelli più piccoli, più veloci e più precisi. Come ha spiegato Glenn Jocher, fondatore e CEO di Ultralytics, "Lavorare alla ricerca e allo sviluppo di YOLO è davvero impegnativo perché si vuole andare in tre direzioni diverse: si vogliono rendere i modelli più piccoli, più precisi, ma anche più veloci su piattaforme diverse come CPU e GPU. Tutti questi interessi sono in competizione, quindi bisogna scendere a compromessi e scegliere dove apportare le modifiche". Nonostante queste sfide, YOLO11 raggiunge un equilibrio impressionante, offrendo miglioramenti in termini di velocità e precisione rispetto alle versioni precedenti, come YOLOv8.
Figura 3. Un esempio di utilizzo di YOLO11 per il rilevamento degli oggetti.
YOLO11 apporta miglioramenti sostanziali, come una migliore estrazione delle caratteristiche grazie a un'architettura ridisegnata della spina dorsale e del collo, che porta a un rilevamento più preciso degli oggetti. Il modello è inoltre ottimizzato per la velocità e l'efficienza, offrendo tempi di elaborazione più rapidi pur mantenendo un'elevata precisione. Oltre a questi vantaggi, YOLO11 è altamente adattabile a diversi ambienti e funziona perfettamente su dispositivi edge, piattaforme cloud e sistemi che utilizzano GPU NVIDIA. Questa adattabilità lo rende una scelta ideale per gli utenti che necessitano di opzioni di distribuzione flessibili su diverse configurazioni hardware, dai dispositivi mobili ai server su larga scala.
Applicazioni YOLO11 in tempo reale
La versatilità di YOLO11 lo rende uno strumento affidabile in molti settori, soprattutto quando si tratta di casi d'uso complessi. Ad esempio, funziona perfettamente sui dispositivi edge e può essere utilizzato per applicazioni che richiedono analisi in tempo reale in ambienti con potenza di calcolo limitata. Un esempio eccellente è la guida autonoma, dove i veicoli devono prendere decisioni in una frazione di secondo per garantire la sicurezza di tutti. YOLO11 aiuta a rilevare e analizzare gli oggetti sulla strada, come pedoni o altre auto, anche in condizioni difficili come la scarsa illuminazione o quando gli oggetti sono parzialmente nascosti. Un rilevamento rapido e accurato aiuta a prevenire gli incidenti e garantisce ai veicoli a guida autonoma una navigazione sicura.
Figura 4. Glenn Jocher sul palco di YV24, mentre parla delle applicazioni di YOLO11.
Un altro esempio interessante della gamma di YOLO11 è la sua capacità di gestire le bounding box orientate (OBB). È essenziale per rilevare gli oggetti non perfettamente allineati. Il rilevamento di oggetti OBB è una funzione particolarmente utile in settori come l'agricoltura, la mappatura e la sorveglianza, dove le immagini contengono spesso oggetti ruotati come colture o edifici in immagini aeree o satellitari. A differenza dei modelli tradizionali, YOLO11 è in grado di identificare gli oggetti a qualsiasi angolazione e di fornire risultati molto più accurati per le attività che richiedono precisione.
YOLO11 per gli sviluppatori di intelligenza artificiale: Provatelo voi stessi
Iniziare a lavorare con YOLO11 è semplice e accessibile, sia che si preferisca la codifica che l'opzione no-code. Per lavorare con YOLO11 attraverso il codice, è possibile utilizzare il pacchetto Ultralytics Python per addestrare e distribuire facilmente i modelli. Se si preferisce un approccio senza codice, Ultralytics HUB consente di provare YOLO11 con pochi clic.
Codice YOLO11
Per utilizzare YOLO11 con Python, è necessario installare il pacchetto Ultralytics. A seconda delle preferenze, è possibile farlo utilizzando pip, conda o Docker. Per istruzioni dettagliate e buone pratiche relative al processo di installazione, consultare la nostra Guida all'installazione di Ultralytics. Durante l'installazione dei pacchetti necessari per YOLO11, se si incontrano difficoltà, consultare la nostra Guida ai problemi comuni per trovare soluzioni e suggerimenti.
Figura 5. Utilizzo di YOLO11 attraverso il pacchetto Ultralytics.
Per gli utenti che preferiscono un approccio senza codice, Ultralytics HUB offre un modo semplice per addestrare e distribuire i modelli YOLO11 con pochi clic. Per iniziare a utilizzare HUB, è sufficiente creare un account sulla piattaforma Ultralytics HUB per iniziare a formare e gestire i modelli attraverso un'interfaccia intuitiva.
YOLO11: Il futuro dell'intelligenza artificiale della visione
La comunità dell'intelligenza artificiale fa costantemente progredire il campo della computer vision cercando di sviluppare modelli più veloci e accurati per le applicazioni del mondo reale. Ultralytics YOLO11 è un'importante pietra miliare in questo sforzo, con una maggiore velocità, precisione e flessibilità. È stato progettato per le applicazioni in tempo reale e per le applicazioni edge, rendendolo ideale per settori come la sanità e la guida autonoma. Sia che si utilizzi il pacchetto Ultralytics Python o l'Ultralytics Hub senza codice, YOLO11 semplifica le complesse attività di Vision AI. Offre potenti funzionalità di computer vision, che lo rendono un'ottima scelta per sviluppatori e aziende.