Cliccando su “Accetta tutti i cookie”, l'utente accetta di memorizzare i cookie sul proprio dispositivo per migliorare la navigazione del sito, analizzare l'utilizzo del sito e assistere le nostre attività di marketing. Maggiori informazioni
Impostazioni dei cookie
Cliccando su “Accetta tutti i cookie”, l'utente accetta di memorizzare i cookie sul proprio dispositivo per migliorare la navigazione del sito, analizzare l'utilizzo del sito e assistere le nostre attività di marketing. Maggiori informazioni
Scopri tutto sul nuovo modello Ultralytics YOLO11, le sue caratteristiche e le applicazioni in tempo reale in vari settori. Ti guideremo attraverso tutto ciò che devi sapere.
Lunedì 30 settembre, Ultralytics ha lanciato ufficialmente Ultralytics YOLO11, l'ultima innovazione nel campo della computer vision, in seguito al suo debutto allo YOLO Vision 2024 (YV24), l'evento ibrido annuale di Ultralytics. La comunità dell'IA è in fermento per l'entusiasmo, mentre si affretta a esplorare le capacità del modello. Con un'elaborazione più rapida, una maggiore precisione e modelli ottimizzati sia per i dispositivi edge che per l'implementazione nel cloud, YOLO11 ridefinisce ciò che è possibile nelle applicazioni di computer vision in tempo reale.
In un'intervista, il fondatore e CEO di Ultralytics, Glenn Jocher, ha condiviso: "Il mondo si sta muovendo verso l'energia pulita, ma non abbastanza velocemente. Vogliamo che i nostri modelli siano addestrabili in meno epoche, con meno aumentazioni e meno dati, quindi ci stiamo lavorando sodo. Il modello di rilevamento oggetti più piccolo, YOLO11n, ha solo 2,6 milioni di parametri, circa le dimensioni di un JPEG, il che è davvero folle. Il modello di rilevamento oggetti più grande, YOLO11x, ha circa 56 milioni di parametri, e anche questo è incredibilmente piccolo rispetto ad altri modelli. Puoi addestrarli su una GPU economica, come una GPU Nvidia di cinque anni, solo con un po' di entusiasmo e un po' di caffè."
In questo articolo, esamineremo più da vicino YOLO11, esplorandone le caratteristiche, i miglioramenti, i benchmark delle prestazioni e le applicazioni nel mondo reale per aiutarti a capire cosa può fare questo modello. Iniziamo!
Comprendere YOLO11: Miglioramenti rispetto alle versioni precedenti
YOLO11 è l'ultimo progresso nella serie YOLO (You Only Look Once) di modelli di computer vision e offre miglioramenti significativi rispetto alle versioni precedenti come YOLOv5 e YOLOv8. Il team di Ultralytics ha incorporato il feedback della community e la ricerca all'avanguardia per rendere YOLO11 più veloce, più preciso e più efficiente. YOLO11 supporta anche le stesse attività di computer vision di YOLOv8, tra cui object detection, instance segmentation e image classification. Infatti, gli utenti possono passare facilmente a YOLO11 senza dover modificare i flussi di lavoro esistenti.
Uno dei punti di forza di YOLO11 è la sua performance superiore sia in termini di accuratezza che di velocità rispetto ai suoi predecessori. Con il 22% di parametri in meno rispetto a YOLOv8m, YOLO11m raggiunge una precisione media media (mAP) più elevata sul dataset COCO, il che significa che può rilevare gli oggetti in modo più preciso ed efficiente. In termini di velocità di elaborazione, YOLO11 supera i modelli precedenti, rendendolo ideale per applicazioni in tempo reale, dove il rilevamento e la risposta rapidi sono fondamentali e ogni millisecondo conta.
Il grafico di benchmarking di seguito illustra come YOLO11 si distingue dai modelli precedenti. Sull'asse orizzontale, mostra la COCO Box Average Precision (AP), che misura l'accuratezza del rilevamento degli oggetti. L'asse verticale mostra la latenza utilizzando TensorRT10 FP16 su una GPU NVIDIA T4, indicando la velocità con cui il modello elabora i dati.
Fig. 1. YOLO11 offre funzionalità di rilevamento oggetti in tempo reale all'avanguardia.
Lancio del modello YOLO11: opzioni open source ed enterprise
Per la prima volta, Ultralytics introduce modelli enterprise, segnando una pietra miliare importante nella nostra offerta di prodotti, e siamo entusiasti di condividere queste nuove innovazioni con i nostri utenti. YOLO11 introduce cinque modelli proprietari progettati specificamente per casi d'uso commerciali. Questi modelli enterprise, che saranno disponibili il mese prossimo, sono addestrati sul nuovo dataset proprietario di Ultralytics, composto da oltre 1 milione di immagini, offrendo modelli pre-addestrati più robusti. Sono progettati per applicazioni complesse nel mondo reale, come l'analisi di immagini mediche e l'elaborazione di immagini satellitari, dove il rilevamento preciso degli oggetti è fondamentale.
Esplorazione delle funzionalità di nuova generazione di YOLO11
Ora che abbiamo discusso di cosa offre YOLO11, diamo un'occhiata a cosa rende YOLO11 così speciale.
Una delle sfide principali nello sviluppo di YOLO11 è stata trovare il giusto equilibrio tra priorità contrastanti: rendere i modelli più piccoli, più veloci e più accurati. Come ha spiegato Glenn Jocher, fondatore e CEO di Ultralytics, “Lavorare alla ricerca e allo sviluppo di YOLO è davvero impegnativo perché si vuole andare in tre direzioni diverse: si vuole rendere i modelli più piccoli, si vuole che diventino più accurati, ma si vuole anche che siano più veloci su diverse piattaforme come CPU e GPU. Tutti questi sono interessi contrastanti, quindi bisogna scendere a compromessi e scegliere dove apportare modifiche.” Nonostante queste sfide, YOLO11 raggiunge un equilibrio impressionante, offrendo miglioramenti sia in termini di velocità che di accuratezza rispetto alle versioni precedenti come YOLOv8.
Fig. 3. Un esempio di utilizzo di YOLO11 per il rilevamento di oggetti.
YOLO11 offre miglioramenti sostanziali come una migliore estrazione delle feature con un'architettura backbone e neck riprogettata, portando a un rilevamento oggetti più preciso. Il modello è anche ottimizzato per velocità ed efficienza, offrendo tempi di elaborazione più rapidi pur mantenendo un'elevata accuratezza. Oltre a questi vantaggi, YOLO11 è altamente adattabile in diversi ambienti, funzionando perfettamente su dispositivi edge, piattaforme cloud e sistemi che utilizzano GPU NVIDIA. Questa adattabilità lo rende una scelta ideale per gli utenti che necessitano di opzioni di implementazione flessibili su varie configurazioni hardware, dai dispositivi mobili ai server su larga scala.
Applicazioni YOLO11 in tempo reale
La versatilità di YOLO11 lo rende uno strumento affidabile in molti settori, soprattutto quando si ha a che fare con casi d'uso complessi. Ad esempio, funziona perfettamente su dispositivi edge e può essere utilizzato per applicazioni che richiedono analisi in tempo reale in ambienti con potenza di calcolo limitata. Un ottimo esempio di questo è la guida autonoma, dove i veicoli devono prendere decisioni in una frazione di secondo per garantire la sicurezza di tutti. YOLO11 aiuta rilevando e analizzando gli oggetti sulla strada, come pedoni o altre auto, anche in condizioni difficili come scarsa illuminazione o quando le cose sono parzialmente nascoste. Il rilevamento rapido e accurato aiuta a prevenire gli incidenti e garantisce che i veicoli a guida autonoma possano navigare in sicurezza.
Fig 4. Glenn Jocher sul palco di YV24, parla delle applicazioni di YOLO11.
Un altro esempio interessante della gamma di YOLO11 è la sua capacità di gestire le bounding box orientate (OBB). È essenziale per rilevare oggetti che non sono perfettamente allineati. Il rilevamento di oggetti OBB è una caratteristica particolarmente utile in settori come l'agricoltura, la cartografia e la sorveglianza, dove le immagini contengono spesso oggetti ruotati come colture o edifici in immagini aeree o satellitari. A differenza dei modelli tradizionali, YOLO11 può identificare oggetti a qualsiasi angolazione e fornire risultati molto più accurati per compiti che richiedono precisione.
YOLO11 per sviluppatori AI: provalo tu stesso
Iniziare con YOLO11 è semplice e accessibile, sia che tu preferisca la programmazione o un'opzione no-code. Per lavorare con YOLO11 tramite codice, puoi utilizzare il pacchetto Python di Ultralytics per addestrare e distribuire facilmente i modelli. Se preferisci un approccio no-code, Ultralytics HUB ti consente di provare YOLO11 con pochi clic.
Presentazione del codice di YOLO11
Per utilizzare YOLO11 con Python, dovrai prima installare il pacchetto Ultralytics. A seconda delle tue preferenze, puoi farlo usando pip, conda o Docker. Per istruzioni dettagliate e best practice relative al processo di installazione, assicurati di consultare la nostra Guida all'installazione di Ultralytics. Durante l'installazione dei pacchetti richiesti per YOLO11, se riscontri difficoltà, consulta la nostra Guida ai problemi comuni per soluzioni e suggerimenti.
Fig. 5. Utilizzo di YOLO11 tramite il pacchetto Ultralytics.
Per gli utenti che preferiscono un approccio no-code, Ultralytics HUB offre un modo semplice per addestrare e distribuire modelli YOLO11 con pochi clic. Per iniziare con HUB, è sufficiente creare un account sulla piattaforma Ultralytics HUB e puoi iniziare ad addestrare e gestire i tuoi modelli tramite un'interfaccia intuitiva.
YOLO11: Diamo forma al futuro della vision AI
La comunità dell'IA fa costantemente progredire il campo della computer vision, impegnandosi a sviluppare modelli più veloci e accurati per applicazioni reali. Ultralytics YOLO11 è una pietra miliare importante in questo sforzo, offrendo velocità, accuratezza e flessibilità migliorate. È progettato per applicazioni in tempo reale e edge, il che lo rende ideale per settori come la sanità e la guida autonoma. Sia che si utilizzi il pacchetto Python Ultralytics o Ultralytics Hub no-code, YOLO11 semplifica complesse attività di Vision AI. Offre potenti funzionalità di computer vision, rendendolo un'ottima scelta per sviluppatori e aziende.