Ultralytics YOLO11: IA di visione veloce e precisa

Lunedì 30 settembre, Ultralytics ha lanciato ufficialmente Ultralytics YOLO11l'ultima novità nel campo della computer vision, dopo il suo debutto a YOLO Vision 2024 (YV24), l'evento ibrido annuale di Ultralytics. La comunità dell'intelligenza artificiale è in fibrillazione e si affretta a esplorare le capacità del modello. Grazie a un'elaborazione più rapida, a una maggiore precisione e a modelli ottimizzati sia per i dispositivi edge che per l'implementazione nel cloud, YOLO11 ridefinisce le possibilità delle applicazioni di computer vision in tempo reale.

In un'intervista, il fondatore e CEO Ultralytics Glenn Jocher ha dichiarato: "Il mondo si sta muovendo verso l'energia pulita, ma non abbastanza velocemente. Vogliamo che i nostri modelli siano addestrabili in un minor numero di epoche, con meno incrementi e meno dati, quindi stiamo lavorando sodo su questo aspetto. Il modello di rilevamento degli oggetti più piccolo, YOLO11n, ha solo 2,6 milioni di parametri, circa la dimensione di un JPEG, il che è davvero pazzesco. Il modello di rilevamento degli oggetti più grande, YOLO11x, ha circa 56 milioni di parametri, e anche questo è incredibilmente piccolo rispetto ad altri modelli. È possibile addestrarli su una GPU economica, come unaGPU Nvidia di cinque anni fa, con un po' di entusiasmo e un po' di caffè".

In questo articolo daremo un'occhiata più da vicino a YOLO11, esplorando le sue caratteristiche, i miglioramenti, i benchmark delle prestazioni e le applicazioni reali per aiutarvi a capire cosa può fare questo modello. Iniziamo!

Capire YOLO11: miglioramenti rispetto alle versioni precedenti

YOLO11 è l'ultima novità della serie di modelli di visione computerizzata YOLO (You Only Look Once) e offre miglioramenti significativi rispetto alle versioni precedenti, come ad esempio YOLOv5 e YOLOv8. Il team di Ultralytics ha incorporato il feedback della comunità e la ricerca all'avanguardia per rendere YOLO11 più veloce, più preciso e più efficiente. YOLO11 supporta anche le stesse attività di computer vision di YOLOv8, tra cui il rilevamento di oggetti, la segmentazione di istanze e la classificazione di immagini. In effetti, gli utenti possono passare facilmente a YOLO11 senza dover modificare i flussi di lavoro esistenti.

Uno dei punti salienti di YOLO11 è la sua performance superiore sia in termini di precisione che di velocità rispetto ai suoi predecessori. Con il 22% di parametri in meno rispetto a YOLOv8m, YOLO11m raggiunge una precisione media superiore (mAP) sul set di datiCOCO , il che significa che è in grado di detect gli oggetti in modo più preciso ed efficiente. In termini di velocità di elaborazione, YOLO11 supera i modelli precedenti, rendendolo ideale per le applicazioni in tempo reale, dove il rilevamento e la risposta rapidi sono fondamentali e ogni millisecondo conta.

Il grafico di benchmarking sottostante illustra come YOLO11 si distingua dai modelli precedenti. Sull'asse orizzontale è riportata la precisione media (AP) del COCO Box, che misura l'accuratezza del rilevamento degli oggetti. L'asse verticale mostra la latenza utilizzando TensorRT10 FP16 su una GPUNVIDIA T4, indicando la velocità con cui il modello elabora i dati.

Figura 1. YOLO11 offre capacità di rilevamento degli oggetti in tempo reale all'avanguardia.

‍

Lancio del modello YOLO11 : Opzioni open-source e aziendali

Con il lancio di Ultralytics YOLO11, Ultralytics amplia la serie YOLO offrendo modelli open-source e aziendali per soddisfare la crescente domanda dei settori industriali.

Figura 2. Con questo lancio, Ultralytics offre 30 nuovi modelli.

‍

YOLO11 presenta cinque modelli di dimensioni diverse: Nano, Small, Medium, Large e X. Gli utenti possono scegliere il modello migliore in base alle esigenze specifiche della loro applicazione di visione artificiale. Le cinque dimensioni offrono flessibilità per compiti quali la classificazione di immagini, il rilevamento di oggetti, la segmentazione di istanze, il tracciamento, la stima della posa e il rilevamento di oggetti orientati (OBB, oriented bounding boxes). Per ogni dimensione è disponibile un modello per ogni compito, per un totale di 25 modelli open-source che costituiscono il nucleo dell'offerta di Ultralytics. Questi modelli sono ideali per un'ampia gamma di applicazioni, dalle attività leggere sui dispositivi edge, dove il modello YOLO11n offre un'efficienza impressionante, alle applicazioni su larga scala che richiedono i modelli YOLO11l e YOLO11x.

Per la prima volta, Ultralytics introduce modelli aziendali, segnando un'importante pietra miliare nella nostra offerta di prodotti, e siamo entusiasti di condividere queste novità con i nostri utenti. YOLO11 introduce cinque modelli proprietari progettati specificamente per casi d'uso commerciali. Questi modelli aziendali, che saranno disponibili dal mese prossimo, sono addestrati sul nuovo set di dati proprietario di Ultralytics, composto da oltre 1 milione di immagini, che offre modelli pre-addestrati più robusti. Sono stati progettati per applicazioni esigenti e reali, come l'analisi di immagini mediche e l'elaborazione di immagini satellitari, in cui il rilevamento preciso degli oggetti è fondamentale.

Esplorazione delle caratteristiche di YOLO11 di nuova generazione

Ora che abbiamo discusso di ciò che offre YOLO11 , diamo un'occhiata a ciò che rende YOLO11 così speciale.

Una delle sfide principali nello sviluppo di YOLO11 è stata quella di trovare il giusto equilibrio tra priorità concorrenti: rendere i modelli più piccoli, più veloci e più precisi. Come ha spiegato Glenn Jocher, fondatore e CEO di Ultralytics, "Lavorare alla ricerca e allo sviluppo di YOLO è davvero impegnativo perché si vuole andare in tre direzioni diverse: si vogliono rendere i modelli più piccoli, più precisi, ma anche più veloci su piattaforme diverse come CPU e GPU. Tutti questi interessi sono in competizione, quindi bisogna scendere a compromessi e scegliere dove apportare le modifiche". Nonostante queste sfide, YOLO11 raggiunge un equilibrio impressionante, offrendo miglioramenti in termini di velocità e precisione rispetto alle versioni precedenti, come YOLOv8.

Figura 3. Un esempio di utilizzo di YOLO11 per il rilevamento degli oggetti.

‍

YOLO11 apporta miglioramenti sostanziali, come una migliore estrazione delle caratteristiche grazie a un'architettura ridisegnata della spina dorsale e del collo, che porta a un rilevamento più preciso degli oggetti. Il modello è inoltre ottimizzato per la velocità e l'efficienza, offrendo tempi di elaborazione più rapidi pur mantenendo un'elevata precisione. Oltre a questi vantaggi, YOLO11 è altamente adattabile a diversi ambienti e funziona perfettamente su dispositivi edge, piattaforme cloud e sistemi che utilizzano GPU NVIDIA . Questa adattabilità lo rende una scelta ideale per gli utenti che necessitano di opzioni di distribuzione flessibili su diverse configurazioni hardware, dai dispositivi mobili ai server su larga scala.

Applicazioni YOLO11 in tempo reale

La versatilità di YOLO11lo rende uno strumento affidabile in molti settori, soprattutto quando si tratta di casi d'uso complessi. Ad esempio, funziona perfettamente sui dispositivi edge e può essere utilizzato per applicazioni che richiedono analisi in tempo reale in ambienti con potenza di calcolo limitata. Un esempio eccellente è la guida autonoma, in cui i veicoli devono prendere decisioni in una frazione di secondo per garantire la sicurezza di tutti. YOLO11 aiuta a rilevare e analizzare gli oggetti sulla strada, come pedoni o altre auto, anche in condizioni difficili come la scarsa illuminazione o quando gli oggetti sono parzialmente nascosti. Un rilevamento rapido e accurato aiuta a prevenire gli incidenti e garantisce ai veicoli a guida autonoma una navigazione sicura.

Figura 4. Glenn Jocher sul palco di YV24, mentre parla delle applicazioni di YOLO11 .

‍

Un altro esempio interessante della gamma di YOLO11è la sua capacità di gestire le bounding box orientate (OBB). È essenziale per rilevare gli oggetti non perfettamente allineati. Il rilevamento di oggetti OBB è una funzione particolarmente utile in settori come l'agricoltura, la mappatura e la sorveglianza, dove le immagini contengono spesso oggetti ruotati come colture o edifici in immagini aeree o satellitari. A differenza dei modelli tradizionali, YOLO11 è in grado di identificare gli oggetti a qualsiasi angolazione e di fornire risultati molto più accurati per le attività che richiedono precisione.

YOLO11 per gli sviluppatori di intelligenza artificiale: Provatelo voi stessi

Iniziare a utilizzare YOLO11 semplice e accessibile, sia che si preferisca la codifica o un'opzione senza codice. Per lavorare con YOLO11 codice, è possibile utilizzare il Python Ultralytics per addestrare e implementare facilmente i modelli. Se si preferisce un approccio senza codice, Ultralytics consente di provare YOLO11 pochi clic.

Codice YOLO11

Per utilizzare YOLO11 con Python, è necessario installare il pacchetto Ultralytics . A seconda delle preferenze, è possibile farlo utilizzando pip, conda o Docker. Per istruzioni dettagliate e buone pratiche relative al processo di installazione, consultare la nostra Guida all'installazione diUltralytics . Durante l'installazione dei pacchetti necessari per YOLO11, se si incontrano difficoltà, consultare la nostra Guida ai problemi comuni per trovare soluzioni e suggerimenti.

Una volta installato il pacchetto Ultralytics , l'utilizzo di YOLO11 è semplice. Il seguente frammento di codice illustra il processo di caricamento di un modello, l'addestramento, la verifica delle prestazioni e l'esportazione in formatoONNX . Per esempi più approfonditi e per un utilizzo avanzato, si consiglia di consultare la documentazione ufficiale di Ultralytics , dove si trovano guide dettagliate e best practice per ottenere il massimo da YOLO11.

Figura 5. Utilizzo di YOLO11 attraverso il pacchetto Ultralytics .

‍

Per gli utenti che preferiscono un approccio senza codice, Ultralytics offre un modo semplice per addestrare e implementare YOLO11 con pochi clic. Per iniziare a utilizzare Ultralytics , è sufficiente creare un account sulla Ultralytics e sarà possibile iniziare ad addestrare e gestire i propri modelli attraverso un'interfaccia intuitiva.

YOLO11: Il futuro dell'intelligenza artificiale della visione

La comunità dell'intelligenza artificiale è costantemente impegnata nel progresso del campo della visione artificiale, cercando di sviluppare modelli più veloci e accurati per applicazioni nel mondo reale. Ultralytics YOLO11 una pietra miliare in questo sforzo, offrendo maggiore velocità, precisione e flessibilità. È progettato per applicazioni in tempo reale e edge, rendendolo ideale per settori come la sanità e la guida autonoma. Sia che utilizziate ilPython Ultralytics o la Ultralytics senza codice, YOLO11 le complesse attività di Vision AI. Offre potenti funzionalità di visione artificiale, rendendolo una scelta eccellente per sviluppatori e aziende.

Dai un'occhiata al nostro repository GitHub e unisciti alla nostra community attiva per saperne di più sull'IA. Esplora come la Vision AI sta guidando l'innovazione in settori come l'assistenza sanitaria e l'agricoltura.

Tutto quello che c'è da sapere su Ultralytics YOLO11 e le sue applicazioni

Capire YOLO11: miglioramenti rispetto alle versioni precedenti

Lancio del modello YOLO11 : Opzioni open-source e aziendali

Esplorazione delle caratteristiche di YOLO11 di nuova generazione

Applicazioni YOLO11 in tempo reale

YOLO11 per gli sviluppatori di intelligenza artificiale: Provatelo voi stessi

Codice YOLO11

YOLO11: Il futuro dell'intelligenza artificiale della visione

Leggi di più in questa categoria

Uno sguardo all'utilizzoYOLO Ultralytics per il rilevamento delle minacce tramite IA

Automatizzazione della gestione degli incidenti stradali con Ultralytics

Scopri perché Ultralytics è più facile da implementare in produzione!

Costruiamo insieme il futuro
dell'AI!

Tutto quello che c'è da sapere su Ultralytics YOLO11 e le sue applicazioni

Capire YOLO11: miglioramenti rispetto alle versioni precedenti

Lancio del modello YOLO11 : Opzioni open-source e aziendali

Esplorazione delle caratteristiche di YOLO11 di nuova generazione

Applicazioni YOLO11 in tempo reale

YOLO11 per gli sviluppatori di intelligenza artificiale: Provatelo voi stessi

Codice YOLO11

YOLO11: Il futuro dell'intelligenza artificiale della visione

Leggi di più in questa categoria

Uno sguardo all'utilizzoYOLO Ultralytics per il rilevamento delle minacce tramite IA

Automatizzazione della gestione degli incidenti stradali con Ultralytics

Scopri perché Ultralytics è più facile da implementare in produzione!

Costruiamo insieme il futuro dell'AI!

Costruiamo insieme il futuro
dell'AI!