Confronto tra Ultralytics YOLO11 e i modelli YOLO precedenti
Confronta Ultralytics YOLOv8, YOLOv9, YOLOv10 e Ultralytics YOLO11 per capire come questi modelli si sono evoluti e migliorati dal 2023 al 2025.

Dall'automazione delle attività quotidiane al supporto per prendere decisioni informate in tempo reale, l'intelligenza artificiale (IA) sta rimodellando il futuro di diversi settori. Un'area particolarmente affascinante dell'IA è la visione artificiale, nota anche come vision AI. Si concentra sul permettere alle macchine di analizzare e interpretare i dati visivi proprio come facciamo noi esseri umani.
Nello specifico, i modelli di visione artificiale stanno guidando innovazioni che migliorano sia la sicurezza che l'efficienza. Ad esempio, questi modelli vengono utilizzati nelle auto a guida autonoma per rilevare i pedoni e nelle telecamere di sicurezza per monitorare i locali 24 ore su 24.
Alcuni dei modelli di visione artificiale più noti sono i modelli YOLO (You Only Look Once), rinomati per le loro capacità di rilevamento oggetti in tempo reale. Nel corso del tempo, i modelli YOLO sono migliorati, con ogni nuova versione che offre prestazioni migliori e maggiore flessibilità.
Le versioni più recenti come Ultralytics YOLO11 possono gestire una varietà di attività, come segmentazione di istanze, classificazione di immagini, stima della posa e tracciamento multi-oggetto, con maggiore precisione, velocità e accuratezza rispetto al passato.
In questo articolo, confronteremo Ultralytics YOLOv8, YOLOv9, YOLOv10 e Ultralytics YOLO11 per avere un'idea migliore di come questi modelli si siano evoluti. Analizzeremo le loro caratteristiche principali, i risultati dei benchmark e le differenze di prestazioni. Iniziamo!
Link to this sectionUna panoramica di Ultralytics YOLOv8#
YOLOv8, rilasciato da Ultralytics il 10 gennaio 2023, ha rappresentato un importante passo avanti rispetto ai precedenti modelli YOLO. È ottimizzato per il rilevamento accurato in tempo reale, combinando approcci ben testati con aggiornamenti innovativi per risultati migliori.
Oltre al rilevamento oggetti, supporta anche le seguenti attività di visione artificiale: segmentazione di istanze, stima della posa, rilevamento oggetti con riquadri di delimitazione orientati (OBB) e classificazione di immagini. Un'altra caratteristica importante di YOLOv8 è che è disponibile in cinque diverse varianti di modello: Nano, Small, Medium, Large e X, così puoi scegliere il giusto equilibrio tra velocità e precisione in base alle tue esigenze.
Grazie alla sua versatilità e alle forti prestazioni, YOLOv8 può essere utilizzato in molte applicazioni del mondo reale, come sistemi di sicurezza, città intelligenti, assistenza sanitaria e automazione industriale.

Fig 1. Gestione dei parcheggi nelle città intelligenti con YOLOv8.
Link to this sectionCaratteristiche principali di YOLOv8#
Ecco uno sguardo più approfondito ad alcune delle altre caratteristiche chiave di YOLOv8:
- Architettura di rilevamento migliorata: YOLOv8 utilizza un backbone CSPDarknet ottimizzato. Questo backbone è ottimizzato per l'estrazione delle caratteristiche: il processo di identificazione e acquisizione di modelli o dettagli importanti dalle immagini di input che aiutano il modello a fare previsioni accurate.
- Head di rilevamento: Utilizza un design disaccoppiato anchor-free, il che significa che non si basa su forme di riquadri di delimitazione preimpostate (ancore) e impara invece a prevedere direttamente le posizioni degli oggetti. Grazie alla configurazione disaccoppiata, le attività di classificazione dell'oggetto e di previsione della sua posizione (regressione) vengono gestite separatamente, il che aiuta a migliorare l'accuratezza e ad accelerare l'addestramento.
- Equilibra accuratezza e velocità: Questo modello raggiunge un'accuratezza impressionante mantenendo tempi di inferenza rapidi, rendendolo adatto sia per ambienti cloud che edge.
- Facile da usare: YOLOv8 è progettato per essere semplice da iniziare: puoi iniziare a fare previsioni e vedere i risultati in pochi minuti utilizzando il pacchetto Python di Ultralytics.
Link to this sectionYOLOv9 si concentra sull'efficienza computazionale#
YOLOv9 è stato rilasciato il 21 febbraio 2024 da Chien-Yao Wang e Hong-Yuan Mark Liao dell'Institute of Information Science, Academia Sinica, Taiwan. Supporta attività come il rilevamento oggetti e la segmentazione di istanze.
Questo modello si basa su Ultralytics YOLOv5 e introduce due innovazioni principali: Programmable Gradient Information (PGI) e Generalized Efficient Layer Aggregation Network (GELAN).
PGI aiuta YOLOv9 a mantenere informazioni importanti mentre elabora i dati attraverso i suoi livelli, portando a risultati più accurati. Nel frattempo, GELAN migliora il modo in cui il modello utilizza i suoi livelli, aumentando le prestazioni e l'efficienza computazionale. Grazie a questi aggiornamenti, YOLOv9 può gestire attività in tempo reale su dispositivi edge e app mobili, dove le risorse di calcolo sono spesso limitate.

Fig 2. Comprendere come GELAN migliora l'accuratezza di YOLOv9.
Link to this sectionCaratteristiche principali di YOLOv9#
Ecco uno sguardo ad alcune delle altre caratteristiche chiave di YOLOv9:
- Alta precisione con efficienza: YOLOv9 offre un'elevata accuratezza di rilevamento senza consumare molta potenza di calcolo, rendendolo un'ottima scelta quando le risorse sono limitate.
- Modelli leggeri: Le varianti di modello leggero di YOLOv9 sono ottimizzate per distribuzioni edge e mobile.
- Facile da usare: YOLOv9 è supportato dal pacchetto Python di Ultralytics, quindi è semplice da configurare ed eseguire in ambienti diversi, sia che tu stia usando il codice o la riga di comando.
Link to this sectionYOLOv10 abilita il rilevamento oggetti senza NMS#
YOLOv10 è stato introdotto il 23 maggio 2024 da ricercatori della Tsinghua University ed è focalizzato sul rilevamento oggetti in tempo reale. Affronta le limitazioni delle versioni precedenti di YOLO eliminando la necessità di non-maximum suppression (NMS), un passaggio di post-elaborazione utilizzato per eliminare i rilevamenti duplicati, e perfezionando il design generale del modello. Ciò si traduce in un rilevamento oggetti più veloce ed efficiente, pur ottenendo un'accuratezza all'avanguardia.
Una parte vitale di ciò che rende possibile tutto questo è un approccio di addestramento noto come assegnazione di etichette doppie coerenti. Combina due strategie: una che consente a più previsioni di imparare dallo stesso oggetto (uno-a-molti) e un'altra che si concentra sulla scelta della migliore singola previsione (uno-a-uno). Poiché entrambe le strategie seguono le stesse regole di corrispondenza, il modello impara a evitare i duplicati da solo, quindi l'NMS non è richiesto.

Fig 3. YOLOv10 utilizza l'assegnazione di etichette doppie coerenti per l'addestramento senza NMS.
L'architettura di YOLOv10 utilizza anche un backbone CSPNet migliorato per apprendere le caratteristiche in modo più efficace e un collo PAN (Path Aggregation Network) che combina le informazioni provenienti da diversi livelli, rendendolo migliore nel rilevare sia oggetti piccoli che grandi. Questi miglioramenti rendono possibile l'utilizzo di YOLOv10 per applicazioni reali nella produzione, nel commercio al dettaglio e nella guida autonoma.
Link to this sectionCaratteristiche principali di YOLOv10#
Ecco alcune delle altre caratteristiche distintive di YOLOv10:
-
Convoluzioni a kernel grande: Il modello utilizza convoluzioni a kernel grande per catturare più contesto da aree più ampie dell'immagine, aiutandolo a comprendere meglio la scena generale.
-
Moduli di auto-attenzione parziale: Il modello incorpora moduli di auto-attenzione parziale per concentrarsi sulle parti più importanti dell'immagine senza utilizzare troppa potenza di calcolo, aumentando le prestazioni in modo efficiente.
-
Variante di modello unica: Oltre alle solite dimensioni di YOLOv10 (Nano, Small, Medium, Large e X), esiste anche una versione speciale chiamata YOLOv10b (Balanced). È un modello più ampio, il che significa che elabora più caratteristiche a ogni livello, il che aiuta a migliorare l'accuratezza bilanciando comunque velocità e dimensioni.
-
Facile da usare: YOLOv10 è compatibile con il pacchetto Python di Ultralytics, rendendolo facile da usare.
Link to this sectionUltralytics YOLO11: Velocità e accuratezza migliorate#
Quest'anno, il 30 settembre, Ultralytics ha lanciato ufficialmente YOLO11 - uno degli ultimi modelli della serie YOLO - durante il suo evento ibrido annuale, YOLO Vision 2024 (YV24).
Questa release ha introdotto miglioramenti significativi rispetto alle versioni precedenti. YOLO11 è più veloce, più accurato e altamente efficiente. Supporta l'intera gamma di attività di visione artificiale a cui gli utenti di YOLOv8 sono abituati, inclusi rilevamento oggetti, segmentazione di istanze e classificazione di immagini. Mantiene inoltre la compatibilità con i flussi di lavoro di YOLOv8, facilitando agli utenti il passaggio senza problemi alla nuova versione.
Oltre a questo, YOLO11 è progettato per soddisfare una vasta gamma di esigenze di calcolo, dai dispositivi edge leggeri ai potenti sistemi cloud. Il modello è disponibile sia come versione open-source che enterprise, rendendolo adattabile a diversi casi d'uso.
È un'ottima opzione per attività di precisione come l'imaging medico e il rilevamento satellitare, così come per applicazioni più ampie nei veicoli autonomi, nell'agricoltura e nell'assistenza sanitaria.

Fig 4. Utilizzo di Ultralytics YOLO11 per rilevare, contare e tracciare il traffico.
Link to this sectionCaratteristiche principali di YOLO11#
Ecco alcune delle altre caratteristiche uniche di YOLO11:
- Rilevamento veloce ed efficiente: YOLO11 presenta un'head di rilevamento progettata per una latenza minima, concentrandosi sulla velocità nei livelli di previsione finali senza compromettere le prestazioni.
- Estrazione delle caratteristiche migliorata: Un'architettura ottimizzata di backbone e collo migliora l'estrazione delle caratteristiche, portando a previsioni più precise.
- Distribuzione fluida tra le piattaforme: YOLO11 è ottimizzato per funzionare in modo efficiente su dispositivi edge, piattaforme cloud e GPU NVIDIA, garantendo l'adattabilità in ambienti diversi.
Link to this sectionBenchmarking dei modelli YOLO sul dataset COCO#
Quando esplori modelli diversi, non è sempre facile confrontarli semplicemente guardando le loro caratteristiche. È qui che entra in gioco il benchmarking. Eseguendo tutti i modelli sullo stesso dataset, possiamo misurare e confrontare oggettivamente le loro prestazioni. Diamo un'occhiata a come ogni modello si comporta sul dataset COCO.
Quando si confrontano i modelli YOLO, ogni nuova versione porta notevoli miglioramenti in termini di accuratezza, velocità e flessibilità. In particolare, YOLO11m fa un salto in avanti qui poiché utilizza il 22% di parametri in meno rispetto a YOLOv8m, il che significa che è più leggero e veloce da eseguire. Inoltre, nonostante le sue dimensioni ridotte, raggiunge una precisione media (mAP) più elevata sul dataset COCO. Questa metrica misura quanto bene il modello rileva e localizza gli oggetti, quindi un mAP più alto significa previsioni più accurate.

Fig 5. Benchmarking di YOLO11 e altri modelli YOLO sul dataset COCO.
Link to this sectionTest e confronto dei modelli YOLO su un video#
Esploriamo come questi modelli si comportano in una situazione del mondo reale.
Per confrontare YOLOv8, YOLOv9, YOLOv10 e YOLO11, tutti e quattro sono stati eseguiti sullo stesso video di traffico utilizzando un punteggio di confidenza di 0.3 (il modello visualizza solo i rilevamenti quando è fiducioso almeno al 30% di aver identificato correttamente un oggetto) e una dimensione dell'immagine di 640 per una valutazione equa. I risultati di rilevamento e tracciamento degli oggetti hanno evidenziato differenze chiave nell'accuratezza di rilevamento, velocità e precisione.
Dal primo frame, YOLO11 ha rilevato veicoli di grandi dimensioni come camion che YOLOv10 ha perso. YOLOv8 e YOLOv9 hanno mostrato prestazioni decenti ma variavano a seconda delle condizioni di illuminazione e delle dimensioni dell'oggetto. I veicoli più piccoli e distanti sono rimasti una sfida per tutti i modelli, sebbene YOLO11 abbia mostrato miglioramenti evidenti anche in quei rilevamenti.

Fig 6. Confronto di YOLOv8, YOLOv9, YOLOv10 e YOLO11.
In termini di velocità, tutti i modelli hanno operato tra 10 e 20 millisecondi per frame, abbastanza veloci da gestire attività in tempo reale a oltre 50 FPS. Da un lato, YOLOv8 e YOLOv9 hanno fornito rilevamenti costanti e affidabili durante tutto il video. È interessante notare che YOLOv10, progettato per una latenza inferiore, è stato più veloce ma ha mostrato alcune incoerenze nel rilevamento di determinati tipi di oggetti.
YOLO11, d'altra parte, si è distinto per la sua precisione, offrendo un solido equilibrio tra velocità e accuratezza. Sebbene nessuno dei modelli si sia comportato perfettamente in ogni frame, il confronto fianco a fianco ha chiaramente dimostrato che YOLO11 ha fornito le migliori prestazioni complessive.
Link to this sectionQuale modello YOLO è il migliore per le attività di visione artificiale?#
Selezionare un modello per un progetto dipende dai suoi requisiti specifici. Ad esempio, alcune applicazioni possono dare la priorità alla velocità, mentre altre potrebbero richiedere una maggiore accuratezza o affrontare vincoli di distribuzione che influenzano la decisione.
Un altro fattore importante è il tipo di attività di visione artificiale che devi affrontare. Se cerchi una maggiore flessibilità su attività diverse, YOLOv8 e YOLO11 sono buone opzioni.
Scegliere YOLOv8 o YOLO11 dipende davvero dalle tue esigenze. YOLOv8 è una solida opzione se sei nuovo alla visione artificiale e apprezzi una community più ampia, più tutorial e ampie integrazioni di terze parti.
D'altra parte, se stai cercando prestazioni all'avanguardia con migliore accuratezza e velocità, YOLO11 è la scelta migliore, sebbene arrivi con una community più piccola e meno integrazioni a causa del fatto che è una versione più recente.
Link to this sectionPunti chiave#
Da Ultralytics YOLOv8 a Ultralytics YOLO11, l'evoluzione della serie di modelli YOLO riflette una spinta costante verso modelli di visione artificiale più intelligenti. Ogni versione di YOLO porta aggiornamenti significativi in termini di velocità, accuratezza e precisione.
Mentre la visione artificiale continua ad avanzare, questi modelli offrono soluzioni affidabili alle sfide del mondo reale, dal rilevamento oggetti ai sistemi autonomi. Il continuo sviluppo dei modelli YOLO mostra quanta strada ha fatto il settore e quanto altro possiamo aspettarci in futuro.
Per saperne di più sull'IA, visita il nostro repository GitHub e interagisci con la nostra community. Scopri i progressi in tutti i settori, dalla visione artificiale nella produzione alla visione artificiale nell'assistenza sanitaria. Dai un'occhiata alle nostre opzioni di licenza per iniziare oggi stesso i tuoi progetti di visione artificiale.






