Scopri YOLO26: vision AI di prossima generazione.
Ultralytics
Ultralytics YOLO

L'evoluzione del rilevamento oggetti e dei modelli YOLO di Ultralytics

Unisciti a noi mentre guardiamo indietro all'evoluzione del rilevamento oggetti. Ci concentreremo su come i modelli YOLO (You Only Look Once) siano avanzati negli ultimi anni.

ABAbirami Vina
4 min read
L'evoluzione del rilevamento oggetti e dei modelli YOLO

La visione artificiale è un sottocampo dell'intelligenza artificiale (AI) che si concentra sull'insegnare alle macchine a vedere e comprendere immagini e video, in modo simile a come gli esseri umani percepiscono il mondo reale. Sebbene riconoscere oggetti o identificare azioni sia naturale per gli esseri umani, questi compiti richiedono tecniche di visione artificiale specifiche e specializzate quando si parla di macchine. Ad esempio, un compito chiave nella visione artificiale è il rilevamento oggetti, che consiste nell'identificare e localizzare oggetti all'interno di immagini o video.

Dagli anni '60, i ricercatori lavorano per migliorare il modo in cui i computer possono rilevare oggetti. I primi metodi, come il template matching, prevedevano lo scorrimento di un modello predefinito su un'immagine per trovare corrispondenze. Sebbene innovativi, questi approcci avevano difficoltà con i cambiamenti nelle dimensioni, nell'orientamento dell'oggetto e nell'illuminazione. Oggi disponiamo di modelli avanzati come Ultralytics YOLO11, in grado di rilevare con precisione impressionante anche oggetti piccoli e parzialmente nascosti, noti come oggetti occlusi.

Mentre la visione artificiale continua a evolversi, è importante guardare indietro a come queste tecnologie si sono sviluppate. In questo articolo esploreremo l'evoluzione del rilevamento oggetti e metteremo in luce la trasformazione dei modelli YOLO (You Only Look Once). Iniziamo!

Link to this sectionLe origini della visione artificiale#

Prima di addentrarci nel rilevamento oggetti, diamo un'occhiata a come è iniziata la visione artificiale. Le origini della visione artificiale risalgono alla fine degli anni '50 e all'inizio degli anni '60, quando gli scienziati iniziarono a esplorare come il cervello elabora le informazioni visive. In esperimenti con gatti, i ricercatori David Hubel e Torsten Wiesel scoprirono che il cervello reagisce a pattern semplici come bordi e linee. Questo ha formato la base dell'idea dietro l' estrazione di caratteristiche: il concetto che i sistemi visivi rilevano e riconoscono caratteristiche di base nelle immagini, come i bordi, prima di passare a pattern più complessi.

Esperimento sul cervello di gatto che ha ispirato l'estrazione di caratteristiche nella computer vision

Fig 1. Imparare come reagisce il cervello di un gatto alle barre di luce ha contribuito a sviluppare l'estrazione di caratteristiche nella visione artificiale.

Nello stesso periodo, è emersa una nuova tecnologia in grado di trasformare immagini fisiche in formati digitali, suscitando interesse su come le macchine potessero elaborare le informazioni visive. Nel 1966, il Summer Vision Project del Massachusetts Institute of Technology (MIT) ha fatto progredire ulteriormente le cose. Sebbene il progetto non abbia avuto pieno successo, mirava a creare un sistema in grado di separare il primo piano dallo sfondo nelle immagini. Per molti nella comunità di visione AI, questo progetto segna l'inizio ufficiale della visione artificiale come campo scientifico.

Link to this sectionComprendere la storia del rilevamento oggetti#

Con l'avanzamento della visione artificiale tra la fine degli anni '90 e l'inizio degli anni 2000, i metodi di rilevamento oggetti sono passati da tecniche di base come il template matching ad approcci più avanzati. Un metodo popolare era Haar Cascade, ampiamente utilizzato per compiti come il rilevamento volti. Funzionava scansionando le immagini con una finestra mobile, verificando caratteristiche specifiche come bordi o texture in ogni sezione dell'immagine e poi combinando queste caratteristiche per rilevare oggetti come i volti. Haar Cascade era molto più veloce dei metodi precedenti.

Utilizzo di Haar Cascade per il rilevamento dei volti

Fig 2. Utilizzo di Haar Cascade per il rilevamento volti.

Accanto a questi, sono stati introdotti anche metodi come Histogram of Oriented Gradients (HOG) e le Support Vector Machines (SVM). HOG utilizzava la tecnica della finestra mobile per analizzare come cambiavano luci e ombre in piccole sezioni di un'immagine, aiutando a identificare oggetti in base alla loro forma. Le SVM poi classificavano queste caratteristiche per determinare l'identità dell'oggetto. Questi metodi miglioravano la precisione, ma faticavano ancora in ambienti reali ed erano più lenti rispetto alle tecniche odierne.

Link to this sectionLa necessità di un rilevamento oggetti in tempo reale#

Negli anni 2010, l'ascesa del deep learning e delle Convolutional Neural Networks (CNNs) ha portato a un cambiamento importante nel rilevamento oggetti. Le CNN hanno reso possibile per i computer imparare automaticamente caratteristiche importanti da grandi quantità di dati, rendendo il rilevamento molto più accurato.

I primi modelli come R-CNN (Region-based Convolutional Neural Networks) hanno rappresentato un grande miglioramento nella precisione, aiutando a identificare gli oggetti in modo più accurato rispetto ai metodi precedenti.

Tuttavia, questi modelli erano lenti perché elaboravano le immagini in più fasi, rendendoli poco pratici per applicazioni in tempo reale in settori come le auto a guida autonoma o la videosorveglianza.

Concentrandosi sull'aumento della velocità, sono stati sviluppati modelli più efficienti. Modelli come Fast R-CNN e Faster R-CNN hanno contribuito a raffinare il modo in cui venivano scelte le regioni di interesse e a ridurre il numero di passaggi necessari per il rilevamento. Sebbene ciò abbia reso il rilevamento oggetti più veloce, non era ancora abbastanza rapido per molte applicazioni reali che richiedevano risultati istantanei. La crescente domanda di rilevamento in tempo reale ha spinto lo sviluppo di soluzioni ancora più rapide ed efficienti, in grado di bilanciare velocità e precisione.

Confronto delle velocità di R-CNN, Fast R-CNN e Faster R-CNN

Fig 3. Confronto tra le velocità di R-CNN, Fast R-CNN e Faster R-CNN.

Link to this sectionModelli YOLO (You Only Look Once): Un traguardo importante#

YOLO è un modello di rilevamento oggetti che ha ridefinito la visione artificiale abilitando il rilevamento in tempo reale di oggetti multipli in immagini e video, rendendolo alquanto unico rispetto ai metodi di rilevamento precedenti. Invece di analizzare ogni oggetto rilevato individualmente, l' architettura di YOLO tratta il rilevamento oggetti come un unico compito, prevedendo sia la posizione che la classe degli oggetti in un colpo solo utilizzando le CNN.

Il modello funziona dividendo un'immagine in una griglia, in cui ogni parte è responsabile del rilevamento degli oggetti nella rispettiva area. Esegue molteplici predizioni per ogni sezione e filtra i risultati meno affidabili, mantenendo solo quelli accurati.

Una panoramica di come funziona YOLO

Fig 4. Una panoramica su come funziona YOLO.

L'introduzione di YOLO nelle applicazioni di visione artificiale ha reso il rilevamento oggetti molto più veloce ed efficiente rispetto ai modelli precedenti. Grazie alla sua velocità e precisione, YOLO è diventato rapidamente una scelta popolare per soluzioni in tempo reale in settori come la produzione, l'assistenza sanitaria e la robotica.

Un altro punto importante da notare è che, poiché YOLO era open-source, sviluppatori e ricercatori sono stati in grado di migliorarlo continuamente, portando a versioni ancora più avanzate.

Link to this sectionIl percorso da YOLO a YOLO11#

I modelli YOLO sono migliorati costantemente nel tempo, basandosi sui progressi di ogni versione. Insieme a prestazioni migliori, questi miglioramenti hanno reso i modelli più facili da usare per le persone con diversi livelli di esperienza tecnica.

Ad esempio, quando è stato introdotto Ultralytics YOLOv5, implementare i modelli è diventato più semplice con PyTorch, consentendo a una gamma più ampia di utenti di lavorare con AI avanzata. Ha unito precisione e usabilità, dando a più persone la possibilità di implementare il rilevamento oggetti senza dover essere esperti di programmazione.

L'evoluzione dei modelli YOLO

Fig 5. L'evoluzione dei modelli YOLO.

Ultralytics YOLOv8 ha continuato questo progresso aggiungendo il supporto per compiti come la segmentazione di istanze e rendendo i modelli più flessibili. È diventato più facile utilizzare YOLO sia per applicazioni di base che più complesse, rendendolo utile in una varietà di scenari.

Con l'ultimo modello, Ultralytics YOLO11, sono state apportate ulteriori ottimizzazioni. Riducendo il numero di parametri pur migliorando la precisione, è ora più efficiente per i compiti in tempo reale. Che tu sia uno sviluppatore esperto o nuovo nell'AI, YOLO11 offre un approccio avanzato al rilevamento oggetti facilmente accessibile.

Link to this sectionConoscere YOLO11: Nuove caratteristiche e miglioramenti#

YOLO11, lanciato all'evento ibrido annuale di Ultralytics, YOLO Vision 2024 (YV24), supporta gli stessi compiti di visione artificiale di YOLOv8, come il rilevamento oggetti, la segmentazione di istanze, la classificazione delle immagini e la stima della posa. Quindi, gli utenti possono passare facilmente a questo nuovo modello senza dover adattare i propri flussi di lavoro. Inoltre, l'architettura aggiornata di YOLO11 rende le previsioni ancora più precise. Infatti, YOLO11m ottiene una precisione media (mAP) più elevata sul dataset COCO con il 22% di parametri in meno rispetto a YOLOv8m.

YOLO11 è anche costruito per funzionare in modo efficiente su una gamma di piattaforme, da smartphone e altri dispositivi edge a sistemi cloud più potenti. Questa flessibilità garantisce prestazioni fluide su diverse configurazioni hardware per applicazioni in tempo reale. Inoltre, YOLO11 è più veloce ed efficiente, riducendo i costi computazionali e accelerando i tempi di inferenza. Che tu stia utilizzando il pacchetto Python di Ultralytics o l' Ultralytics HUB senza codice, è facile integrare YOLO11 nei tuoi flussi di lavoro esistenti.

Link to this sectionIl futuro dei modelli YOLO e del rilevamento oggetti#

L'impatto del rilevamento oggetti avanzato sulle applicazioni in tempo reale e sull'AI edge si sente già in tutti i settori. Poiché settori come petrolio e gas, sanità e vendita al dettaglio si affidano sempre più all'AI, la richiesta di un rilevamento oggetti veloce e preciso continua a crescere. YOLO11 mira a rispondere a questa domanda abilitando un rilevamento ad alte prestazioni anche su dispositivi con potenza di calcolo limitata.

Con la crescita dell' edge AI, è probabile che modelli di rilevamento oggetti come YOLO11 diventino ancora più essenziali per il processo decisionale in tempo reale in ambienti dove velocità e precisione sono critiche. Con continui miglioramenti nel design e nell'adattabilità, il futuro del rilevamento oggetti sembra destinato a portare ancora più innovazioni in una varietà di applicazioni.

Link to this sectionPunti chiave#

Il rilevamento oggetti ha fatto molta strada, evolvendosi da metodi semplici alle avanzate tecniche di deep learning che vediamo oggi. I modelli YOLO sono stati al centro di questo progresso, offrendo un rilevamento in tempo reale più veloce e accurato in diversi settori. YOLO11 si basa su questa eredità, migliorando l'efficienza, riducendo i costi computazionali e aumentando la precisione, rendendolo una scelta affidabile per una varietà di applicazioni in tempo reale. Con i continui progressi nell'AI e nella visione artificiale, il futuro del rilevamento oggetti appare luminoso, con spazio per ulteriori miglioramenti in velocità, precisione e adattabilità.

Curioso dell'IA? Resta in contatto con la nostra community per continuare a imparare! Dai un'occhiata al nostro repository GitHub per scoprire come stiamo usando l'IA per creare soluzioni innovative in settori come la produzione e la sanità. 🚀

Explore solutions

Real-time AI that works with your team

AI nella Robotica

Potenzia macchine più intelligenti con i modelli Ultralytics YOLO. La Vision AI nella robotica guida la navigazione autonoma, la percezione, il tracciamento degli oggetti e il controllo in tempo reale.

Scopri di più
Real-time AI that works with your team

IA nella logistica

Semplifica la logistica con i modelli Ultralytics YOLO. La Vision AI abilita l'ispezione dei pacchi, lo smistamento, il tracciamento dei veicoli e il monitoraggio della sicurezza in magazzino in tempo reale.

Scopri di più
Real-time AI that works with your team

AI nel settore Retail

Reimmagina il retail con i modelli Ultralytics YOLO. La Vision AI alimenta il tracciamento dell'inventario, il monitoraggio degli scaffali, la gestione delle code e insight più intelligenti sui clienti.

Scopri di più
Real-time AI that works with your team

IA nel settore sanitario

Crea soluzioni sanitarie con i modelli Ultralytics YOLO. La vision AI nella sanità potenzia l'imaging medico più rapido, diagnosi più intelligenti e il monitoraggio dei pazienti.

Scopri di più
Real-time AI that works with your team

IA nella produzione

Ottimizza la produzione con i modelli Ultralytics YOLO. La Vision AI guida il controllo qualità, il rilevamento dei difetti, la conformità ai DPI e l'automazione della linea di assemblaggio.

Scopri di più
Real-time AI that works with your operation

AI nel settore automobilistico

Applica la computer vision al settore automobilistico con i modelli Ultralytics YOLO. La vision AI migliora la sicurezza stradale, l'assistenza alla guida e l'automazione dei veicoli per strade più intelligenti.

Scopri di più
Real-time AI tailored to your operation

AI in Agricoltura

Porta la vision AI nell'agricoltura intelligente con i modelli Ultralytics YOLO. Potenzia il monitoraggio delle colture, il tracciamento del bestiame e l'agricoltura di precisione per rese più elevate e intelligenti.

Scopri di più
Real-time AI that works with your team

AI nella Robotica

Potenzia macchine più intelligenti con i modelli Ultralytics YOLO. La Vision AI nella robotica guida la navigazione autonoma, la percezione, il tracciamento degli oggetti e il controllo in tempo reale.

Scopri di più
Real-time AI that works with your team

IA nella logistica

Semplifica la logistica con i modelli Ultralytics YOLO. La Vision AI abilita l'ispezione dei pacchi, lo smistamento, il tracciamento dei veicoli e il monitoraggio della sicurezza in magazzino in tempo reale.

Scopri di più
Real-time AI that works with your team

AI nel settore Retail

Reimmagina il retail con i modelli Ultralytics YOLO. La Vision AI alimenta il tracciamento dell'inventario, il monitoraggio degli scaffali, la gestione delle code e insight più intelligenti sui clienti.

Scopri di più
Real-time AI that works with your team

IA nel settore sanitario

Crea soluzioni sanitarie con i modelli Ultralytics YOLO. La vision AI nella sanità potenzia l'imaging medico più rapido, diagnosi più intelligenti e il monitoraggio dei pazienti.

Scopri di più
Real-time AI that works with your team

IA nella produzione

Ottimizza la produzione con i modelli Ultralytics YOLO. La Vision AI guida il controllo qualità, il rilevamento dei difetti, la conformità ai DPI e l'automazione della linea di assemblaggio.

Scopri di più
Real-time AI that works with your operation

AI nel settore automobilistico

Applica la computer vision al settore automobilistico con i modelli Ultralytics YOLO. La vision AI migliora la sicurezza stradale, l'assistenza alla guida e l'automazione dei veicoli per strade più intelligenti.

Scopri di più
Real-time AI tailored to your operation

AI in Agricoltura

Porta la vision AI nell'agricoltura intelligente con i modelli Ultralytics YOLO. Potenzia il monitoraggio delle colture, il tracciamento del bestiame e l'agricoltura di precisione per rese più elevate e intelligenti.

Scopri di più
Real-time AI that works with your team

AI nella Robotica

Potenzia macchine più intelligenti con i modelli Ultralytics YOLO. La Vision AI nella robotica guida la navigazione autonoma, la percezione, il tracciamento degli oggetti e il controllo in tempo reale.

Scopri di più
Real-time AI that works with your team

IA nella logistica

Semplifica la logistica con i modelli Ultralytics YOLO. La Vision AI abilita l'ispezione dei pacchi, lo smistamento, il tracciamento dei veicoli e il monitoraggio della sicurezza in magazzino in tempo reale.

Scopri di più
Real-time AI that works with your team

AI nel settore Retail

Reimmagina il retail con i modelli Ultralytics YOLO. La Vision AI alimenta il tracciamento dell'inventario, il monitoraggio degli scaffali, la gestione delle code e insight più intelligenti sui clienti.

Scopri di più
Real-time AI that works with your team

IA nel settore sanitario

Crea soluzioni sanitarie con i modelli Ultralytics YOLO. La vision AI nella sanità potenzia l'imaging medico più rapido, diagnosi più intelligenti e il monitoraggio dei pazienti.

Scopri di più
Real-time AI that works with your team

IA nella produzione

Ottimizza la produzione con i modelli Ultralytics YOLO. La Vision AI guida il controllo qualità, il rilevamento dei difetti, la conformità ai DPI e l'automazione della linea di assemblaggio.

Scopri di più
Real-time AI that works with your operation

AI nel settore automobilistico

Applica la computer vision al settore automobilistico con i modelli Ultralytics YOLO. La vision AI migliora la sicurezza stradale, l'assistenza alla guida e l'automazione dei veicoli per strade più intelligenti.

Scopri di più
Real-time AI tailored to your operation

AI in Agricoltura

Porta la vision AI nell'agricoltura intelligente con i modelli Ultralytics YOLO. Potenzia il monitoraggio delle colture, il tracciamento del bestiame e l'agricoltura di precisione per rese più elevate e intelligenti.

Scopri di più

Costruiamo insieme il futuro dell'AI!

Inizia il tuo viaggio con il futuro del machine learning