Sintonizzati su YOLO Vision 2025!
25 settembre 2025
10:00 — 18:00 BST
Evento ibrido
Yolo Vision 2024

Come utilizzare Ultralytics YOLO11 per la classificazione delle immagini

Abirami Vina

4 minuti di lettura

11 novembre 2024

Scopri come il nuovo modello Ultralytics YOLO11 migliora la classificazione delle immagini, offrendo una migliore accuratezza per le attività in agricoltura, vendita al dettaglio e monitoraggio della fauna selvatica.

Supponiamo che un robot stia guardando due gatti, uno nero e uno bianco, e debba capire qual è quale. Per farlo, può utilizzare la classificazione delle immagini, un'attività di computer vision che aiuta a identificare e categorizzare oggetti o scene in un'immagine. Infatti, grazie ai recenti progressi nell'intelligenza artificiale (IA), la classificazione delle immagini può essere utilizzata in un'ampia varietà di applicazioni che vanno dal monitoraggio degli animali al manufacturing e all'agricoltura con il rilevamento di malattie delle colture.

Uno degli ultimi progressi nella classificazione delle immagini è il modello Ultralytics YOLO11. Lanciato all'evento ibrido annuale di Ultralytics, YOLO Vision 2024 (YV24), YOLO11 è progettato per affrontare un'ampia varietà di attività di Vision AI, inclusa la classificazione delle immagini, con facilità e precisione.

In questo articolo, esploreremo i fondamenti della classificazione delle immagini, discuteremo le applicazioni nel mondo reale e ti mostreremo come utilizzare YOLO11 per la classificazione delle immagini tramite il pacchetto Python di Ultralytics. Vedremo anche come provare le funzionalità di YOLO11 sull'HUB di Ultralytics in pochi semplici passaggi. Iniziamo!

__wf_reserved_inherit
Fig. 1. Esempio di utilizzo di Ultralytics YOLO11 per classificare un gatto persiano.

Cos'è la classificazione delle immagini?

La classificazione delle immagini funziona assegnando un'etichetta o un tag a un'immagine in base a schemi appresi da immagini precedentemente etichettate. Analizzando attentamente i pixel di un'immagine, un modello di computer vision può trovare la corrispondenza migliore per l'immagine. Modelli affidabili come YOLO11 possono gestire questo processo senza problemi. L'architettura del modello YOLO11 consente di elaborare immagini o fotogrammi video quasi istantaneamente, rendendolo ideale per applicazioni che necessitano di una classificazione delle immagini rapida e accurata.

Per comprendere appieno la portata della classificazione delle immagini, è utile distinguerla da altre attività come il rilevamento di oggetti. Mentre la classificazione delle immagini etichetta un'intera immagine, il rilevamento di oggetti identifica e localizza ogni oggetto all'interno dell'immagine. 

__wf_reserved_inherit
Fig 2. Un confronto tra classificazione delle immagini, rilevamento degli oggetti e segmentazione delle immagini.

Consideriamo l'immagine di una giraffa. Nella classificazione delle immagini, il modello potrebbe etichettare l'intera immagine semplicemente come una giraffa in base al suo contenuto complessivo. Tuttavia, con il rilevamento degli oggetti, il modello non si limita a identificare la giraffa, ma posiziona anche un riquadro di delimitazione attorno alla giraffa, individuandone la posizione esatta all'interno dell'immagine.

Immagina ora una giraffa in piedi vicino a un albero nella savana con altri animali. Un modello di classificazione delle immagini potrebbe etichettare l'intera scena come savana o semplicemente fauna selvatica. Tuttavia, con l'object detection, il modello identificherebbe ogni elemento individualmente, riconoscendo la giraffa, l'albero e gli altri animali, ciascuno con il proprio bounding box.

Applicazioni di classificazione delle immagini YOLO11

L'accuratezza e le prestazioni del modello Ultralytics YOLO11 per la classificazione delle immagini lo rendono utile in una vasta gamma di settori. Esploriamo alcune delle principali applicazioni di YOLO11 nella classificazione delle immagini.

Classificazione delle immagini YOLO11 in agricoltura

La classificazione delle immagini può aiutare a semplificare molte funzioni nel settore dell'agricoltura. Nello specifico, utilizzando modelli di classificazione delle immagini come YOLO11, gli agricoltori possono monitorare costantemente la salute dei loro raccolti, rilevare malattie gravi e identificare eventuali infestazioni di parassiti con elevata precisione. 

Ecco uno sguardo a come funziona:

  • Acquisizione di immagini: I dispositivi Internet of Things (IoT) come telecamere e droni possono essere implementati per acquisire immagini in tempo reale delle colture da varie angolazioni e posizioni nei campi.
  • Elaborazione: A seconda delle risorse disponibili e della connettività, le immagini possono essere elaborate in loco tramite edge computing o caricate sul cloud per un'analisi più approfondita.
  • Classificazione delle immagini con YOLO11: Il modello YOLO11 può analizzare queste immagini per classificare varie condizioni delle colture. Le classi comuni potrebbero includere sano, malato, infestato da parassiti o carente di nutrienti, aiutando a individuare problemi specifici che interessano diverse aree del campo.
  • Generazione di insight: Sulla base delle classificazioni, YOLO11 fornisce informazioni sugli indicatori di salute delle colture, aiutando gli agricoltori a rilevare i primi segni di malattia, identificare i punti caldi dei parassiti o individuare le carenze nutrizionali.
  • Processo decisionale informato: Grazie a queste informazioni, gli agricoltori possono prendere decisioni mirate sull'irrigazione, la fertilizzazione e il controllo dei parassiti, applicando le risorse solo dove sono più necessarie.
__wf_reserved_inherit
Fig. 3. Un esempio di diverse classi di foglie, da sane a infette.

Classificazione delle immagini YOLO11 nel settore retail

La classificazione delle immagini può migliorare significativamente l'esperienza di shopping al dettaglio, rendendola più personalizzata e intuitiva. I rivenditori possono utilizzare modelli di computer vision addestrati su misura per riconoscere i prodotti nel loro inventario e integrare questa funzionalità nelle loro app mobili o siti web. I clienti possono quindi cercare i prodotti semplicemente caricando una foto, rendendo lo shopping più veloce e conveniente.

Una volta che un cliente carica un'immagine in un sistema di ricerca visiva, accadono diverse cose dietro le quinte prima che vengano visualizzati i risultati della ricerca. 

Innanzitutto, il rilevamento oggetti può essere utilizzato per individuare gli elementi principali nell'immagine, come l'identificazione di un capo di abbigliamento o un mobile e la sua separazione dallo sfondo. Successivamente, la classificazione delle immagini può essere utilizzata per classificare ulteriormente ogni elemento, riconoscendo se si tratta di una giacca, una camicia, un divano o un tavolo. 

Con queste informazioni, il sistema può visualizzare prodotti simili disponibili per l'acquisto, il che è particolarmente utile per trovare articoli unici o di tendenza che sono difficili da descrivere solo con le parole. La stessa tecnologia può anche aiutare a semplificare altre attività di vendita al dettaglio, come la gestione dell'inventario, riconoscendo e categorizzando automaticamente gli articoli.

__wf_reserved_inherit
Fig. 4. Una piattaforma di ricerca visiva basata sulla classificazione delle immagini in azione.

Monitoraggio della fauna selvatica con la classificazione delle immagini YOLO11

Tradizionalmente, il monitoraggio degli animali selvatici è un compito noioso che coinvolge molte persone che ordinano e analizzano manualmente migliaia di foto. Con le modalità di visione artificiale come YOLO11, i ricercatori possono monitorare automaticamente gli animali a un ritmo più veloce. Le telecamere possono essere posizionate negli habitat naturali per scattare foto. Il modello di visione artificiale può quindi essere utilizzato per analizzare queste foto e classificare gli animali al loro interno (se presenti). Un sistema di questo tipo può aiutare i ricercatori a studiare e tracciare le popolazioni animali, i loro modelli di migrazione, ecc.

Un altro modo in cui l'IA e i modelli di computer vision come YOLO11 possono aiutare in questo campo è semplificare il processo di classificazione delle specie in via di estinzione. Identificando le potenziali specie o categorie di razza a cui un animale può appartenere, questi modelli possono fornire dati essenziali per i ricercatori. Ad esempio, l'Università della Tasmania (UTAS) ha sviluppato un sistema basato sulla classificazione delle immagini per monitorare la diversa fauna selvatica della Tasmania. Le previsioni dei modelli possono quindi aiutare scienziati e ricercatori a tenere d'occhio l'attività e il comportamento degli animali, che possono segnalare minacce come il bracconaggio o la perdita di habitat

__wf_reserved_inherit
Fig. 5. YOLO11 prevede le possibili razze a cui un cane potrebbe appartenere.

Prova la classificazione delle immagini con il modello YOLO11

Ora che abbiamo discusso di cosa sia la classificazione delle immagini e ne abbiamo esplorato alcune applicazioni, diamo un'occhiata a come puoi provare la classificazione delle immagini con il nuovo modello YOLO11. Ci sono due modi semplici per iniziare: utilizzando il pacchetto Python Ultralytics o tramite Ultralytics HUB. Esamineremo entrambe le opzioni.

Esecuzione di inferenze utilizzando YOLO11

Per iniziare con il pacchetto Python Ultralytics, è sufficiente installarlo utilizzando pip, conda o Docker. In caso di problemi, consulta la nostra Guida ai problemi comuni per utili consigli per la risoluzione dei problemi.

Una volta installato il pacchetto, è possibile utilizzare il seguente codice per caricare una variante del modello di classificazione delle immagini YOLO11 ed eseguire un'inferenza su un'immagine. Eseguire un'inferenza significa utilizzare un modello addestrato per fare previsioni su dati nuovi e non visti. Puoi provarlo con un'immagine a tua scelta!

__wf_reserved_inherit
Fig. 6. Esecuzione di inferenze utilizzando il modello YOLO11.

Addestramento di un modello di classificazione YOLO11 personalizzato

Puoi anche utilizzare lo stesso pacchetto Python per addestrare un modello di classificazione YOLO11 personalizzato. L'addestramento personalizzato ti consente di ottimizzare un modello YOLO11 per le tue esigenze specifiche. Ad esempio, se stai sviluppando un'app per classificare diverse razze di gatti, puoi addestrare un modello YOLO11 personalizzato appositamente per questo scopo.

Il codice seguente mostra come caricare e addestrare un modello di classificazione delle immagini YOLO11. Ti consente di trasferire pesi pre-addestrati, utilizzando la conoscenza di un modello esistente per migliorare le prestazioni del tuo modello. Puoi specificare un set di dati, come il set di dati "fashion-mnist", che è un set ben noto di immagini in scala di grigi di articoli di abbigliamento (camicie, pantaloni, scarpe, ecc.). L'addestramento del modello su questo set di dati gli insegna a riconoscere diverse categorie di abbigliamento. Puoi sostituire "fashion-mnist" con qualsiasi set di dati adatto al tuo progetto, come razze di gatti o tipi di piante.

__wf_reserved_inherit
Fig 7. Addestramento personalizzato di un modello YOLO11 per la classificazione di immagini.

Prova YOLO11 su Ultralytics HUB

Sebbene l'utilizzo del pacchetto Ultralytics sia semplice, richiede una certa conoscenza di Python. Se stai cercando un'opzione più adatta ai principianti, puoi utilizzare Ultralytics HUB, una piattaforma progettata per rendere semplice e accessibile il training e il deployment di diversi modelli YOLO. Per iniziare, dovrai creare un account.

Una volta effettuato l'accesso, vai alla sezione 'Models' e seleziona il modello YOLO11 per la classificazione delle immagini. Vedrai una gamma di dimensioni del modello disponibili: nano, small, medium, large ed extra-large. Dopo aver scelto un modello, puoi caricare un'immagine nella sezione 'Preview', dove le previsioni appariranno sul lato sinistro della pagina una volta che l'immagine è stata elaborata.

__wf_reserved_inherit
Fig 8. Utilizzo di Ultralytics HUB per eseguire un'inferenza.

Punti chiave

YOLO11 offre potenti funzionalità di classificazione delle immagini che aprono nuove possibilità in vari settori. Dal miglioramento del monitoraggio delle colture in agricoltura e del potenziamento delle ricerche di prodotti nel settore retail al supporto della conservazione della fauna selvatica, la velocità e la precisione di YOLO11 lo rendono ideale per diverse applicazioni. Con le opzioni per l'addestramento personalizzato tramite il pacchetto Python Ultralytics o una configurazione intuitiva e senza codice su Ultralytics HUB, gli utenti possono facilmente integrare YOLO11 nei loro flussi di lavoro. Man mano che sempre più settori adottano soluzioni di intelligenza artificiale, YOLO11 offre uno strumento flessibile e ad alte prestazioni che supporta l'innovazione e i progressi pratici.

Per saperne di più, visita il nostro repository GitHub e interagisci con la nostra community. Esplora le applicazioni dell'IA nelle auto a guida autonoma e nell'assistenza sanitaria nelle nostre pagine delle soluzioni. 🚀

Costruiamo insieme il futuro
dell'AI!

Inizia il tuo viaggio con il futuro del machine learning

Inizia gratis
Link copiato negli appunti