Yolo Vision Shenzhen
Shenzhen
Iscriviti ora

Come utilizzare Ultralytics YOLO11 per la classificazione delle immagini

Abirami Vina

4 minuti di lettura

11 novembre 2024

Scoprite come il nuovo modello Ultralytics YOLO11 migliora la classificazione delle immagini, offrendo una maggiore precisione per le attività di agricoltura, vendita al dettaglio e monitoraggio della fauna selvatica.

Supponiamo che un robot stia guardando due gatti, uno nero e uno bianco, e debba capire qual è quale. Per farlo, può utilizzare la classificazione delle immagini, un'attività di computer vision che aiuta a identificare e categorizzare oggetti o scene in un'immagine. Infatti, grazie ai recenti progressi nell'intelligenza artificiale (IA), la classificazione delle immagini può essere utilizzata in un'ampia varietà di applicazioni che vanno dal monitoraggio degli animali al manufacturing e all'agricoltura con il rilevamento di malattie delle colture.

Uno degli ultimi progressi nella classificazione delle immagini è il modelloYOLO11 diUltralytics . Lanciato in occasione dell'evento ibrido annuale diUltralytics, YOLO Vision 2024 (YV24), YOLO11 è stato progettato per affrontare con facilità e precisione un'ampia gamma di compiti di Vision AI, tra cui la classificazione delle immagini.

In questo articolo esploreremo i fondamenti della classificazione delle immagini, discuteremo le applicazioni reali e mostreremo come si può usare YOLO11 per la classificazione delle immagini attraverso il pacchettoUltralytics Python . Inoltre, vedremo come provare le funzionalità diYOLO11 sull'HUBUltralytics in pochi semplici passi. Iniziamo!

__wf_reserved_inherit
Figura 1. Un esempio di utilizzo di Ultralytics YOLO11 per classify un gatto persiano.

Cos'è la classificazione delle immagini?

La classificazione delle immagini funziona assegnando un'etichetta o un tag a un'immagine in base a modelli appresi da immagini precedentemente etichettate. Analizzando attentamente i pixel di un'immagine, un modello di computer vision può trovare la migliore corrispondenza per l'immagine. Modelli affidabili come YOLO11 sono in grado di gestire questo processo senza problemi. L'architettura del modello di YOLO11consente di elaborare immagini o fotogrammi video quasi istantaneamente, rendendolo ideale per le applicazioni che richiedono una classificazione rapida e accurata delle immagini.

Per comprendere appieno la portata della classificazione delle immagini, è utile distinguerla da altre attività come il rilevamento di oggetti. Mentre la classificazione delle immagini etichetta un'intera immagine, il rilevamento di oggetti identifica e localizza ogni oggetto all'interno dell'immagine. 

__wf_reserved_inherit
Fig 2. Un confronto tra classificazione delle immagini, rilevamento degli oggetti e segmentazione delle immagini.

Consideriamo l'immagine di una giraffa. Nella classificazione delle immagini, il modello potrebbe etichettare l'intera immagine semplicemente come una giraffa in base al suo contenuto complessivo. Tuttavia, con il rilevamento degli oggetti, il modello non si limita a identificare la giraffa, ma posiziona anche un riquadro di delimitazione attorno alla giraffa, individuandone la posizione esatta all'interno dell'immagine.

Immagina ora una giraffa in piedi vicino a un albero nella savana con altri animali. Un modello di classificazione delle immagini potrebbe etichettare l'intera scena come savana o semplicemente fauna selvatica. Tuttavia, con l'object detection, il modello identificherebbe ogni elemento individualmente, riconoscendo la giraffa, l'albero e gli altri animali, ciascuno con il proprio bounding box.

Applicazioni di classificazione delle immagini YOLO11

L'accuratezza e le prestazioni del modelloYOLO11 di Ultralytics per la classificazione delle immagini lo rendono utile in un'ampia gamma di settori. Esploriamo alcune delle principali applicazioni di YOLO11 nella classificazione delle immagini.

Classificazione delle immagini YOLO11 in agricoltura

La classificazione delle immagini può aiutare a semplificare molte funzioni nel settore agricolo e dell'allevamento. In particolare, utilizzando modelli di classificazione delle immagini come YOLO11, gli agricoltori possono monitorare costantemente lo stato di salute delle loro colture, detect gravi malattie e identificare eventuali infestazioni di parassiti con elevata precisione. 

Ecco uno sguardo a come funziona:

  • Acquisizione di immagini: I dispositivi Internet of Things (IoT) come telecamere e droni possono essere implementati per acquisire immagini in tempo reale delle colture da varie angolazioni e posizioni nei campi.
  • Elaborazione: A seconda delle risorse disponibili e della connettività, le immagini possono essere elaborate in loco tramite edge computing o caricate sul cloud per un'analisi più approfondita.
  • Classificazione delle immagini con YOLO11: il modello YOLO11 può analizzare queste immagini per classify varie condizioni delle colture. Le classi più comuni possono essere sane, malate, infestate da parassiti o carenti di nutrienti, aiutando a individuare i problemi specifici che interessano le diverse aree del campo.
  • Generazione di informazioni: Sulla base delle classificazioni, YOLO11 fornisce approfondimenti sugli indicatori di salute delle colture, aiutando gli agricoltori a detect primi segni di malattia, a identificare i punti caldi dei parassiti o a individuare le carenze di nutrienti.
  • Processo decisionale informato: Grazie a queste informazioni, gli agricoltori possono prendere decisioni mirate sull'irrigazione, la fertilizzazione e il controllo dei parassiti, applicando le risorse solo dove sono più necessarie.
__wf_reserved_inherit
Fig. 3. Un esempio di diverse classi di foglie, da sane a infette.

Classificazione delle immagini YOLO11 nella vendita al dettaglio

La classificazione delle immagini può migliorare significativamente l'esperienza di shopping al dettaglio, rendendola più personalizzata e intuitiva. I rivenditori possono utilizzare modelli di computer vision addestrati su misura per riconoscere i prodotti nel loro inventario e integrare questa funzionalità nelle loro app mobili o siti web. I clienti possono quindi cercare i prodotti semplicemente caricando una foto, rendendo lo shopping più veloce e conveniente.

Una volta che un cliente carica un'immagine in un sistema di ricerca visiva, accadono diverse cose dietro le quinte prima che vengano visualizzati i risultati della ricerca. 

Innanzitutto, il rilevamento oggetti può essere utilizzato per individuare gli elementi principali nell'immagine, come l'identificazione di un capo di abbigliamento o un mobile e la sua separazione dallo sfondo. Successivamente, la classificazione delle immagini può essere utilizzata per classificare ulteriormente ogni elemento, riconoscendo se si tratta di una giacca, una camicia, un divano o un tavolo. 

Con queste informazioni, il sistema può visualizzare prodotti simili disponibili per l'acquisto, il che è particolarmente utile per trovare articoli unici o di tendenza che sono difficili da descrivere solo con le parole. La stessa tecnologia può anche aiutare a semplificare altre attività di vendita al dettaglio, come la gestione dell'inventario, riconoscendo e categorizzando automaticamente gli articoli.

__wf_reserved_inherit
Fig. 4. Una piattaforma di ricerca visiva basata sulla classificazione delle immagini in azione.

Monitoraggio della fauna selvatica con la classificazione delle immagini YOLO11

Tradizionalmente, il monitoraggio degli animali in natura è un compito noioso che coinvolge molte persone che selezionano e analizzano manualmente migliaia di foto. Con modalità di visione computerizzata come YOLO11, i ricercatori possono monitorare automaticamente gli animali a una velocità maggiore. Le telecamere possono essere posizionate negli habitat naturali per scattare foto. Il modello AI di visione può quindi essere utilizzato per analizzare queste foto e classify gli animali al loro interno (se presenti). Questo sistema può aiutare i ricercatori a studiare e track popolazioni di animali, i loro modelli di migrazione, ecc.

Un altro modo in cui i modelli di intelligenza artificiale e di visione artificiale come YOLO11 possono aiutare in questo campo è quello di semplificare il processo di classificazione delle specie in pericolo. Identificando le potenziali specie o categorie di razze a cui un animale può appartenere, questi modelli possono fornire dati essenziali per i ricercatori. Ad esempio, l'Università della Tasmania (UTAS) ha sviluppato un sistema basato sulla classificazione delle immagini per monitorare la fauna selvatica della Tasmania. Le previsioni dei modelli possono aiutare scienziati e ricercatori a tenere d'occhio l'attività e il comportamento degli animali, che possono segnalare minacce come il bracconaggio o la perdita di habitat

__wf_reserved_inherit
Figura 5. YOLO11 prevede le possibili razze a cui potrebbe appartenere un cane.

Prova di classificazione delle immagini con il modello YOLO11

Ora che abbiamo discusso di cosa sia la classificazione delle immagini e abbiamo esplorato alcune delle sue applicazioni. Vediamo come provare la classificazione delle immagini con il nuovo modello YOLO11 . Ci sono due modi semplici per iniziare: utilizzando il pacchettoUltralytics Python o tramite Ultralytics HUB. Vediamo entrambe le opzioni.

Esecuzione di inferenze con YOLO11

Per iniziare a utilizzare il pacchetto Ultralytics Python , è sufficiente installarlo utilizzando pip, conda o Docker. In caso di problemi, consultate la nostra Guida ai problemi comuni per trovare suggerimenti utili per la risoluzione dei problemi.

Una volta installato il pacchetto, è possibile utilizzare il codice seguente per caricare una variante del modello di classificazione delle immagini YOLO11 ed eseguire un'inferenza su un'immagine. Eseguire un'inferenza significa usare un modello addestrato per fare previsioni su nuovi dati non visti. Potete fare una prova con un'immagine a vostra scelta!

__wf_reserved_inherit
Figura 6. Esecuzione di inferenze con il modello YOLO11 .

Formazione di un modello di classificazione YOLO11 personalizzato

È possibile utilizzare lo stesso pacchetto Python per addestrare un modello di classificazione YOLO11 personalizzato. L'addestramento personalizzato consente di mettere a punto un modello YOLO11 per le proprie esigenze specifiche. Ad esempio, se state sviluppando un'applicazione per classify diverse razze di gatti, potete addestrare un modello YOLO11 su misura per questo scopo.

Il codice seguente mostra come caricare e addestrare un modello di classificazione delle immagini YOLO11 . Consente di trasferire i pesi pre-addestrati, utilizzando le conoscenze di un modello esistente per aumentare le prestazioni del proprio modello. È possibile specificare un set di dati, come il set di dati "fashion-mnist", che è un noto insieme di immagini in scala di grigi di capi di abbigliamento (camicie, pantaloni, scarpe, ecc.). L'addestramento del modello su questo set di dati gli consente di riconoscere diverse categorie di abbigliamento. È possibile sostituire "fashion-mnist" con qualsiasi set di dati adatto al proprio progetto, come le razze di gatti o i tipi di piante.

__wf_reserved_inherit
Figura 7. Addestramento personalizzato di un modello YOLO11 per la classificazione delle immagini.

Prova YOLO11 su Ultralytics HUB

Sebbene l'utilizzo del pacchetto Ultralytics sia semplice, richiede una certa conoscenza di Python. Se siete alla ricerca di un'opzione più semplice per i principianti, potete utilizzare Ultralytics HUB, una piattaforma progettata per rendere semplice e accessibile la formazione e la distribuzione di diversi modelli YOLO . Per iniziare, è necessario creare un account.

Una volta effettuato l'accesso, passare alla sezione "Modelli" e selezionare il modello YOLO11 per la classificazione delle immagini. È disponibile una serie di modelli di diverse dimensioni: nano, piccolo, medio, grande ed extra-large. Dopo aver scelto un modello, è possibile caricare un'immagine nella sezione "Anteprima", dove le previsioni appariranno sul lato sinistro della pagina una volta elaborata l'immagine.

__wf_reserved_inherit
Figura 8. Utilizzo di Ultralytics HUB per eseguire un'inferenza.

Punti chiave

YOLO11 offre potenti capacità di classificazione delle immagini che aprono nuove possibilità in diversi settori. Dal miglioramento del monitoraggio delle colture in agricoltura, al miglioramento della ricerca dei prodotti nella vendita al dettaglio, fino al supporto della conservazione della fauna selvatica, la velocità e la precisione di YOLO11lo rendono ideale per diverse applicazioni. Grazie alle opzioni di formazione personalizzata tramite il pacchettoPython di Ultralytics o alla configurazione semplice e senza codice su Ultralytics HUB, gli utenti possono facilmente incorporare YOLO11 nei loro flussi di lavoro. Mentre un numero sempre maggiore di industrie abbraccia le soluzioni di intelligenza artificiale, YOLO11 offre uno strumento flessibile e ad alte prestazioni che supporta l'innovazione e i progressi pratici.

Per saperne di più, visita il nostro repository GitHub e interagisci con la nostra community. Esplora le applicazioni dell'IA nelle auto a guida autonoma e nell'assistenza sanitaria nelle nostre pagine delle soluzioni. 🚀

Costruiamo insieme il futuro
dell'AI!

Inizia il tuo viaggio con il futuro del machine learning

Inizia gratis