Un'immersione profonda nel rilevamento delle pillole con Ultralytics YOLO11

Abirami Vina

5 minuti di lettura

24 aprile 2025

In questa esercitazione di codifica, impariamo a rilevare le pillole utilizzando YOLO11 con il dataset Medical-Pills. Inoltre, esploriamo le sue potenziali applicazioni e i suoi vantaggi.

L'intelligenza artificiale viene utilizzata in quasi tutti i settori, ma la sua influenza sulla sanità, soprattutto nel settore farmaceutico, è particolarmente rilevante. Quest'anno, il valore dell'intelligenza artificiale nel mercato farmaceutico è di 1,94 miliardi di dollari e si prevede che crescerà fino a 16,49 miliardi di dollari entro il 2034. 

Uno dei principali driver tecnologici di questo mercato è la computer vision. A differenza dell'elaborazione tradizionale delle immagini, la computer vision è un sottocampo dell'IA che consente alle macchine di comprendere e analizzare i dati visivi in tempo reale. 

Figura 1. Una panoramica dell'IA nel mercato farmaceutico.

Nell'industria farmaceutica, dove anche il più piccolo errore può avere gravi conseguenze, Vision AI offre modi nuovi e affidabili per migliorare la sicurezza e la precisione.  

Ad esempio, Ultralytics YOLO11 è un modello di computer vision progettato per attività in tempo reale come il rilevamento di oggetti e la segmentazione di istanze, e può essere utilizzato per applicazioni come l'identificazione di pillole o il rilevamento di difetti in imballaggi medici. 

In questo articolo spiegheremo come mettere mano alla Vision AI addestrando YOLO11 a rilevare le pillole. Esploreremo anche le sue applicazioni reali. Iniziamo!

Creazione di un modello di intelligenza artificiale per il rilevamento delle pillole

Prima di analizzare come YOLO11 possa essere addestrato per rilevare le pillole, facciamo un passo indietro e capiamo cosa significa addestrare un modello e il ruolo di un set di dati. 

L'addestramento di un modello consiste nell'insegnargli a riconoscere i modelli mostrandogli molti esempi. In questo caso, un set di dati è una raccolta di immagini in cui ogni immagine è etichettata per indicare dove si trovano le pillole. Questo processo aiuta il modello a imparare da questi esempi, in modo da poter successivamente identificare le pillole in nuove immagini.

Il pacchetto Ultralytics Python rende questo processo ancora più semplice, supportando un'ampia gamma di set di dati in un formato di file YOLO semplificato. Offre un accesso senza problemi ai set di dati più diffusi e fornisce supporto per applicazioni come il rilevamento di pillole. 

Ad esempio, il Medical Pills Dataset è una raccolta di proof-of-concept progettata per mostrare come il rilevamento degli oggetti possa migliorare i flussi di lavoro farmaceutici attraverso attività quali il controllo di qualità, lo smistamento e il rilevamento delle contraffazioni.

Scegliere un ambiente di sviluppo

Un altro fattore da considerare prima di iniziare la formazione con il pacchetto Ultralytics Python è la scelta del giusto ambiente di sviluppo. Ecco tre opzioni popolari:

  • Interfaccia a riga di comando (CLI): La CLI o terminale è uno strumento semplice, basato sul testo, in cui è possibile digitare comandi per eseguire il codice e interagire con il computer.

  • Quaderni Jupyter: Si tratta di un ambiente più interattivo in cui è possibile scrivere ed eseguire il codice in piccole parti (celle), facilitando i test e il debug.

  • Google Colab: Un'opzione basata sul cloud che funziona come Jupyter Notebook, ma con il vantaggio dell'accesso gratuito alla GPU, in modo da non doversi preoccupare di configurare nulla a livello locale.

Nella documentazione ufficiale di Ultralytics sono disponibili altre opzioni di configurazione, ma le tre sopra citate sono facili da configurare e da usare e rappresentano un'ottima scelta per iniziare rapidamente.

In questa guida ci concentreremo su come impostare e addestrare YOLO11 utilizzando Google Colab, Jupyter Notebooks o uno script Python di base, poiché il processo è abbastanza simile in ciascuno di questi ambienti.

Inoltre, questa esercitazione è abbastanza simile a quella precedentemente trattata sul rilevamento della fauna selvatica utilizzando YOLO11. Se siete interessati a maggiori dettagli su uno qualsiasi dei passaggi di questa esercitazione di codifica, potete consultarla.

Esplorazione di un set di dati per il rilevamento di pillole in tempo reale con YOLO

Il dataset Medical Pills comprende 92 immagini di addestramento e 23 immagini di convalida, fornendo una solida base per la creazione e il test del modello. Le immagini di addestramento servono ad apprendere il modello, mentre le immagini di validazione aiutano a valutare le prestazioni del modello su nuovi dati non visti. 

Ogni immagine del dataset è etichettata per una singola classe, le pillole. Le annotazioni dei riquadri di delimitazione segnano chiaramente la posizione di ogni pillola, rendendo il set di dati ideale per compiti mirati come il rilevamento delle pillole senza la complessità di gestire più classi di oggetti.

Figura 2. Uno scorcio del dataset Pillole mediche.

Per supportare l'addestramento con YOLO11, Ultralytics fornisce un file di configurazione YAML che definisce parametri chiave come i percorsi dei file, i nomi delle classi e i metadati necessari per l'addestramento del modello. Sia che si tratti di perfezionare un modello già addestrato o di partire da zero, questo file semplifica notevolmente il processo e aiuta a iniziare rapidamente.

Addestrare un modello Ultralytics YOLO sul dataset di pillole

Per iniziare, creeremo un ambiente per l'addestramento e il test del modello. Si può scegliere di utilizzare Google Colab, i Quaderni Jupyter o un semplice file Python, in base alle proprie preferenze. È sufficiente creare un nuovo notebook o un file Python nell'ambiente scelto.

Quindi, possiamo configurare il nostro ambiente e installare il pacchetto Ultralytics Python usando il comando mostrato di seguito. Se si utilizza un ambiente basato su notebook (Google Colab o Jupyter), eseguire il seguente comando con un punto esclamativo (!) all'inizio.

pip install ultralytics

Una volta installato, il passo successivo è scaricare e addestrare YOLO11 utilizzando il dataset Medical Pills. Poiché il set di dati è supportato dal pacchetto Ultralytics Python, il processo è semplice. 

Comprendere il processo di formazione del modello

Per prima cosa, possiamo importare la classe YOLO dal pacchetto Ultralytics. Poi, possiamo caricare un modello YOLO11 pre-addestrato dal file "yolo11n.pt", consigliato perché è un modello nano e leggero. 

Infine, possiamo avviare il processo di addestramento puntando il modello alla configurazione del nostro dataset (medical-pills.yaml) e impostando il numero di epoche di addestramento (un passaggio completo attraverso l'intero dataset) a 100, come mostrato di seguito.

from ultralytics import YOLO

model = YOLO("yolo11n.pt")

results = model.train(data="medical-pills.yaml", epochs=100)

L'addestramento per più epoche consente al modello di apprendere e migliorare le sue prestazioni a ogni passaggio. Nella sottocartella "runs/train/" si trovano i log e i checkpoint, che possono essere utilizzati per monitorare i progressi e rivedere le prestazioni del modello.

Al termine dell'addestramento, il modello YOLO11 addestrato su misura dovrebbe essere in grado di identificare accuratamente le pillole. I pesi finali del modello addestrato si trovano nella sottocartella "runs/detect/train/weights/" con il nome "best.pt".

Valutazione di YOLO11 dopo l'addestramento del modello

Per valutare quanto il modello abbia imparato a rilevare le pillole, possiamo eseguire la convalida come segue:

metrics = model.val()

Questo processo restituisce metriche comuni di rilevamento degli oggetti, che forniscono indicazioni sulle prestazioni del modello. Ecco un approfondimento su alcune di queste metriche:

  • Precisione: Misura la percentuale di pillole rilevate dal modello che sono corrette.
  • Richiamo: Indica la percentuale di pillole reali che il modello identifica con successo.
  • Precisione media (mAP): Questa metrica combina sia la precisione che il richiamo tra le varie soglie di rilevamento per fornire un punteggio complessivo delle prestazioni.

Insieme, queste metriche offrono una visione completa dell'accuratezza con cui il modello rileva le pillole in nuovi dati non visti. 

Se il modello non funziona come previsto, si può provare ad addestrarlo per un numero maggiore di epoche o a regolare con precisione altri parametri di addestramento, come il tasso di apprendimento, che controlla la dimensione dei passi effettuati durante l'ottimizzazione del modello, o la dimensione dell'immagine, per migliorare ulteriormente le sue prestazioni.

Esecuzione di inferenze utilizzando il modello YOLO11 addestrato in modo personalizzato

Una volta che il modello YOLO11 è stato addestrato e valutato, il passo successivo è quello di testare le sue prestazioni su nuove immagini non viste. Questo aiuta a simulare le condizioni del mondo reale, come ad esempio il rilevamento di pillole con luci, disposizioni o stili di imballaggio diversi.

Per testare il modello, abbiamo scaricato un'immagine campione da Pexels, un sito web gratuito di immagini stock, e abbiamo analizzato l'immagine o eseguito una previsione utilizzando il modello YOLO11 addestrato su misura, come mostrato nel frammento di codice sottostante. 

È possibile utilizzare questa immagine campione o qualsiasi altra immagine pertinente per valutare le prestazioni del modello in scenari reali. 

results = model.predict("path/to/image.jpg", save=True, conf=0.3)

L'opzione di salvataggio indica al modello di memorizzare l'immagine di output e l'impostazione di confidenza assicura che solo le previsioni con almeno il 30% di certezza siano incluse nei risultati.

Quando si esegue la predizione, l'output mostrerà un messaggio che indica dove si trova l'immagine salvata, ad esempio "Risultati salvati in runs/detect/train".

L'immagine di output sarà simile a quella mostrata qui, con le pillole rilevate ed evidenziate mediante caselle di delimitazione. I punteggi di confidenza visualizzati indicano il livello di certezza di ciascun rilevamento.

Figura 3. Rilevamento delle pillole con YOLO11.

Applicazioni reali dell'uso di YOLO11 nel settore farmaceutico

Ora che abbiamo esplorato come addestrare YOLO11 utilizzando il dataset Medical-Pills ed eseguire inferenze sulle immagini per il rilevamento delle pillole, diamo un'occhiata alle applicazioni reali di YOLO11 nell'industria farmaceutica.

Smistamento di pillole farmaceutiche con YOLO11

Il rilevamento automatico delle pillole con YOLO11 può essere applicato allo smistamento farmaceutico. Lo smistamento manuale è spesso lento, ripetitivo e soggetto a errori che possono compromettere la sicurezza e la conformità dei farmaci. 

Utilizzando un modello YOLO11 ottimizzato, siamo in grado di rilevare e smistare con precisione le pillole in base ad attributi visivi quali dimensioni, forma e colore. Questa automazione accelera il processo e contribuisce a garantire che i prodotti soddisfino i rigorosi standard di qualità, rendendolo uno strumento prezioso per le operazioni farmaceutiche.

Figura 4. Rilevamento di pillole con l'aiuto di YOLO11.

Monitoraggio dell'inventario con l'aiuto di YOLO11

La disponibilità dei farmaci giusti in tempo non è solo un compito logistico, ma può influire sull'assistenza ai pazienti e sui costi. L'esaurimento di una pillola cruciale può ritardare il trattamento, mentre un eccesso di scorte può causare farmaci scaduti e sprechi di magazzino. Con i numerosi tipi di pillole e le variazioni di confezioni nel settore farmaceutico, i sistemi di inventario automatizzati possono consentire registrazioni più accurate.

I sistemi di inventario intelligenti possono utilizzare modelli di computer vision come Ultralytics YOLO11 per monitorare i livelli delle scorte in tempo reale. Il modello può scansionare gli scaffali e le aree di imballaggio utilizzando immagini o video per rilevare e contare le pillole. Quando i livelli delle scorte cambiano, se gli articoli vengono aggiunti, rimossi o spostati, il sistema può aggiornare automaticamente il conteggio.

Il controllo della qualità farmaceutica guidato da YOLO11

Nella produzione farmaceutica, il controllo di qualità è fondamentale per garantire che ogni pillola sia sicura ed efficace. Anche piccoli difetti, come una crepa, una forma irregolare o una leggera variazione di colore, possono portare a errori di dosaggio o al ritiro del prodotto. 

YOLO11 può aiutare rilevando automaticamente le pillole che non soddisfano gli standard di qualità. Il modello è in grado di apprendere le caratteristiche visive e utilizza i riquadri di delimitazione per segnalare in tempo reale problemi come scheggiature, impronte sbiadite o scolorimento. Ciò consente di rimuovere tempestivamente le pillole difettose, riducendo gli sprechi e garantendo che solo i farmaci di qualità garantita raggiungano i pazienti.

Inoltre, YOLO11 può essere utilizzato per rilevare e contare le pillole durante l'ispezione, per un monitoraggio accurato della qualità. 

Figura 5. YOLO11 può essere utilizzato per rilevare e contare le capsule.

Pro e contro dell'utilizzo di Vision AI per il rilevamento delle pillole 

Ora che abbiamo esplorato il modo in cui la Vision AI può essere applicata all'industria farmaceutica. Diamo una rapida occhiata ad alcuni dei principali vantaggi dell'utilizzo della computer vision in questo settore:

  • Manutenzione preventiva: YOLO11 può essere utilizzato per rilevare i primi segni di usura della macchina identificando le incongruenze delle pillole o del confezionamento. Aiuta a programmare riparazioni tempestive e previene i tempi di fermo produzione non pianificati.
  • Utilizzo scalabile del modello: Il modello può essere messo a punto su vari set di dati per pillole e confezioni diverse. Ciò rende l'ispezione scalabile ed economicamente vantaggiosa in caso di crescita delle operazioni.
  • Monitoraggio remoto: Permette di controllare la qualità in tempo reale se integrato con sistemi cloud e dispositivi edge ed è ideale per la gestione di dispensatori rurali, unità automatizzate e configurazioni di telefarmacia a distanza.

Sebbene i vantaggi dell'implementazione dell'IA di visione nell'industria farmaceutica siano numerosi, ci sono anche alcune considerazioni da tenere a mente quando si utilizzano queste tecnologie: 

  • Integrazione operativa: L'integrazione dei sistemi di IA nei flussi di lavoro esistenti potrebbe richiedere adeguamenti, formazione e controlli di compatibilità con l'infrastruttura attuale.
  • Conformità normativa: I sistemi automatizzati devono rispettare rigorosi standard normativi per garantire la sicurezza dei pazienti e la qualità costante dei prodotti.
  • Gestione degli errori: Anche i modelli più avanzati possono produrre falsi positivi o negativi. È importante disporre di processi per gestire e correggere questi errori.

La strada da percorrere per i flussi di lavoro dell'AI in campo farmaceutico

In futuro, l'intelligenza artificiale avrà probabilmente un ruolo maggiore nel rendere le sperimentazioni cliniche più rapide, più intelligenti e più efficaci dal punto di vista dei costi. Può aiutare a progettare protocolli di sperimentazione migliori, a scegliere i gruppi di pazienti giusti e a monitorare i dati in tempo reale. 

Ciò può consentire ai ricercatori di rispondere ai problemi nel momento in cui si presentano, invece che a posteriori. L'intelligenza artificiale può anche accelerare il processo di approvazione, riducendo la documentazione manuale e automatizzando i controlli di routine. In generale, l'integrazione dell'IA nei flussi di lavoro farmaceutici può ridurre i ritardi e accelerare l'accesso ai nuovi trattamenti.

Punti di forza

L'addestramento di Ultralytics YOLO11 sul set di dati delle pillole mediche mostra la rapidità e l'efficacia con cui il modello si adatta alle attività farmaceutiche. Anche con un set di dati di piccole dimensioni, è in grado di rilevare con precisione le pillole, rendendolo utile per attività come lo smistamento, il controllo di qualità e il monitoraggio dell'inventario.

Con la crescita delle serie di dati e il miglioramento dei modelli, il potenziale della Vision AI nel settore farmaceutico va oltre la semplice logistica. Questa tecnologia potrebbe anche supportare gli studi clinici, aiutando a identificare e tracciare in modo coerente le pillole e assistendo i ricercatori nella sperimentazione sicura di nuove combinazioni di farmaci. 

Esplorate il nostro repository GitHub per saperne di più e far parte della nostra comunità in crescita. Scoprite le innovazioni all'avanguardia in vari settori, dall'IA in agricoltura alla computer vision nella sanità. Scoprite le nostre opzioni di licenza e lanciate oggi stesso i vostri progetti di Vision AI.

Costruiamo insieme il futuro
dell'IA!

Iniziate il vostro viaggio nel futuro dell'apprendimento automatico

Iniziare gratuitamente
Link copiato negli appunti