Scoprite la sogliatura nell'elaborazione delle immagini con questa guida. Scoprite cos'è la sogliatura, le diverse tecniche di sogliatura delle immagini, compresa la sogliatura di Otsu.

Scoprite la sogliatura nell'elaborazione delle immagini con questa guida. Scoprite cos'è la sogliatura, le diverse tecniche di sogliatura delle immagini, compresa la sogliatura di Otsu.
Gli esseri umani vedono le immagini come immagini coerenti e significative, mentre i computer le vedono come griglie di piccoli pixel, i componenti più piccoli di un'immagine digitale. In un processo chiamato elaborazione delle immagini, questi pixel possono essere regolati o analizzati per migliorare l'immagine ed estrarre informazioni utili.
Una tecnica comune di elaborazione delle immagini è chiamata sogliatura delle immagini. Questo metodo converte le immagini in scala di grigi (dove ogni pixel rappresenta una tonalità di grigio) in immagini in bianco e nero confrontando ogni pixel con un valore prestabilito. In questo modo si crea una netta separazione tra le regioni importanti e lo sfondo.
La sogliatura è spesso utilizzata nella segmentazione delle immagini, una tecnica che divide un'immagine in regioni significative per facilitarne l'analisi. In genere è uno dei primi passi per aiutare le macchine a interpretare i dati visivi. In questo articolo vedremo cos'è la sogliatura, come funziona e dove viene applicata nel mondo reale. Iniziamo!
Prima di scoprire come funziona la sogliatura, diamo un'occhiata più da vicino alle idee di base e al suo utilizzo nell'elaborazione delle immagini.
Supponiamo di lavorare con un'immagine e di voler separare gli oggetti dallo sfondo. Un modo per farlo è la sogliatura. Questa semplifica l'immagine in modo che ogni pixel sia completamente nero o completamente bianco. Il risultato è un'immagine binaria, in cui ogni pixel ha un valore di 0 (nero) o 255 (bianco). Questo passaggio è spesso utile nell'elaborazione delle immagini perché fa risaltare chiaramente le parti importanti dell'immagine.
Allo stesso modo, se si vuole capire come sono distribuiti i valori di luminosità in un'immagine, un istogramma può essere d'aiuto. Si tratta di un grafico che mostra la frequenza con cui appare l'intensità di ciascun pixel, dal nero (0) al bianco (255).
Osservando l'istogramma, si può capire se l'immagine è scura, chiara o una via di mezzo. In questo modo è più facile scegliere un buon valore di soglia quando si trasforma l'immagine in bianco e nero, poiché si possono individuare a colpo d'occhio i modelli e i livelli di contrasto.
Una volta che l'immagine è stata sottoposta a soglia, viene divisa in due parti: il primo piano e lo sfondo. Il primo piano, tipicamente rappresentato in bianco, evidenzia gli elementi importanti, come il testo, le forme o gli oggetti che si desidera rilevare. Lo sfondo, rappresentato in nero, è tutto il resto. Questa separazione aiuta le macchine a concentrarsi su ciò che conta nell'immagine.
Come accennato in precedenza, la segmentazione divide un'immagine in regioni significative in base a caratteristiche come la luminosità o la texture. La sogliatura è un modo semplice per farlo e spesso è uno dei primi passi di una pipeline di computer vision.
La computer vision è una branca dell'intelligenza artificiale che consente alle macchine di elaborare e interpretare i dati visivi, proprio come fanno gli esseri umani. Utilizzando il thresholding nelle prime fasi del processo, i sistemi di computer vision possono separare gli oggetti dal loro sfondo, facilitando il funzionamento delle fasi successive, come il rilevamento o il riconoscimento.
Ora che abbiamo capito meglio cos'è la soglia, vediamo come settare un'immagine e i diversi tipi di soglia nell'elaborazione delle immagini.
Ad esempio, il thresholding globale è uno dei modi più semplici per creare un'immagine binaria. Applica un singolo valore di intensità all'intera immagine. I pixel più chiari di questa soglia diventano bianchi, mentre quelli più scuri diventano neri. Questo aiuta a separare l'oggetto dallo sfondo.
Funziona meglio quando l'immagine ha un'illuminazione uniforme e un forte contrasto. Tuttavia, in presenza di un'illuminazione non uniforme o di aree a basso contrasto, una singola soglia può perdere i dettagli o sfocare i bordi.
Per gestire questo problema, si utilizzano metodi come il thresholding di Otsu. Invece di impostare manualmente un valore, il metodo di soglia di Otsu analizza l'istogramma dell'immagine e sceglie una soglia che separa al meglio le intensità dei pixel in primo piano e sfondo.
A differenza della soglia globale, la soglia adattiva o locale calcola il valore di soglia separatamente per le diverse parti dell'immagine. Ciò la rende più efficace per le immagini con illuminazione non uniforme, come i documenti scansionati con ombre o superfici strutturate.
Funziona dividendo l'immagine in piccole regioni e calcolando una soglia locale per ogni blocco, che aiuta a mantenere il contrasto tra primo piano e sfondo. Questo approccio è ampiamente utilizzato in attività come il riconoscimento di testi, l'imaging medico e l'ispezione di superfici, in cui l'illuminazione varia all'interno dell'immagine.
Alcuni approcci comuni alla soglia adattiva nell'elaborazione delle immagini includono la soglia media adattiva e la soglia gaussiana adattiva. Nella soglia media adattiva, l'intensità media del pixel in un quartiere locale viene utilizzata come soglia per il pixel centrale. La soglia gaussiana adattiva, invece, utilizza una media ponderata con una finestra gaussiana, dando maggiore importanza ai pixel più vicini al centro.
Esploriamo quindi i casi in cui la sogliatura delle immagini viene utilizzata nelle applicazioni reali.
Vecchi libri e lettere scritte a mano vengono spesso scansionati per conservarli o convertirli in testo digitale utilizzando l'OCR (Optical Character Recognition), una tecnologia che legge i caratteri stampati o scritti a mano. Prima di poter estrarre il testo, il documento deve essere pulito o pre-elaborato. Le immagini scansionate spesso presentano ombre, inchiostro sbiadito o illuminazione irregolare, che possono rendere difficile il riconoscimento dei caratteri.
Per migliorare la chiarezza, si utilizza il thresholding per convertire le immagini in scala di grigi in formato binario, aiutando a isolare il testo dallo sfondo. Le aree più scure, come le lettere, diventano nere, mentre lo sfondo più chiaro diventa bianco, facilitando la lettura del testo da parte dei sistemi OCR.
Analogamente, nell'imaging medico, il thresholding è comunemente utilizzato per isolare strutture specifiche nelle scansioni, come ossa o polmoni nelle immagini a raggi X. Convertendo le immagini in scala di grigi in formato binario, diventa più facile separare le regioni di interesse dal tessuto circostante e preparare l'immagine per ulteriori analisi. Nei casi più complessi, è possibile applicare il thresholding multilivello per dividere l'immagine in più regioni distinte, consentendo di identificare contemporaneamente diversi tipi di tessuto o strutture.
Ecco alcuni dei principali vantaggi dell'uso della sogliatura nell'elaborazione delle immagini:
Sebbene la sogliatura delle immagini sia utile in molti scenari, presenta anche alcune limitazioni. Ecco alcune sfide legate alla sogliatura da tenere in considerazione:
La sogliatura funziona bene per compiti di segmentazione semplici in ambienti controllati. Tuttavia, spesso si trova in difficoltà quando si tratta di immagini complesse con più oggetti o rumore di fondo. Poiché si basa su regole fisse, il thresholding manca della flessibilità necessaria per la maggior parte delle applicazioni reali.
Per superare questi limiti, molti sistemi all'avanguardia utilizzano oggi la computer vision. A differenza del thresholding, i modelli di Vision AI sono addestrati a rilevare modelli e caratteristiche complesse, il che li rende molto più precisi e adattabili.
Ad esempio, i modelli di computer vision come Ultralytics YOLO11 sono in grado di rilevare oggetti e segmentare immagini in tempo reale. Questo li rende ideali per compiti come l'individuazione di segnali stradali nei veicoli autonomi o l'identificazione di problemi di coltivazione in agricoltura.
In particolare, YOLO11 supporta una serie di compiti di computer vision, come la segmentazione di istanze, in cui ogni oggetto in un'immagine viene segmentato separatamente. Può anche eseguire altre operazioni basate sulla visione, tra cui la stima della posa (determinazione della posizione o della postura di un oggetto) e il tracciamento dell'oggetto (seguire un oggetto mentre si muove attraverso i fotogrammi del video).
Mentre il thresholding funziona bene per compiti semplici o per testare le prime idee, le applicazioni che richiedono velocità, precisione e flessibilità sono di solito gestite meglio con la computer vision.
La sogliatura è uno strumento fondamentale nell'elaborazione delle immagini, perché è facile e veloce da usare per separare gli oggetti dallo sfondo. Funziona bene con i documenti scansionati, le immagini mediche e il controllo dei difetti dei prodotti nelle fabbriche.
Tuttavia, quando le immagini e i video diventano più complessi, i metodi di elaborazione delle immagini di base, come la sogliatura delle immagini, possono fare fatica. È qui che possono intervenire i modelli avanzati di visione artificiale. Modelli come YOLO11 sono in grado di comprendere ed eseguire un maggior numero di compiti, individuare molti oggetti contemporaneamente e lavorare in tempo reale, rendendoli utili per molti casi d'uso.
Volete saperne di più sull'IA? Consultate la nostra comunità e il repository GitHub. Esplorate le nostre pagine dedicate alle soluzioni per conoscere l'IA nella robotica e la computer vision nell'agricoltura. Scoprite le nostre opzioni di licenza e iniziate a costruire con la computer vision oggi stesso!