Che cos'è la soglia nell'elaborazione delle immagini?

5 minuti di lettura

12 agosto 2025

Scoprite la sogliatura nell'elaborazione delle immagini con questa guida. Scoprite cos'è la sogliatura, le diverse tecniche di sogliatura delle immagini, compresa la sogliatura di Otsu.

Gli esseri umani vedono le immagini come immagini coerenti e significative, mentre i computer le vedono come griglie di piccoli pixel, i componenti più piccoli di un'immagine digitale. In un processo chiamato elaborazione delle immagini, questi pixel possono essere regolati o analizzati per migliorare l'immagine ed estrarre informazioni utili.

Una tecnica comune di elaborazione delle immagini è chiamata sogliatura delle immagini. Questo metodo converte le immagini in scala di grigi (dove ogni pixel rappresenta una tonalità di grigio) in immagini in bianco e nero confrontando ogni pixel con un valore prestabilito. In questo modo si crea una netta separazione tra le regioni importanti e lo sfondo.

La sogliatura è spesso utilizzata nella segmentazione delle immagini, una tecnica che divide un'immagine in regioni significative per facilitarne l'analisi. In genere è uno dei primi passi per aiutare le macchine a interpretare i dati visivi. In questo articolo vedremo cos'è la sogliatura, come funziona e dove viene applicata nel mondo reale. Iniziamo!

Terminologia di base della sogliatura delle immagini

Prima di scoprire come funziona la sogliatura, diamo un'occhiata più da vicino alle idee di base e al suo utilizzo nell'elaborazione delle immagini.

Soglia dell'immagine binaria

Supponiamo di lavorare con un'immagine e di voler separare gli oggetti dallo sfondo. Un modo per farlo è la sogliatura. Questa semplifica l'immagine in modo che ogni pixel sia completamente nero o completamente bianco. Il risultato è un'immagine binaria, in cui ogni pixel ha un valore di 0 (nero) o 255 (bianco). Questo passaggio è spesso utile nell'elaborazione delle immagini perché fa risaltare chiaramente le parti importanti dell'immagine.

Figura 1. Un'immagine in scala di grigi e il suo output binario dopo il thresholding. (Fonte) 

Istogramma

Allo stesso modo, se si vuole capire come sono distribuiti i valori di luminosità in un'immagine, un istogramma può essere d'aiuto. Si tratta di un grafico che mostra la frequenza con cui appare l'intensità di ciascun pixel, dal nero (0) al bianco (255). 

Osservando l'istogramma, si può capire se l'immagine è scura, chiara o una via di mezzo. In questo modo è più facile scegliere un buon valore di soglia quando si trasforma l'immagine in bianco e nero, poiché si possono individuare a colpo d'occhio i modelli e i livelli di contrasto.

Primo piano e sfondo

Una volta che l'immagine è stata sottoposta a soglia, viene divisa in due parti: il primo piano e lo sfondo. Il primo piano, tipicamente rappresentato in bianco, evidenzia gli elementi importanti, come il testo, le forme o gli oggetti che si desidera rilevare. Lo sfondo, rappresentato in nero, è tutto il resto. Questa separazione aiuta le macchine a concentrarsi su ciò che conta nell'immagine.

Segmentazione

Come accennato in precedenza, la segmentazione divide un'immagine in regioni significative in base a caratteristiche come la luminosità o la texture. La sogliatura è un modo semplice per farlo e spesso è uno dei primi passi di una pipeline di computer vision. 

La computer vision è una branca dell'intelligenza artificiale che consente alle macchine di elaborare e interpretare i dati visivi, proprio come fanno gli esseri umani. Utilizzando il thresholding nelle prime fasi del processo, i sistemi di computer vision possono separare gli oggetti dal loro sfondo, facilitando il funzionamento delle fasi successive, come il rilevamento o il riconoscimento.

Soglia globale

Ora che abbiamo capito meglio cos'è la soglia, vediamo come settare un'immagine e i diversi tipi di soglia nell'elaborazione delle immagini.

Ad esempio, il thresholding globale è uno dei modi più semplici per creare un'immagine binaria. Applica un singolo valore di intensità all'intera immagine. I pixel più chiari di questa soglia diventano bianchi, mentre quelli più scuri diventano neri. Questo aiuta a separare l'oggetto dallo sfondo.

Funziona meglio quando l'immagine ha un'illuminazione uniforme e un forte contrasto. Tuttavia, in presenza di un'illuminazione non uniforme o di aree a basso contrasto, una singola soglia può perdere i dettagli o sfocare i bordi.

Per gestire questo problema, si utilizzano metodi come il thresholding di Otsu. Invece di impostare manualmente un valore, il metodo di soglia di Otsu analizza l'istogramma dell'immagine e sceglie una soglia che separa al meglio le intensità dei pixel in primo piano e sfondo. 

Figura 2. Un'immagine di Saturno prima e dopo l'applicazione del thresholding di Otsu. (Fonte)

Soglia locale (adattiva)

A differenza della soglia globale, la soglia adattiva o locale calcola il valore di soglia separatamente per le diverse parti dell'immagine. Ciò la rende più efficace per le immagini con illuminazione non uniforme, come i documenti scansionati con ombre o superfici strutturate.

Funziona dividendo l'immagine in piccole regioni e calcolando una soglia locale per ogni blocco, che aiuta a mantenere il contrasto tra primo piano e sfondo. Questo approccio è ampiamente utilizzato in attività come il riconoscimento di testi, l'imaging medico e l'ispezione di superfici, in cui l'illuminazione varia all'interno dell'immagine.

Alcuni approcci comuni alla soglia adattiva nell'elaborazione delle immagini includono la soglia media adattiva e la soglia gaussiana adattiva. Nella soglia media adattiva, l'intensità media del pixel in un quartiere locale viene utilizzata come soglia per il pixel centrale. La soglia gaussiana adattiva, invece, utilizza una media ponderata con una finestra gaussiana, dando maggiore importanza ai pixel più vicini al centro.

Applicazioni reali della sogliatura nell'elaborazione delle immagini

Esploriamo quindi i casi in cui la sogliatura delle immagini viene utilizzata nelle applicazioni reali.

Soglia dell'immagine per la binarizzazione e l'OCR dei documenti

Vecchi libri e lettere scritte a mano vengono spesso scansionati per conservarli o convertirli in testo digitale utilizzando l'OCR (Optical Character Recognition), una tecnologia che legge i caratteri stampati o scritti a mano. Prima di poter estrarre il testo, il documento deve essere pulito o pre-elaborato. Le immagini scansionate spesso presentano ombre, inchiostro sbiadito o illuminazione irregolare, che possono rendere difficile il riconoscimento dei caratteri.

Per migliorare la chiarezza, si utilizza il thresholding per convertire le immagini in scala di grigi in formato binario, aiutando a isolare il testo dallo sfondo. Le aree più scure, come le lettere, diventano nere, mentre lo sfondo più chiaro diventa bianco, facilitando la lettura del testo da parte dei sistemi OCR.

Figura 3. Un esempio di documento storico e della sua immagine sogliata. (Fonte)

Utilizzo della sogliatura nell'elaborazione delle immagini mediche 

Analogamente, nell'imaging medico, il thresholding è comunemente utilizzato per isolare strutture specifiche nelle scansioni, come ossa o polmoni nelle immagini a raggi X. Convertendo le immagini in scala di grigi in formato binario, diventa più facile separare le regioni di interesse dal tessuto circostante e preparare l'immagine per ulteriori analisi. Nei casi più complessi, è possibile applicare il thresholding multilivello per dividere l'immagine in più regioni distinte, consentendo di identificare contemporaneamente diversi tipi di tessuto o strutture.

Figura 4. Utilizzo di metodi di sogliatura multilivello su radiografie del torace. (Fonte)

Pro e contro della sogliatura nell'elaborazione delle immagini

Ecco alcuni dei principali vantaggi dell'uso della sogliatura nell'elaborazione delle immagini:

  • Poco dispendioso in termini di risorse: La sogliatura funziona bene su dispositivi a basso consumo e non necessita di accesso al cloud o di hardware di alto livello, rendendola adatta a sistemi embedded e a configurazioni offline.
  • Facile da interpretare: la sua logica semplice rende i risultati della sogliatura facili da capire e da debuggare, il che è fondamentale in settori come la sanità o l'elaborazione di documenti in cui la trasparenza è importante.
  • Test rapidi: La soglia consente ai team di esplorare rapidamente le idee di segmentazione nelle prime fasi dei progetti, prima di passare a modelli più complessi.

Sebbene la sogliatura delle immagini sia utile in molti scenari, presenta anche alcune limitazioni. Ecco alcune sfide legate alla sogliatura da tenere in considerazione:

  • Manca di adattabilità: La sogliatura segue regole fisse e non si adatta alle nuove condizioni di illuminazione o alle variazioni dei dati senza una regolazione manuale.
  • Sensibile al rumore: Piccole variazioni di luminosità dovute a ombre o riflessi possono alterare i risultati, soprattutto quando si lavora con immagini dettagliate o strutturate.
  • Statico e basato su regole: A differenza dei modelli di intelligenza artificiale, il thresholding non impara dai dati né migliora nel tempo. Funziona solo nelle condizioni ristrette per cui è stato progettato.

Oltre la soglia delle immagini: Quando la computer vision è lo strumento giusto

La sogliatura funziona bene per compiti di segmentazione semplici in ambienti controllati. Tuttavia, spesso si trova in difficoltà quando si tratta di immagini complesse con più oggetti o rumore di fondo. Poiché si basa su regole fisse, il thresholding manca della flessibilità necessaria per la maggior parte delle applicazioni reali.

Per superare questi limiti, molti sistemi all'avanguardia utilizzano oggi la computer vision. A differenza del thresholding, i modelli di Vision AI sono addestrati a rilevare modelli e caratteristiche complesse, il che li rende molto più precisi e adattabili.

Ad esempio, i modelli di computer vision come Ultralytics YOLO11 sono in grado di rilevare oggetti e segmentare immagini in tempo reale. Questo li rende ideali per compiti come l'individuazione di segnali stradali nei veicoli autonomi o l'identificazione di problemi di coltivazione in agricoltura. 

In particolare, YOLO11 supporta una serie di compiti di computer vision, come la segmentazione di istanze, in cui ogni oggetto in un'immagine viene segmentato separatamente. Può anche eseguire altre operazioni basate sulla visione, tra cui la stima della posa (determinazione della posizione o della postura di un oggetto) e il tracciamento dell'oggetto (seguire un oggetto mentre si muove attraverso i fotogrammi del video).

Figura 5. YOLO11 semplifica il rilevamento e la segmentazione degli oggetti(fonte).

Mentre il thresholding funziona bene per compiti semplici o per testare le prime idee, le applicazioni che richiedono velocità, precisione e flessibilità sono di solito gestite meglio con la computer vision.

Punti di forza

La sogliatura è uno strumento fondamentale nell'elaborazione delle immagini, perché è facile e veloce da usare per separare gli oggetti dallo sfondo. Funziona bene con i documenti scansionati, le immagini mediche e il controllo dei difetti dei prodotti nelle fabbriche. 

Tuttavia, quando le immagini e i video diventano più complessi, i metodi di elaborazione delle immagini di base, come la sogliatura delle immagini, possono fare fatica. È qui che possono intervenire i modelli avanzati di visione artificiale. Modelli come YOLO11 sono in grado di comprendere ed eseguire un maggior numero di compiti, individuare molti oggetti contemporaneamente e lavorare in tempo reale, rendendoli utili per molti casi d'uso.

Volete saperne di più sull'IA? Consultate la nostra comunità e il repository GitHub. Esplorate le nostre pagine dedicate alle soluzioni per conoscere l'IA nella robotica e la computer vision nell'agricoltura. Scoprite le nostre opzioni di licenza e iniziate a costruire con la computer vision oggi stesso!

Costruiamo insieme il futuro
dell'IA!

Iniziate il vostro viaggio nel futuro dell'apprendimento automatico

Iniziare gratuitamente
Link copiato negli appunti