Scopri YOLO26: vision AI di prossima generazione.
Ultralytics
Guide

Cos'è la soglia (thresholding) nell'elaborazione delle immagini?

Esplora la soglia (thresholding) nell'elaborazione delle immagini con questa guida. Scopri cos'è la soglia e le diverse tecniche di soglia, inclusa la soglia di Otsu.

ABAbirami Vina
5 min read
Un'immagine in scala di grigi convertita in bianco e nero usando la soglia

Per una panoramica visiva dei concetti trattati in questo articolo, guarda il video qui sotto.

Come esseri umani, vediamo le immagini come quadri coerenti e significativi, mentre i computer le vedono come griglie di minuscoli pixel, i componenti più piccoli di un'immagine digitale. In un processo chiamato elaborazione delle immagini, questi pixel possono essere regolati o analizzati per migliorare l'immagine ed estrarre informazioni utili.

Una tecnica comune di elaborazione delle immagini è chiamata thresholding dell'immagine. Questo metodo converte le immagini in scala di grigi (dove ogni pixel rappresenta una sfumatura di grigio) in immagini in bianco e nero confrontando ogni pixel con un valore impostato. Crea una chiara separazione tra le regioni importanti e lo sfondo.

La thresholding è spesso utilizzata nella segmentazione delle immagini, una tecnica che divide un'immagine in regioni significative per facilitarne l'analisi. In genere è uno dei primi passi per aiutare le macchine a interpretare i dati visivi. In questo articolo, esamineremo cos'è la thresholding, come funziona e dove viene applicata in scenari reali. Iniziamo!

Link to this sectionTerminologia di base nella thresholding delle immagini#

Prima di addentrarci nel funzionamento della thresholding, diamo un'occhiata più da vicino ai concetti di base che la sottendono e al modo in cui viene utilizzata nell'elaborazione delle immagini.

Link to this sectionSoglia dell'immagine binaria#

Supponiamo che tu stia lavorando con un'immagine e voglia separare gli oggetti dallo sfondo. Un modo per farlo è tramite la thresholding. Essa semplifica l'immagine in modo che ogni pixel sia completamente nero o completamente bianco. Il risultato è un'immagine binaria, dove ogni pixel ha un valore di 0 (nero) o 255 (bianco). Questo passaggio è spesso utile nell'elaborazione delle immagini perché fa risaltare chiaramente le parti importanti.

Un'immagine in scala di grigi e il suo output binario dopo la thresholding

Fig 1. Un'immagine in scala di grigi e il suo output binario dopo la thresholding. (Fonte: blog.devops.dev)

Link to this sectionIstogramma#

Analogamente, se vuoi capire come sono distribuiti i valori di luminosità in un'immagine, un istogramma può esserti utile. È un grafico che mostra con quale frequenza appare ogni intensità di pixel, dal nero (0) al bianco (255).

Osservando l'istogramma, puoi capire se l'immagine è scura, luminosa o una via di mezzo. Questo rende più facile scegliere un buon valore di soglia quando trasformi l'immagine in bianco e nero, poiché puoi individuare schemi e livelli di contrasto a colpo d'occhio.

Link to this sectionPrimo piano e sfondo#

Una volta che un'immagine è stata sottoposta a thresholding, viene divisa in due parti: il primo piano e lo sfondo. Il primo piano, solitamente mostrato in bianco, mette in evidenza gli elementi importanti, come testo, forme o oggetti che vuoi rilevare. Lo sfondo, mostrato in nero, è tutto il resto. Questa separazione aiuta le macchine a concentrarsi su ciò che conta nell'immagine.

Link to this sectionSegmentazione#

Come accennato in precedenza, la segmentazione divide un'immagine in regioni significative basate su caratteristiche come luminosità o texture. La thresholding è un modo semplice per farlo ed è spesso uno dei primi passaggi in una pipeline di computer vision.

La Computer vision è un ramo dell'intelligenza artificiale che permette alle macchine di elaborare e interpretare i dati visivi, proprio come fanno gli esseri umani. Utilizzando la thresholding nelle fasi iniziali del processo, i sistemi di computer vision possono separare gli oggetti dal loro sfondo, rendendo più precisi i passaggi successivi, come il rilevamento o il riconoscimento.

Link to this sectionThresholding globale#

Ora che abbiamo una migliore comprensione di cosa sia la thresholding, vediamo come applicarla a un'immagine e i diversi tipi di thresholding nell'elaborazione delle immagini.

Ad esempio, la thresholding globale è uno dei modi più semplici per creare un'immagine binaria. Applica un singolo valore di intensità all'intera immagine. I pixel più luminosi di questa soglia diventano bianchi, mentre quelli più scuri diventano neri. Questo aiuta a separare l'oggetto dallo sfondo.

Funziona al meglio quando l'immagine ha un'illuminazione uniforme e un forte contrasto. Ma in presenza di illuminazione irregolare o aree a basso contrasto, una singola soglia può mancare dettagli o sfocare i bordi.

Per gestire questo problema, si usano metodi come la thresholding di Otsu. Invece di impostare un valore manualmente, il metodo di Otsu analizza l'istogramma dell'immagine e sceglie una soglia che separa al meglio le intensità dei pixel in primo piano e sfondo.

Un'immagine di Saturno prima e dopo l'applicazione della thresholding di Otsu

Fig 2. Un'immagine di Saturno prima e dopo l'applicazione della thresholding di Otsu. (Fonte)

Link to this sectionThresholding locale (adattiva)#

A differenza della thresholding globale, la thresholding adattiva o locale calcola il valore di soglia separatamente per diverse parti dell'immagine. Questo la rende più efficace per immagini con illuminazione irregolare, come documenti scansionati con ombre o superfici strutturate.

Funziona dividendo l'immagine in piccole regioni e calcolando una soglia locale per ogni blocco, il che aiuta a mantenere il contrasto tra primo piano e sfondo. Questo approccio è ampiamente utilizzato in compiti come il riconoscimento del testo, imaging medico e l'ispezione di superfici, dove l'illuminazione varia attraverso l'immagine.

Alcuni approcci comuni alla thresholding adattiva nell'elaborazione delle immagini includono la thresholding a media adattiva e la thresholding gaussiana adattiva. Nella thresholding a media adattiva, l'intensità media dei pixel in un vicinato locale viene utilizzata come soglia per il pixel centrale. La thresholding gaussiana adattiva, invece, utilizza una media ponderata con una finestra gaussiana, dando maggiore importanza ai pixel più vicini al centro.

Link to this sectionApplicazioni reali della thresholding nell'elaborazione delle immagini#

Ora, esploriamo dove viene utilizzata la thresholding delle immagini nelle applicazioni reali.

Link to this sectionThresholding delle immagini per la binarizzazione dei documenti e OCR#

Libri antichi e lettere manoscritte vengono spesso scansionati per preservarli o convertirli in testo digitale utilizzando l'OCR (Optical Character Recognition), una tecnologia che legge caratteri stampati o manoscritti. Prima che il testo possa essere estratto, il documento deve solitamente essere pulito o pre-elaborato. Le immagini scansionate presentano spesso ombre, inchiostro sbiadito o illuminazione irregolare, che possono rendere difficile il riconoscimento dei caratteri.

Per migliorare la chiarezza, si utilizza la thresholding per convertire le immagini in scala di grigi in formato binario, aiutando a isolare il testo dallo sfondo. Le aree più scure, come le lettere, diventano nere, mentre lo sfondo più chiaro diventa bianco: rendendo molto più facile per i sistemi OCR leggere il testo.

Un documento storico e la sua immagine sottoposta a thresholding

Fig 3. Un esempio di documento storico e la sua immagine sottoposta a thresholding. (Fonte)

Link to this sectionUtilizzo della thresholding nell'elaborazione delle immagini mediche#

Analogamente, nell'imaging medico, la thresholding è comunemente usata per isolare strutture specifiche nelle scansioni, come ossa o polmoni nelle immagini a raggi X. Convertendo le immagini in scala di grigi in formato binario, diventa più facile separare le regioni di interesse dal tessuto circostante e preparare l'immagine per ulteriori analisi. In casi più complessi, si può applicare una thresholding multilivello per dividere l'immagine in diverse regioni distinte, consentendo di identificare contemporaneamente diversi tipi di tessuti o strutture.

Utilizzo di metodi di thresholding multilivello su radiografie toraciche

Fig 4. Utilizzo di metodi di thresholding multilivello su radiografie del torace. (Fonte: sciencedirect.com)

Link to this sectionPro e contro della thresholding nell'elaborazione delle immagini#

Ecco alcuni dei principali vantaggi dell'utilizzo della thresholding nell'elaborazione delle immagini:

  • Leggera sulle risorse: La thresholding funziona bene su dispositivi a bassa potenza e non necessita di accesso al cloud o hardware di fascia alta, rendendola adatta per sistemi integrati e configurazioni offline.
  • Facile da interpretare: La sua logica semplice rende gli output della thresholding facili da capire e sottoporre a debug, il che è fondamentale in campi come l'assistenza sanitaria o l'elaborazione di documenti dove la trasparenza è importante.
  • Test rapido: La thresholding consente ai team di esplorare rapidamente idee di segmentazione in progetti in fase iniziale prima di passare a modelli più complessi.

Sebbene la thresholding delle immagini sia utile in molti scenari, presenta anche alcune limitazioni. Ecco alcune sfide correlate alla thresholding da considerare:

  • Mancanza di adattabilità: La thresholding segue regole fisse e non si adatta a nuove condizioni di illuminazione o variazioni nei dati senza modifiche manuali.
  • Sensibile al rumore: Piccoli cambiamenti di luminosità dovuti a ombre o riflessi possono compromettere i risultati, specialmente quando si lavora con immagini dettagliate o strutturate.
  • Statica e basata su regole: A differenza dei modelli AI, la thresholding non impara dai dati né migliora nel tempo. Funziona solo entro le condizioni limitate per cui è stata progettata.

Link to this sectionOltre la thresholding delle immagini: Quando la computer vision è lo strumento giusto#

La thresholding funziona bene per compiti di segmentazione semplici in contesti controllati. Tuttavia, spesso incontra difficoltà nel gestire immagini complesse che presentano oggetti multipli o rumore di fondo. Poiché si basa su regole fisse, la thresholding manca della flessibilità necessaria per la maggior parte delle applicazioni reali.

Per superare questi limiti, molti sistemi all'avanguardia utilizzano ora la computer vision. A differenza della thresholding, i modelli di visione AI sono addestrati per rilevare modelli e caratteristiche complesse, rendendoli molto più accurati e adattabili.

Ad esempio, modelli di computer vision come Ultralytics YOLO11 possono rilevare oggetti e segmentare immagini in tempo reale. Questo li rende ideali per attività come l'individuazione di segnali stradali nei veicoli autonomi o l'identificazione di problemi delle colture in agricoltura.

In particolare, YOLO11 supporta una gamma di compiti di computer vision, come la segmentazione delle istanze, dove ogni oggetto in un'immagine viene segmentato separatamente. Può anche eseguire altri compiti basati sulla visione, tra cui la stima della posa (determinare la posizione o la postura di un oggetto) e il tracciamento degli oggetti (seguire un oggetto mentre si muove attraverso i frame video).

YOLO11 che rileva e segmenta oggetti in un'immagine

Fig 5. YOLO11 rende facile rilevare e segmentare oggetti. (Fonte)

Mentre la thresholding funziona bene per compiti semplici o per testare idee iniziali, le applicazioni che richiedono velocità, precisione e flessibilità sono solitamente gestite meglio con la computer vision.

Link to this sectionPunti chiave#

La thresholding è uno strumento cruciale nell'elaborazione delle immagini perché è veloce e facile da usare per separare gli oggetti dallo sfondo. Funziona bene con documenti scansionati, immagini mediche e nel controllo dei difetti dei prodotti nelle fabbriche.

Tuttavia, man mano che le immagini e i video diventano più complessi, i metodi di base di elaborazione delle immagini come la thresholding possono incontrare difficoltà. È qui che entrano in gioco modelli avanzati di computer vision. Modelli come YOLO11 possono comprendere ed eseguire più attività, individuare molti oggetti contemporaneamente e lavorare in tempo reale, rendendoli utili per numerosi casi d'uso.

Vuoi saperne di più sull'AI? Dai un'occhiata alla nostra community e al nostro repository GitHub. Esplora le nostre pagine di soluzioni per saperne di più su AI nella robotica e computer vision nell'agricoltura. Scopri le nostre opzioni di licenza e inizia a costruire con la computer vision oggi stesso!

Explore solutions

Real-time AI that works with your team

AI nella Robotica

Potenzia macchine più intelligenti con i modelli Ultralytics YOLO. La Vision AI nella robotica guida la navigazione autonoma, la percezione, il tracciamento degli oggetti e il controllo in tempo reale.

Scopri di più
Real-time AI that works with your team

IA nella logistica

Semplifica la logistica con i modelli Ultralytics YOLO. La Vision AI abilita l'ispezione dei pacchi, lo smistamento, il tracciamento dei veicoli e il monitoraggio della sicurezza in magazzino in tempo reale.

Scopri di più
Real-time AI that works with your team

AI nel settore Retail

Reimmagina il retail con i modelli Ultralytics YOLO. La Vision AI alimenta il tracciamento dell'inventario, il monitoraggio degli scaffali, la gestione delle code e insight più intelligenti sui clienti.

Scopri di più
Real-time AI that works with your team

IA nel settore sanitario

Crea soluzioni sanitarie con i modelli Ultralytics YOLO. La vision AI nella sanità potenzia l'imaging medico più rapido, diagnosi più intelligenti e il monitoraggio dei pazienti.

Scopri di più
Real-time AI that works with your team

IA nella produzione

Ottimizza la produzione con i modelli Ultralytics YOLO. La Vision AI guida il controllo qualità, il rilevamento dei difetti, la conformità ai DPI e l'automazione della linea di assemblaggio.

Scopri di più
Real-time AI that works with your operation

AI nel settore automobilistico

Applica la computer vision al settore automobilistico con i modelli Ultralytics YOLO. La vision AI migliora la sicurezza stradale, l'assistenza alla guida e l'automazione dei veicoli per strade più intelligenti.

Scopri di più
Real-time AI tailored to your operation

AI in Agricoltura

Porta la vision AI nell'agricoltura intelligente con i modelli Ultralytics YOLO. Potenzia il monitoraggio delle colture, il tracciamento del bestiame e l'agricoltura di precisione per rese più elevate e intelligenti.

Scopri di più
Real-time AI that works with your team

AI nella Robotica

Potenzia macchine più intelligenti con i modelli Ultralytics YOLO. La Vision AI nella robotica guida la navigazione autonoma, la percezione, il tracciamento degli oggetti e il controllo in tempo reale.

Scopri di più
Real-time AI that works with your team

IA nella logistica

Semplifica la logistica con i modelli Ultralytics YOLO. La Vision AI abilita l'ispezione dei pacchi, lo smistamento, il tracciamento dei veicoli e il monitoraggio della sicurezza in magazzino in tempo reale.

Scopri di più
Real-time AI that works with your team

AI nel settore Retail

Reimmagina il retail con i modelli Ultralytics YOLO. La Vision AI alimenta il tracciamento dell'inventario, il monitoraggio degli scaffali, la gestione delle code e insight più intelligenti sui clienti.

Scopri di più
Real-time AI that works with your team

IA nel settore sanitario

Crea soluzioni sanitarie con i modelli Ultralytics YOLO. La vision AI nella sanità potenzia l'imaging medico più rapido, diagnosi più intelligenti e il monitoraggio dei pazienti.

Scopri di più
Real-time AI that works with your team

IA nella produzione

Ottimizza la produzione con i modelli Ultralytics YOLO. La Vision AI guida il controllo qualità, il rilevamento dei difetti, la conformità ai DPI e l'automazione della linea di assemblaggio.

Scopri di più
Real-time AI that works with your operation

AI nel settore automobilistico

Applica la computer vision al settore automobilistico con i modelli Ultralytics YOLO. La vision AI migliora la sicurezza stradale, l'assistenza alla guida e l'automazione dei veicoli per strade più intelligenti.

Scopri di più
Real-time AI tailored to your operation

AI in Agricoltura

Porta la vision AI nell'agricoltura intelligente con i modelli Ultralytics YOLO. Potenzia il monitoraggio delle colture, il tracciamento del bestiame e l'agricoltura di precisione per rese più elevate e intelligenti.

Scopri di più
Real-time AI that works with your team

AI nella Robotica

Potenzia macchine più intelligenti con i modelli Ultralytics YOLO. La Vision AI nella robotica guida la navigazione autonoma, la percezione, il tracciamento degli oggetti e il controllo in tempo reale.

Scopri di più
Real-time AI that works with your team

IA nella logistica

Semplifica la logistica con i modelli Ultralytics YOLO. La Vision AI abilita l'ispezione dei pacchi, lo smistamento, il tracciamento dei veicoli e il monitoraggio della sicurezza in magazzino in tempo reale.

Scopri di più
Real-time AI that works with your team

AI nel settore Retail

Reimmagina il retail con i modelli Ultralytics YOLO. La Vision AI alimenta il tracciamento dell'inventario, il monitoraggio degli scaffali, la gestione delle code e insight più intelligenti sui clienti.

Scopri di più
Real-time AI that works with your team

IA nel settore sanitario

Crea soluzioni sanitarie con i modelli Ultralytics YOLO. La vision AI nella sanità potenzia l'imaging medico più rapido, diagnosi più intelligenti e il monitoraggio dei pazienti.

Scopri di più
Real-time AI that works with your team

IA nella produzione

Ottimizza la produzione con i modelli Ultralytics YOLO. La Vision AI guida il controllo qualità, il rilevamento dei difetti, la conformità ai DPI e l'automazione della linea di assemblaggio.

Scopri di più
Real-time AI that works with your operation

AI nel settore automobilistico

Applica la computer vision al settore automobilistico con i modelli Ultralytics YOLO. La vision AI migliora la sicurezza stradale, l'assistenza alla guida e l'automazione dei veicoli per strade più intelligenti.

Scopri di più
Real-time AI tailored to your operation

AI in Agricoltura

Porta la vision AI nell'agricoltura intelligente con i modelli Ultralytics YOLO. Potenzia il monitoraggio delle colture, il tracciamento del bestiame e l'agricoltura di precisione per rese più elevate e intelligenti.

Scopri di più

Costruiamo insieme il futuro dell'AI!

Inizia il tuo viaggio con il futuro del machine learning