Yolo Vision Shenzhen
Shenzhen
Iscriviti ora
Glossario

Segmentazione Semantica

Scopri la potenza della segmentazione semantica: classifica ogni pixel nelle immagini per una comprensione precisa della scena. Esplora applicazioni e strumenti ora!

La segmentazione semantica è un'attività fondamentale della computer vision che prevede l'assegnazione di un'etichetta di classe specifica a ogni singolo pixel di un'immagine. A differenza di altri metodi che potrebbero identificare oggetti con caselle o assegnare una singola etichetta a un'intera immagine, la segmentazione semantica crea una mappa densa e perfetta al pixel delle diverse categorie semantiche presenti. Questo fornisce una comprensione ricca e dettagliata del contenuto dell'immagine, delineando la forma e la posizione esatta di ogni categoria, come "strada", "cielo", "edificio" o "persona". È una tecnica fondamentale in scene in cui la comprensione del contesto e del layout è importante quanto l'identificazione dei singoli oggetti.

Modelli e strumenti

La segmentazione semantica impiega spesso modelli di deep learning, in particolare architetture derivate da Reti Neurali Convoluzionali (CNN).

Applicazioni nel mondo reale

La comprensione dettagliata della scena fornita dalla segmentazione semantica è cruciale in molti campi:

  • Veicoli autonomi: Affinché un'auto a guida autonoma possa navigare in sicurezza, deve comprendere completamente il suo ambiente. La segmentazione semantica viene utilizzata per identificare le aree percorribili (strada), le aree non percorribili (marciapiedi, edifici) e la posizione di pedoni, ciclisti e altri veicoli con precisione a livello di pixel. Ciò consente una pianificazione del percorso e un processo decisionale più sicuri. Puoi leggere di più sul ruolo dell'AI nei veicoli autonomi.
  • Analisi di immagini mediche: In medicina, la precisione è fondamentale. La segmentazione semantica aiuta a delineare automaticamente organi, tumori, lesioni e altre strutture anatomiche in scansioni come risonanze magnetiche e TAC. Questo assiste i radiologi nella diagnosi, nella pianificazione del trattamento e nel monitoraggio della progressione della malattia. Scopri di più su come l'AI viene applicata nell'imaging medicale.
  • Analisi di immagini satellitari: Per le applicazioni geospaziali, la segmentazione semantica viene utilizzata per classificare la copertura del suolo da immagini satellitari. Questo può essere utilizzato per la pianificazione urbana (identificazione di edifici, strade e spazi verdi), il monitoraggio ambientale (monitoraggio della deforestazione o dei corpi idrici) e l'agricoltura di precisione.
  • Robotica: I robot utilizzano la segmentazione semantica per comprendere il loro ambiente operativo, consentendo loro di distinguere tra pavimenti, pareti, oggetti con cui interagire e ostacoli da evitare. Questo è fondamentale per le attività di navigazione e manipolazione in ambienti complessi come magazzini o abitazioni. Scopri di più sull'integrazione della computer vision nella robotica.

Distinzioni chiave da altre attività

È importante distinguere la segmentazione semantica da attività di computer vision correlate:

  • Segmentazione di istanza: Questa è l'attività più strettamente correlata. Mentre entrambe eseguono la classificazione a livello di pixel, la segmentazione di istanza fa un ulteriore passo avanti distinguendo tra singole istanze della stessa classe di oggetti. Ad esempio, in un'immagine con tre auto, la segmentazione semantica etichetterebbe tutti i pixel dell'auto semplicemente come "auto". Al contrario, la segmentazione di istanza identificherebbe "auto 1", "auto 2" e "auto 3" come oggetti separati.
  • Object Detection: Questo task identifica la presenza e la posizione degli oggetti all'interno di un'immagine disegnando un bounding box attorno a ciascuno e assegnando un'etichetta di classe. Non fornisce informazioni sulla forma dell'oggetto o su quali pixel gli appartengono.
  • Panoptic Segmentation: Questo task può essere visto come un'unificazione della semantic e della instance segmentation. Mira a fornire una comprensione completa della scena assegnando un'etichetta di classe a ogni pixel (come la semantic segmentation) identificando anche in modo univoco ogni istanza dell'oggetto (come la instance segmentation).

Unisciti alla community di Ultralytics

Entra nel futuro dell'AI. Connettiti, collabora e cresci con innovatori globali

Iscriviti ora
Link copiato negli appunti