Glossario

Segmentazione Semantica

Scoprite la potenza della segmentazione semantica: classify ogni pixel delle immagini per una comprensione precisa della scena. Esplora subito applicazioni e strumenti!

La segmentazione semantica è una tecnica fondamentale nella computer vision (CV) che prevede l'assegnazione di una un'etichetta di classe specifica a ogni singolo pixel di un'immagine. A differenza di compiti più semplici che potrebbero categorizzare un'intera immagine o posizionare un riquadro di delimitazione intorno a un oggetto, la segmentazione semantica fornisce una mappa perfetta della scena. Questo livello di dettaglio granulare consente alle macchine di comprendere i confini precisi e le forme degli oggetti, classificando regioni distinte come "strada", "strada" e "strada". regioni distinte come "strada", "persona", "cielo" o "tumore". Trattando un'immagine un'immagine come un insieme di pixel classificati, piuttosto che come una semplice somma di oggetti, questo metodo offre una comprensione completa del contesto visivo, che è essenziale per la comprensione del contesto visivo, essenziale per i sistemi avanzati di intelligenza sistemi di intelligenza artificiale (AI) avanzati che interagiscono con ambienti complessi.

Meccanica di base della classificazione a livello di pixel

Il processo di segmentazione semantica si basa in larga misura su modelli di modelli di apprendimento profondo (DL), in particolare architetture basate su reti neurali convoluzionali (CNN). Questi modelli sono addestrati su grandi dataset annotati in cui esperti annotatori umani hanno etichettato ogni pixel. Durante l'addestramento, la rete impara ad associare caratteristiche di basso livello, come texture e bordi, a concetti semantici di alto livello. a concetti semantici di alto livello.

Un modello architettonico comune prevede una struttura di codifica-decodifica:

Codificatore: Decampiona l'immagine di ingresso per catturare il contesto semantico e ridurre le dimensioni spaziali.
Decodificatore: Campiona le caratteristiche codificate alla risoluzione dell'immagine originale per generare una mappa di predizione. mappa di predizione.

Le architetture pionieristiche come le reti completamente convoluzionali (FCN) hanno gettato le basi le basi, sostituendo gli strati completamente connessi con quelli convoluzionali per produrre mappe spaziali. Progetti più specializzati, come più specializzate, come la U-Net, utilizzano connessioni saltate per conservare dettagli a grana fine, rendendole molto efficaci per compiti che richiedono un'elevata precisione.

distinguere la segmentazione semantica dai compiti correlati

Per selezionare lo strumento giusto per un progetto, è fondamentale distinguere la segmentazione semantica da altri compiti di compiti di computer vision:

Rilevamento degli oggetti: Identifica gli oggetti oggetti e li localizza con rettangoli rettangolari. Risponde alla domanda "dov'è l'oggetto? oggetto?", ma ignora la forma esatta dell'oggetto.
Segmentazione delle istanze: Simile alla segmentazione semantica, ma distingue tra singole istanze della stessa classe. Ad esempio, mentre la segmentazione semantica etichetta tutti i pixel di "auto" con lo stesso colore, la segmentazione delle istanze assegna un ID univoco a "auto 1", "auto 2", ecc.
Classificazione dell'immagine: Assegna una singola etichetta all'intera immagine (ad esempio, "scena di spiaggia") senza identificare la posizione di elementi specifici. elementi specifici.

Applicazioni nel mondo reale

La capacità di analizzare le scene a livello di pixel ha favorito l'innovazione in diversi settori:

Veicoli autonomi: Le auto a guida autonoma utilizzano la segmentazione semantica per identificare le superfici percorribili (strade), i segnali stradali, i pedoni e gli ostacoli. ostacoli. Dataset come Cityscapes sono ampiamente utilizzati per addestrare modelli per navigare in modo sicuro negli ambienti urbani.
Analisi delle immagini mediche: Nel settore sanitario la precisione è fondamentale. I modelli segment organi, lesioni e tumori nelle scansioni di risonanza magnetica o TC o TAC. Questo aiuta i radiologi a quantificare il volume dei tessuti e a pianificare gli interventi chirurgici.
Analisi delle immagini satellitari: La segmentazione semantica aiuta nella classificazione della copertura del suolo, nel monitoraggio della deforestazione e nella pianificazione urbana. Organizzazioni come la NASA utilizzano queste tecniche per monitorare i cambiamenti ambientali su scala globale. scala globale.
Agricoltura di precisione: Gli agricoltori utilizzano la segmentazione per distinguere le colture dalle erbe infestanti, consentendo un'applicazione mirata di erbicidi che riduce l'uso di prodotti chimici e i costi. l'uso di prodotti chimici e i costi.

Implementazione della segmentazione semantica

Quadri moderni come PyTorch e TensorFlow forniscono gli strumenti per costruire modelli di segmentazione. Tuttavia, librerie di alto livello semplificano notevolmente il processo. Il Ultralytics YOLO11 modelli supportano di segmentazione, offrendo un equilibrio tra velocità e accuratezza, adatto a velocità e precisione, adatto per inferenza in tempo reale.

L'esempio seguente mostra come caricare un modello di segmentazione YOLO11 pre-addestrato ed eseguire l'inferenza su un'immagine utilizzando il modello YOLO11 . immagine utilizzando il modello ultralytics pacchetto python .

from ultralytics import YOLO

# Load a pre-trained YOLO11 segmentation model
model = YOLO("yolo11n-seg.pt")

# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")

# Visualize the segmentation mask results
results[0].show()

Per gli sviluppatori che desiderano creare soluzioni personalizzate, strumenti di annotazione come LabelMe o CVAT sono essenziali per preparare i dati di addestramento. Una volta addestrati, questi modelli possono essere distribuiti sui dispositivi edge utilizzando OpenCV o formati ottimizzati formati ottimizzati come ONNX per ottenere prestazioni efficienti negli ambienti di produzione.

Segmentazione Semantica

Addestrare i modelliYOLO di Ultralytics per ottimizzare i flussi di lavoro in tutti i settori industriali

Soluzione di licenza aziendale flessibile per potenziare la tua innovazione

Addestrare modelli di intelligenza artificiale in pochi secondi con Ultralytics YOLO

Meccanica di base della classificazione a livello di pixel

distinguere la segmentazione semantica dai compiti correlati

Applicazioni nel mondo reale

Implementazione della segmentazione semantica

Leggi di più in questa categoria

Tracciamento delle palline da golf utilizzandoYOLO Ultralytics

Comprendere perché l'annotazione human-in-the-loop è fondamentale

Che cos'è la distillazione dei set di dati? Una rapida panoramica

Unitevi alla comunità di Ultralytics