Yolo Vision Shenzhen
Shenzhen
Iscriviti ora
Glossario

Segmentazione delle immagini

Scoprite la potenza della segmentazione delle immagini con Ultralytics YOLO. Scoprite la precisione a livello di pixel, i tipi, le applicazioni e i casi d'uso dell'intelligenza artificiale nel mondo reale.

La segmentazione delle immagini è una tecnica fondamentale nella visione computerizzata (CV) che prevede la suddivisione un'immagine digitale in più sottogruppi di pixel, comunemente chiamati segmenti di immagine. L'obiettivo primario è quello di semplificare la rappresentazione di un'immagine in qualcosa di più significativo e più facile da analizzare. A differenza del rilevamento degli oggetti, che li localizza all'interno di un rettangolare , la segmentazione dell'immagine fornisce una mappa precisa a livello di una mappa precisa, a livello di pixel, della forma di un oggetto. Questo processo assegna un'etichetta a ogni pixel di un'immagine, permettendo ai modelli di modelli di intelligenza artificiale (AI) di di comprendere i confini e i contorni esatti delle entità all'interno di una scena.

L'importanza della precisione a livello di pixel

In molti flussi di lavoro moderni di apprendimento automatico (ML), conoscere la posizione approssimativa di un oggetto è insufficiente. Le applicazioni che richiedono l'interazione con il mondo fisico, come un robot che afferra un pacco o un'auto che percorre una strada tortuosa, richiedono una comprensione granulare della geometria. geometria. La segmentazione delle immagini colma questo divario convertendo i dati visivi grezzi in un insieme di regioni classificate. Questa capacità capacità è alimentata da architetture avanzate di architetture avanzate di deep learning (DL), in particolare Reti neurali convoluzionali (CNN), che estraggono caratteristiche spaziali per differenziare gli oggetti in primo piano dallo sfondo.

Tipi di segmentazione delle immagini

La comprensione dello specifico compito di segmentazione è fondamentale per selezionare la giusta architettura del modello. Le tre categorie principali categorie sono:

  • Segmentazione semantica: Questo metodo tratta più oggetti della stessa categoria come un'unica entità. Ad esempio, in una scena di strada, tutti i strada" sono colorati di grigio, mentre tutti i pixel appartenenti a "auto" sono colorati di blu. Il metodo non distingue tra due auto diverse, ma identifica semplicemente che si tratta di due veicoli. Questo approccio Questo approccio viene spesso implementato utilizzando architetture come la U-Net, sviluppate originariamente per la segmentazione di immagini biomediche.
  • Segmentazione delle istanze: Questa tecnica fa un ulteriore passo avanti identificando singoli oggetti distinti. Se in un'immagine ci sono cinque auto, segmentazione delle istanze genererà cinque maschere separate, consentendo al sistema di contare e track ogni veicolo indipendentemente. Questo è il compito principale svolto da Ultralytics YOLO11 modelli di segmentazione, che bilanciano velocità e precisione per le applicazioni in tempo reale.
  • Segmentazione panottica: A approccio ibrido che combina segmentazione semantica e istanza. Fornisce una comprensione completa della scena assegnando un'etichetta di classe a ogni pixel (sfondo come cielo e strada) e identificando in modo univoco gli oggetti conteggiabili (come persone e automobili). oggetti conteggiabili (cose come persone e automobili).

Applicazioni nel mondo reale

La capacità di delineare confini precisi rende la segmentazione indispensabile in diversi settori:

  • Analisi delle immagini mediche: La segmentazione è fondamentale in ambito sanitario per l'analisi di scansioni quali risonanza magnetica o TC o TC. Delineando con precisione tumori, organi o lesioni, i modelli di intelligenza artificiale assistono i radiologi nella diagnosi e nella pianificazione chirurgica. pianificazione chirurgica. Ad esempio, l'identificazione del volume esatto di un tumore cerebrale consente una radioterapia più mirata, ridurre al minimo i danni ai tessuti sani.
  • Veicoli autonomi: Le auto a guida autonoma si basano molto sulla segmentazione per navigare in sicurezza. I modelli elaborano i feed video per identificare corsie, marciapiedi, pedoni e ostacoli. Organizzazioni come la SAE International definiscono livelli di autonomia che richiedono questa dettagliata percezione ambientale dettagliata per prendere decisioni in una frazione di secondo.
  • Agricoltura di precisione: In AI in agricoltura, la segmentazione aiuta a monitorare la salute delle colture. I droni dotati di telecamere multispettrali possono segment campi per identificare le infestazioni di erbe infestanti o le carenze di nutrienti o carenze di nutrienti foglia per foglia, consentendo un'applicazione mirata di erbicidi.

Implementazione tecnica con YOLO

I framework moderni hanno semplificato l'implementazione dei compiti di segmentazione. Mentre i vecchi rilevatori a due stadi, come Mask R-CNN erano accurati ma lenti, i modelli a singolo stadio hanno hanno rivoluzionato il campo offrendo in tempo reale. Il Ultralytics YOLO11 ad esempio, supporta la segmentazione delle istanze in modo nativo. In prospettiva, YOLO26 è in fase di sviluppo per ottimizzare ulteriormente queste capacità con l'elaborazione end-to-end.

Gli sviluppatori possono utilizzare librerie standard come OpenCV per la pre-elaborazione e la visualizzazione, mentre utilizzare PyTorch per il lavoro pesante dell'inferenza del modello. dell'inferenza del modello.

Ecco un esempio conciso di come eseguire la segmentazione delle istanze utilizzando un modello YOLO11 pre-addestrato in Python:

from ultralytics import YOLO

# Load a pre-trained YOLO11 segmentation model
model = YOLO("yolo11n-seg.pt")

# Run inference on an image (can be a local path or URL)
results = model("https://ultralytics.com/images/bus.jpg")

# Display the resulting image with segmentation masks overlaid
results[0].show()

Questo frammento di codice gestisce automaticamente le complesse operazioni di estrazione delle caratteristiche, regressione dei riquadri di delimitazione e generazione delle maschere. e della generazione delle maschere, consentendo agli sviluppatori di concentrarsi sull'integrazione dei risultati di risultati della segmentazione nelle loro applicazioni più grandi.

Unitevi alla comunità di Ultralytics

Entra nel futuro dell'AI. Connettiti, collabora e cresci con innovatori globali

Iscriviti ora