Scoprite la potenza della segmentazione delle immagini con Ultralytics YOLO. Scoprite la precisione a livello di pixel, i tipi, le applicazioni e i casi d'uso dell'intelligenza artificiale nel mondo reale.
La segmentazione delle immagini è una tecnica fondamentale nella visione computerizzata (CV) che prevede la suddivisione un'immagine digitale in più sottogruppi di pixel, comunemente chiamati segmenti di immagine. L'obiettivo primario è quello di semplificare la rappresentazione di un'immagine in qualcosa di più significativo e più facile da analizzare. A differenza del rilevamento degli oggetti, che li localizza all'interno di un rettangolare , la segmentazione dell'immagine fornisce una mappa precisa a livello di una mappa precisa, a livello di pixel, della forma di un oggetto. Questo processo assegna un'etichetta a ogni pixel di un'immagine, permettendo ai modelli di modelli di intelligenza artificiale (AI) di di comprendere i confini e i contorni esatti delle entità all'interno di una scena.
In molti flussi di lavoro moderni di apprendimento automatico (ML), conoscere la posizione approssimativa di un oggetto è insufficiente. Le applicazioni che richiedono l'interazione con il mondo fisico, come un robot che afferra un pacco o un'auto che percorre una strada tortuosa, richiedono una comprensione granulare della geometria. geometria. La segmentazione delle immagini colma questo divario convertendo i dati visivi grezzi in un insieme di regioni classificate. Questa capacità capacità è alimentata da architetture avanzate di architetture avanzate di deep learning (DL), in particolare Reti neurali convoluzionali (CNN), che estraggono caratteristiche spaziali per differenziare gli oggetti in primo piano dallo sfondo.
La comprensione dello specifico compito di segmentazione è fondamentale per selezionare la giusta architettura del modello. Le tre categorie principali categorie sono:
La capacità di delineare confini precisi rende la segmentazione indispensabile in diversi settori:
I framework moderni hanno semplificato l'implementazione dei compiti di segmentazione. Mentre i vecchi rilevatori a due stadi, come Mask R-CNN erano accurati ma lenti, i modelli a singolo stadio hanno hanno rivoluzionato il campo offrendo in tempo reale. Il Ultralytics YOLO11 ad esempio, supporta la segmentazione delle istanze in modo nativo. In prospettiva, YOLO26 è in fase di sviluppo per ottimizzare ulteriormente queste capacità con l'elaborazione end-to-end.
Gli sviluppatori possono utilizzare librerie standard come OpenCV per la pre-elaborazione e la visualizzazione, mentre utilizzare PyTorch per il lavoro pesante dell'inferenza del modello. dell'inferenza del modello.
Ecco un esempio conciso di come eseguire la segmentazione delle istanze utilizzando un modello YOLO11 pre-addestrato in Python:
from ultralytics import YOLO
# Load a pre-trained YOLO11 segmentation model
model = YOLO("yolo11n-seg.pt")
# Run inference on an image (can be a local path or URL)
results = model("https://ultralytics.com/images/bus.jpg")
# Display the resulting image with segmentation masks overlaid
results[0].show()
Questo frammento di codice gestisce automaticamente le complesse operazioni di estrazione delle caratteristiche, regressione dei riquadri di delimitazione e generazione delle maschere. e della generazione delle maschere, consentendo agli sviluppatori di concentrarsi sull'integrazione dei risultati di risultati della segmentazione nelle loro applicazioni più grandi.