Scopri come la segmentazione delle istanze perfeziona il rilevamento degli oggetti con una precisione a livello di pixel, consentendo maschere di oggetti dettagliate per le applicazioni di IA.
La segmentazione delle istanze è una sofisticata tecnica di visione computerizzata (CV) che identifica, localizzare e delineare i singoli oggetti all'interno di un'immagine a livello di pixel. A differenza del rilevamento degli oggetti, che approssima la posizione di un oggetto di un oggetto con un riquadro di delimitazione rettangolare, la segmentazione dell'istanza genera una maschera precisa che delinea la forma esatta di ogni oggetto distinto. Questo livello granulare di di dettaglio permette ai sistemi di distinguere tra più istanze della stessa classe, come ad esempio separare due auto sovrapposte o singole persone in una folla. due auto che si sovrappongono o singole persone in una folla. intelligenza artificiale (AI) avanzate.
Per comprendere appieno la segmentazione delle istanze, è utile confrontarla con altri compiti fondamentali di compiti fondamentali della visione artificiale:
La segmentazione delle istanze fonde efficacemente le capacità di localizzazione del rilevamento degli oggetti con la precisione a livello di pixel della segmentazione semantica. precisione della segmentazione semantica.
I modelli di segmentazione delle istanze utilizzano generalmente architetture di deep learning (DL), in particolare reti neurali convoluzionali (CNN), per estrarre le caratteristiche da un'immagine. Il processo prevede in genere due fasi parallele:
I primi approcci, come Mask R-CNN, utilizzavano un processo a due fasi, prima generando proposte di regioni e poi raffinandole. Le architetture moderne, come Ultralytics YOLO11hanno rivoluzionato questo aspetto eseguendo rilevamento e la segmentazione in un'unica fase. Ciò consente in tempo reale, rendendo possibile la segmentazione di segment gli oggetti nei flussi video in diretta con elevata velocità e precisione.
Il rilevamento preciso dei confini offerto dalla segmentazione delle istanze è indispensabile in diversi settori:
Gli sviluppatori possono facilmente implementare la segmentazione delle istanze utilizzando il metodo ultralytics Pacchetto Python . La libreria
supporta YOLO11 modelli pre-addestrati sulla
Set di dati COCOin grado di detect e segment 80 categorie di oggetti comuni.
dalla scatola.
Ecco un esempio conciso di come caricare un modello ed eseguire la segmentazione su un'immagine:
from ultralytics import YOLO
# Load a pre-trained YOLO11 instance segmentation model
model = YOLO("yolo11n-seg.pt")
# Run inference on an image
# The model predicts classes, boxes, and masks simultaneously
results = model.predict("https://ultralytics.com/images/bus.jpg")
# Visualize the results with masks plotted
results[0].show()
Per gli utenti che desiderano applicare questo modello ai propri dati, il framework supporta l'addestramento su insiemi di dati personalizzati, consentendo al modello di imparare nuove classi specifiche per applicazioni di nicchia.