Interactive Segmentation
Impara come la segmentazione interattiva usa prompt human-in-the-loop per isolare gli oggetti. Scopri come usare Ultralytics YOLO26 e la Ultralytics Platform per le tue attività.
La segmentazione interattiva è un approccio altamente collaborativo alla computer vision in cui un utente umano fornisce input continui o in modalità single-shot, come clic, BBox o prompt testuali, per guidare un modello AI nell'isolamento di oggetti specifici all'interno di un'immagine. A differenza dei metodi completamente automatizzati, questa tecnica human-in-the-loop ti permette di definire esattamente cosa deve essere segmentato, rendendola particolarmente preziosa quando hai a che fare con dati visivi ambigui, oggetti sovrapposti o classi non viste in precedenza. Negli ultimi anni, l'introduzione di modelli fondativi ha migliorato drasticamente la velocità e l'accuratezza di questo processo, trasformandolo in uno strumento vitale per la data annotation e l'imaging di precisione.
Link to this sectionCome funziona la segmentazione interattiva#
Fondamentalmente, il workflow si basa sulla promptable concept segmentation, in cui il modello interpreta le indicazioni dell'utente per generare una maschera pixel-perfect. Puoi posizionare un clic "positivo" sull'oggetto in primo piano che vuoi selezionare e un clic "negativo" sulle aree di sfondo che vuoi escludere. Modelli avanzati come il Segment Anything Model (SAM) e i suoi successori, Meta SAM 3, fanno un ulteriore passo avanti accettando diversi tipi di gesture [1], BBox e persino descrizioni testuali per fondare la ricerca visiva. Il modello calcola il confine ottimale basandosi su questi prompt e tu puoi rifinire iterativamente la maschera con clic aggiuntivi fino a ottenere l'accuratezza desiderata.
Link to this sectionApplicazioni nel mondo reale#
La segmentazione interattiva sta trasformando i workflow in numerosi settori unendo l'esperienza umana con l'efficienza dell'AI.
- Imaging medico: Nell'AI in healthcare, medici e radiologi utilizzano strumenti interattivi per isolare tumori, lesioni o organi specifici in scansioni MRI e CT. La ricerca sulla spatial modeling for medical images [2] mostra che i clic interattivi consentono ai professionisti del settore medico di correggere rapidamente le predizioni dell'AI, garantendo la precisione rigorosa richiesta per la diagnosi del paziente.
- Mappatura geospaziale e satellitare: Urbanisti e scienziati ambientali utilizzano modelli interattivi per accelerare la GIS feature extraction [3]. Invece di tracciare manualmente coste complesse, confini agricoli o nuove infrastrutture, gli analisti possono posizionare pochi clic strategici per generare istantaneamente poligoni geografici accurati.
- Rilevamento dei difetti industriali: Per l'AI in manufacturing, gli ingegneri del controllo qualità possono utilizzare prompt interattivi per evidenziare difetti microscopici sulle linee di produzione, adattando dinamicamente il sistema a nuovi tipi di difetti senza dover riaddestrare l'intero modello.
Link to this sectionSegmentazione interattiva vs. Instance segmentation#
Sebbene entrambi i concetti comportino la separazione degli oggetti a livello di pixel, servono a scopi operativi diversi. L'Instance segmentation è solitamente un processo completamente automatizzato in cui un modello, come Ultralytics YOLO26, rileva e delinea classi predefinite (es. "auto", "persona", "cane") senza intervento dell'utente. Puoi scoprire di più su come funziona nella nostra guida all'instance segmentation.
Al contrario, la segmentazione interattiva non si basa strettamente su classi predefinite. È agnostica rispetto alla classe, il che significa che segmenta tutto ciò che indichi, rendendola una soluzione eccellente per le pipeline di active learning in cui oggetti nuovi devono essere annotati rapidamente e aggiunti a dataset personalizzati utilizzando strumenti come la Ultralytics Platform.
Link to this sectionEsempio utilizzando Ultralytics#
Puoi implementare facilmente la segmentazione interattiva nei tuoi progetti usando PyTorch e il pacchetto Python ultralytics. In questo esempio, usiamo FastSAM per segmentare un oggetto specifico fornendo un prompt di tipo BBox.
from ultralytics import FastSAM
# Load a pretrained FastSAM model
model = FastSAM("FastSAM-s.pt")
# Perform interactive segmentation using a bounding box prompt [x1, y1, x2, y2]
results = model("path/to/image.jpg", bboxes=[100, 100, 300, 300])
# Display the segmented result on screen
results[0].show()Questo frammento dimostra come un semplice prompt spaziale guidi direttamente il modello nell'isolamento della regione di interesse, semplificando complesse attività di image segmentation con una quantità minima di codice.






