Image Segmentation
Esplora la segmentazione delle immagini nella visione artificiale. Impara come Ultralytics YOLO26 fornisce maschere precise a livello di pixel per la segmentazione di istanze, semantica e panottica.
La segmentazione delle immagini è una tecnica sofisticata nella computer vision (CV) che consiste nel suddividere un'immagine digitale in più sottogruppi di pixel, spesso chiamati segmenti o regioni dell'immagine. A differenza della classificazione delle immagini standard, che assegna un'unica etichetta a un'intera immagine, la segmentazione analizza i dati visivi a un livello molto più granulare, assegnando un'etichetta di classe specifica a ogni singolo pixel. Questo processo crea una mappa precisa a livello di pixel, consentendo ai modelli di intelligenza artificiale (AI) di comprendere non solo quali oggetti sono presenti, ma esattamente dove sono posizionati e quali sono i loro confini specifici.
Link to this sectionI meccanismi dell'analisi a livello di pixel#
Per ottenere questa comprensione ad alta fedeltà, i modelli di segmentazione sfruttano solitamente architetture di deep learning (DL), in particolare le reti neurali convoluzionali (CNN). Queste reti agiscono come potenti estrattori di caratteristiche, identificando pattern come bordi, texture e forme complesse. Le architetture di segmentazione tradizionali, come la classica U-Net, utilizzano spesso una struttura encoder-decoder. L'encoder comprime l'immagine di input per catturare il contesto semantico, mentre il decoder ricostruisce i dettagli spaziali per produrre una maschera di segmentazione finale.
I progressi moderni hanno portato ad architetture in tempo reale come YOLO26, rilasciato nel gennaio 2026. Questi modelli integrano le funzionalità di segmentazione direttamente in una pipeline end-to-end, consentendo un'elaborazione ad alta velocità su vari hardware, dai GPU cloud ai dispositivi edge.
Link to this sectionTipi principali di segmentazione#
A seconda dell'obiettivo specifico di un progetto, gli sviluppatori scelgono solitamente tra tre tecniche principali di segmentazione:
- Segmentazione semantica: Questo metodo classifica i pixel in base alla loro categoria, ma non distingue tra oggetti separati della stessa classe. Ad esempio, in un'analisi di immagini satellitari, tutti i pixel che rappresentano "foresta" verrebbero colorati di verde, trattando l'intera foresta come un'unica entità.
- Segmentazione delle istanze: Questa tecnica identifica e separa singoli oggetti distinti di interesse. In una scena di strada trafficata, la segmentazione delle istanze genererebbe una maschera univoca per "Auto A", "Auto B" e "Pedone A", consentendo ai sistemi di contare e tracciare entità specifiche. Questa è una funzionalità principale della famiglia di modelli Ultralytics YOLO26.
- Segmentazione panottica: Un approccio ibrido che combina la copertura della segmentazione semantica con la precisione della segmentazione delle istanze. Assegna un'etichetta a ogni pixel, distinguendo elementi di sfondo amorfi (come il cielo e la strada) mentre identifica in modo univoco oggetti contabili in primo piano.
Link to this sectionDistinzione dal rilevamento degli oggetti#
È fondamentale differenziare la segmentazione dal rilevamento degli oggetti. Sebbene gli algoritmi di rilevamento localizzino gli elementi utilizzando un riquadro di delimitazione rettangolare, essi includono inevitabilmente i pixel di sfondo all'interno di quel riquadro. La segmentazione fornisce una rappresentazione più precisa e accurata tracciando l'esatto contorno o poligono dell'oggetto. Questa differenza è vitale per applicazioni come la presa robotica, in cui un braccio robotico deve conoscere la geometria precisa di un elemento per manipolarlo senza collisioni.
Link to this sectionApplicazioni nel mondo reale#
La precisione offerta dalla segmentazione delle immagini guida l'innovazione in diversi settori:
- Diagnostica medica: Nel campo dell'analisi di immagini mediche, la segmentazione è essenziale per delineare le strutture anatomiche. Gli algoritmi analizzano le scansioni MRI per delineare tumori o confini di organi, consentendo ai chirurghi di calcolare volumi esatti e pianificare procedure con una precisione salvavita.
- Guida autonoma: I veicoli a guida autonoma si affidano alla segmentazione per navigare in sicurezza. Elaborando i flussi video, il computer del veicolo può differenziare le corsie percorribili dai marciapiedi e dagli ostacoli. Le organizzazioni di standardizzazione come SAE International definiscono livelli di autonomia che richiedono questa percezione ambientale ad alta fedeltà.
- Agricoltura di precisione: Nell'AI in agricoltura, la segmentazione aiuta i sistemi robotici a identificare le erbacce tra le colture. Generando maschere per specifiche foglie di piante, gli spruzzatori automatizzati possono colpire solo le specie invasive, riducendo significativamente l'uso di erbicidi.
Link to this sectionImplementazione della segmentazione con YOLO26#
Gli sviluppatori possono implementare la segmentazione delle istanze in modo efficiente utilizzando il pacchetto Python ultralytics. Il seguente esempio utilizza il modello YOLO26, all'avanguardia e ottimizzato sia per la velocità che per la precisione.
from ultralytics import YOLO
# Load a pre-trained YOLO26 segmentation model
# 'n' denotes the nano version, optimized for speed
model = YOLO("yolo26n-seg.pt")
# Run inference on an image to generate masks
# The model identifies objects and outlines their shape
results = model("https://ultralytics.com/images/bus.jpg")
# Display the image with segmentation overlays
results[0].show()Per ottenere prestazioni elevate su attività personalizzate, i team hanno spesso bisogno di curare dati di addestramento di alta qualità. La Piattaforma Ultralytics semplifica questo processo fornendo strumenti per annotare immagini con maschere poligonali, gestire dataset e addestrare modelli nel cloud, snellendo l'intero ciclo di vita delle operazioni di machine learning (MLOps). Librerie come OpenCV sono anche frequentemente utilizzate insieme a questi modelli per il pre-processamento delle immagini e il post-processamento delle maschere risultanti.






