Yolo Vision Shenzhen
Shenzhen
Iscriviti ora

Guida all'annotazione dei poligoni con Ultralytics

Scopri le annotazioni poligonali, come consentono una segmentazione precisa degli oggetti e come creare facilmente annotazioni con Ultralytics .

Vuoi realizzare un progetto di visione artificiale?

Scopri le licenze

Le tecnologie di intelligenza artificiale all'avanguardia stanno trovando applicazione in un'ampia gamma di settori, dalla guida autonoma all'agricoltura di precisione. Ad esempio, gli allevatori di bestiame da latte utilizzano l'intelligenza artificiale e l'analisi delle immagini per detect nei bovini. Problemi di salute come la zoppia possono essere monitorati osservando i cambiamenti nell'andatura e nella postura dell'animale, quali la schiena inarcata e i movimenti asimmetrici. 

Fig. 1. Un esempio di monitoraggio delle vacche tramite intelligenza artificiale e analisi delle immagini.

La visione artificiale, una branca dell'intelligenza artificiale, rende possibili tali applicazioni consentendo alle macchine di interpretare e analizzare i dati visivi. Nello specifico, la segmentazione delle istanze è un'attività di visione artificiale che identifica e segmenta ogni oggetto in un'immagine a livello di pixel, rendendo possibile detect l'analisi precisi dei singoli animali.

L'annotazione poligonale svolge un ruolo fondamentale in questo processo. Si tratta di un metodo di annotazione dei dati utilizzato per tracciare con precisione la forma esatta di un oggetto in un'immagine, posizionando dei punti lungo i suoi contorni. A differenza delle semplici annotazioni con riquadri di delimitazione, questo approccio segue il contorno reale dell'oggetto, contribuendo a creare dati di addestramento più precisi e consentendo ai modelli di IA visiva di comprendere meglio i contorni degli oggetti.

Oggigiorno sono disponibili molti strumenti per la creazione di annotazioni poligonali. Tuttavia, queste opzioni possono spesso apparire frammentarie, soprattutto quando offrono un supporto incoerente o limitato per i diversi tipi di annotazioni, rendendo più difficile gestire esigenze di etichettatura diverse all’interno di un unico flusso di lavoro.

Ultralytics , il nostro nuovo ambiente di lavoro end-to-end dedicato all'intelligenza artificiale visiva che colma il divario tra gestione dei set di dati, annotazione, addestramento, implementazione e monitoraggio, risolve questo problema supportando diversi tipi di annotazione e flussi di lavoro assistiti dall'intelligenza artificiale in un unico ambiente di lavoro integrato, semplificando l'intero processo di annotazione.

In questo articolo vedremo cosa sono le annotazioni poligonali e come crearle utilizzando Ultralytics . Cominciamo! 

Uno sguardo più da vicino alle annotazioni sui poligoni

Prima di addentrarci nella Ultralytics e nelle sue funzionalità di annotazione poligonale, facciamo un passo indietro per capire in cosa consiste l'annotazione poligonale. 

L'annotazione delle immagini è il processo che consiste nell'aggiungere etichette ai dati visivi in modo che i modelli di intelligenza artificiale possano comprendere ciò che vedono. In genere comporta l'identificazione degli oggetti presenti in un'immagine e la loro marcatura in modo tale che il modello possa imparare da essi. 

Uno dei metodi più comuni consiste nel tracciare dei rettangoli attorno agli oggetti, noti come «riquadri di delimitazione». Tuttavia, i riquadri di delimitazione forniscono solo un contorno approssimativo dell'oggetto. L'annotazione poligonale rappresenta un approccio più preciso.

Funziona tracciando il contorno di un oggetto (i suoi bordi) punto per punto, anziché racchiuderlo in un riquadro. Per farlo, gli annotatori posizionano diversi vertici (punti) lungo i bordi dell'oggetto, tracciandone il contorno fino a coprire l'intera forma.

Questi punti collegati formano un poligono che rispecchia il contorno naturale dell'oggetto. Poiché la forma segue da vicino il contorno dell'oggetto, l'annotazione rileva dettagli che spesso sfuggono ai metodi di etichettatura tradizionali. Ciò risulta particolarmente utile quando gli oggetti presentano forme irregolari o contorni complessi, come foglie, sagome umane e oggetti sovrapposti. 

Una tale precisione nei dati aiuta i modelli di apprendimento automatico ad apprendere in modo più efficace durante la fase di addestramento. Quando le annotazioni rilevano con precisione i contorni effettivi di un oggetto, i modelli sono in grado di comprenderne meglio le caratteristiche a livello di pixel. Ciò porta a un miglioramento delle prestazioni del modello, specialmente nelle attività di segmentazione che richiedono un elevato grado di precisione.

Il ruolo delle annotazioni sui poligoni nei flussi di lavoro della visione artificiale

Ma come vengono utilizzate concretamente le annotazioni dei poligoni? Sono strettamente legate ai modelli di IA visiva che supportano attività di segmentazione delle immagini, come la segmentazione delle istanze.

In molte applicazioni di visione artificiale, è fondamentale conoscere l'area esatta occupata da ciascun oggetto in un'immagine o in un fotogramma video. Un buon esempio è il riconoscimento dei componenti automobilistici nel settore manifatturiero. In questo caso, i modelli devono identificare e delineare con precisione parti quali portiere, finestrini e fari, anche quando si sovrappongono o presentano forme complesse.

È qui che entra in gioco la segmentazione delle istanze. Essa consente ai modelli di detect oggetto e di tracciarne i contorni esatti a livello di pixel. Ciò differisce dal rilevamento di base degli oggetti, che utilizza i riquadri di delimitazione. 

Fig. 2. La segmentazione delle istanze può anche aiutare a individuare le parti danneggiate di un'auto. (Fonte)

I riquadri di delimitazione forniscono solo approssimative aree rettangolari attorno agli oggetti e spesso includono parti di sfondo superflue, rendendo più difficile individuare forme irregolari o separare elementi sovrapposti.

L'annotazione dei poligoni svolge un ruolo fondamentale nel garantire questo livello di precisione. Tracciando la forma esatta di ciascun oggetto nelle immagini del set di dati si ottengono dati di addestramento di alta qualità che riflettono i confini reali degli oggetti. Queste annotazioni dettagliate aiutano i modelli, come Ultralytics , a comprendere meglio la struttura di ciascun elemento, garantendo risultati di segmentazione più accurati.

Limiti degli strumenti tradizionali di annotazione delle immagini

Vediamo ora quali sono i limiti degli strumenti di annotazione tradizionali per comprendere la necessità di soluzioni più efficienti e scalabili come Ultralytics .

Ecco alcune delle difficoltà più comuni che gli annotatori incontrano quando utilizzano gli strumenti tradizionali di annotazione poligonale:

  • Supporto limitato per i tipi di annotazione: alcuni strumenti si concentrano su un'unica tecnica di annotazione, rendendo difficile lavorare con diversi tipi, come poligoni, riquadri di delimitazione e punti chiave, in un unico posto.
  • Gestione inefficiente delle annotazioni complesse: gli strumenti potrebbero non disporre delle funzionalità necessarie per annotare con precisione oggetti complessi caratterizzati da dettagli minuziosi.
  • Mancanza di funzionalità basate sull'intelligenza artificiale: molti strumenti si basano interamente sul lavoro manuale, senza un supporto integrato dell'intelligenza artificiale che acceleri il processo di annotazione.
  • Gestione frammentata dei set di dati: gestire set di dati, versioni e annotazioni può risultare complesso, soprattutto quando gli strumenti non offrono uno spazio di lavoro centralizzato.

Ultralytics risponde a queste esigenze grazie a funzionalità di annotazione assistita dall'intelligenza artificiale basate sia sui YOLO Segment Anything Models (SAM) che YOLO . SAM agli utenti di generare maschere di segmentazione di alta qualità a partire da semplici input, come i clic, che possono poi essere perfezionate in precise annotazioni poligonali. 

Allo stesso modo, l'annotazione intelligente YOLO utilizza YOLO pre-addestrati o personalizzati per eseguire l'inferenza su un'immagine e aggiungere previsioni, quali riquadri di delimitazione, maschere di segmentazione o riquadri di delimitazione orientati, sotto forma di annotazioni, che possono poi essere riviste e modificate secondo necessità. Nel loro insieme, queste funzionalità rendono il processo di annotazione più veloce, più coerente e più facilmente scalabile.

Diversi tipi di annotazioni supportati dalla Ultralytics

Ultralytics include un editor di annotazioni integrato che consente agli utenti di annotare le immagini direttamente all'interno dell'area di lavoro. Ciò semplifica la creazione e la gestione dei set di dati senza dover ricorrere a strumenti di etichettatura dei dati separati, che spesso richiedono molto tempo.

Oltre alle annotazioni poligonali, Ultralytics supporta diversi altri tipi di annotazioni. Ecco una breve panoramica:

  • Riquadri di delimitazione: gli annotatori possono tracciare semplici riquadri rettangolari attorno agli oggetti, facilitando così la detect identificazione e detect all'interno di un'immagine.
  • Punti chiave: Questo metodo viene utilizzato per contrassegnare punti specifici, come le articolazioni del corpo o punti di riferimento, per attività quali la stima della posa.
  • Riquadri di delimitazione orientati (OBB): consentono agli utenti di catturare oggetti ruotati o inclinati con maggiore precisione rispetto ai riquadri di delimitazione standard.
  • Etichette di classificazione: per le attività più semplici, gli utenti possono assegnare etichette a intere immagini invece di contrassegnare singoli oggetti.

Aggiunta di annotazioni agli oggetti tramite poligoni sulla Ultralytics

Vediamo ora come creare annotazioni poligonali sulla Ultralytics , sia manualmente che con strumenti assistiti dall'intelligenza artificiale.

Creazione manuale di annotazioni poligonali sulla Ultralytics

Ecco una breve guida passo passo per creare manualmente delle annotazioni poligonali:

  • Passaggio 1 - Accedi al tuo set di dati: apri il set di dati che contiene le immagini che desideri annotare. È qui che vengono archiviate e gestite le tue immagini e le tue annotazioni.
  • Passaggio 2 - Aprire un'immagine: clicca su un'immagine per aprirla nell'interfaccia di annotazione. Il flusso di lavoro di annotazione dipende dall'attività del set di dati. Ad esempio, in un set di dati di segmentazione di istanze, le annotazioni vengono create utilizzando maschere poligonali.
  • Passaggio 3 – Inizia a creare una maschera: clicca sull'immagine per iniziare ad aggiungere annotazioni. Ogni clic aggiunge un vertice lungo il contorno dell'oggetto.
  • Passaggio 4 – Traccia il contorno dell'oggetto: continua a cliccare lungo i bordi dell'oggetto per definirne la forma.
  • Passaggio 5 – Completa il poligono: puoi premere "Invio" oppure fare clic sul primo punto per completare il poligono e assegnargli un'etichetta di classe.
  • Passaggio 6 – Aggiungi ulteriori annotazioni: ripeti la procedura per creare altri poligoni relativi agli altri oggetti presenti nell'immagine.
  • Passaggio 7 – Salvataggio delle annotazioni: le annotazioni vengono salvate automaticamente man mano che le si crea.
Fig. 3. Una panoramica sulla creazione manuale di annotazioni poligonali tramite Ultralytics (Fonte)

Annotazione intelligente dei poligoni sulla Ultralytics

Vediamo ora le funzionalità di etichettatura assistita dall'intelligenza artificiale supportate dalla Ultralytics , che consentono di velocizzare il processo di annotazione.

La piattaforma offre due approcci per l'annotazione intelligente: uno basato sui modelli Segment Anything per la generazione interattiva di annotazioni tramite clic, e un altro basato sui YOLO per aggiungere direttamente le previsioni del modello come annotazioni. Entrambi gli approcci possono essere utilizzati per l'annotazione intelligente di poligoni. 

Annotazione intelligente tramite SAM Ultralytics

L'annotazione SAM sulla Ultralytics semplifica l'etichettatura manuale utilizzando il modello Segment Anything Model (SAM) per generare maschere di segmentazione con un input minimo. Anziché tracciare gli oggetti punto per punto, gli utenti possono interagire con l'immagine utilizzando semplici comandi, come i clic, per indicare cosa deve essere incluso o escluso.

La piattaforma supporta diversi SAM , tra cui SAM . SAM e SAM , consentendo agli utenti di scegliere tra prestazioni più veloci o una maggiore precisione a seconda delle loro esigenze. Sulla base dei dati forniti dall'utente, SAM maschere a livello di pixel in tempo reale. Queste maschere possono poi essere perfezionate e utilizzate come annotazioni poligonali, rendendo il processo più veloce, più coerente e più facilmente scalabile.

Ecco i passaggi da seguire per utilizzare SAM l'annotazione dei poligoni nella Ultralytics :

  • Passaggio 1 – Apri un'immagine: individua il tuo set di dati e clicca su un'immagine per avviare il visualizzatore a schermo intero.
  • Passaggio 2 – Accedere alla modalità di annotazione: fare clic su «Modifica», quindi passare alla modalità Smart (o premere S) per attivare SAM.
  • Passaggio 3 – Seleziona un SAM : scegli un SAM dalla barra degli strumenti in base alle tue esigenze in termini di velocità e precisione.
  • Passaggio 4 – Impostare i parametri: clicca con il tasto sinistro del mouse per aggiungere punti positivi (aree da includere) e clicca con il tasto destro del mouse per aggiungere punti negativi (aree da escludere).
  • Passaggio 5 – Generare e applicare la maschera: SAM una maschera di segmentazione in tempo reale. Premere "Invio" (o utilizzare l'applicazione automatica) per applicare l'annotazione.
  • Passaggio 6 – Perfeziona l'annotazione: aggiungi altri punti o modifica il risultato, se necessario, per migliorare la precisione prima di salvare. 
Fig. 4. Annotazione dei poligoni SAM all'interno Ultralytics (Fonte)

Annotazione intelligente tramite YOLO Ultralytics

L'annotazione intelligente YOLO sulla Ultralytics accelera il processo di etichettatura utilizzandoYOLO pre-addestrati o YOLO ottimizzati per generare previsioni su un'immagine e aggiungerle come annotazioni. Queste previsioni possono includere riquadri di delimitazione, maschere di segmentazione o riquadri di delimitazione orientati, a seconda dell'attività prevista dal set di dati. 

Gli utenti possono quindi rivedere e perfezionare queste annotazioni secondo necessità. Ecco una panoramica dei passaggi necessari per utilizzare l'annotazione intelligente YOLO sulla Ultralytics :

  • Passaggio 1 – Apri un'immagine: vai al tuo set di dati e seleziona un'immagine per aprirla nel visualizzatore a schermo intero.
  • Passaggio 2 – Accedere alla modalità di annotazione: fare clic su «Modifica», quindi passare alla modalità Smart (oppure premere S).
  • Passaggio 3 – Seleziona un YOLO : scegli un YOLO dal selettore di modelli nella barra degli strumenti.
  • Passaggio 4 – Esegui la previsione: clicca su «Predict» per consentire al modello di generare automaticamente le annotazioni.
  • Passaggio 5 – Controlla le annotazioni: verifica i riquadri di delimitazione previsti, le maschere di segmentazione o gli OBB aggiunti all'immagine.
  • Passaggio 6 – Perfeziona e salva: modifica , correggi o elimina le annotazioni errate secondo necessità, quindi salva le etichette definitive.
Fig. 5. Una panoramica sull'uso dell'annotazione YOLO (Fonte)

Casi d'uso reali dell'annotazione dei poligoni

L'annotazione dei poligoni sta avendo un impatto concreto in diversi settori, dal controllo qualità nella produzione all'agricoltura e alla sanità. Vediamo alcune delle principali applicazioni pratiche. 

Rilevamento dei parassiti tramite la visione artificiale

Nel settore agricolo, monitorare lo stato di salute delle colture è fondamentale per migliorare la resa e ridurre le perdite. Individuare le aree colpite da parassiti sulle foglie delle colture può risultare complesso, poiché tali zone presentano spesso forme irregolari e contorni poco definiti.

Questo tipo di problema può essere affrontato utilizzando tecniche di segmentazione delle immagini come la segmentazione semantica, che assegna un'etichetta a tutti i pixel appartenenti a una classe (ad esempio le aree infette), oppure la segmentazione per istanze, che separa i contorni degli oggetti in modo più preciso.

Grazie Ultralytics , gli utenti possono utilizzare le annotazioni poligonali per tracciare la forma esatta di queste aree infette. Ciò contribuisce a creare set di dati più accurati e facilita il lavoro degli algoritmi di intelligenza artificiale per la visione artificiale nell'individuare modelli sottili negli ambienti agricoli.

Di conseguenza, i team possono creare dati di addestramento più accurati che aiutano i modelli a individuare con precisione la presenza di infestazioni parassitarie. Questo approccio è più efficace rispetto all’uso dei riquadri di selezione, che possono includere parti della foglia non colpite.

Analisi di immagini mediche basata sulla segmentazione per istanze

Proprio come nel caso dell'individuazione dei parassiti in agricoltura, anche minime differenze nei contorni possono influire sul modo in cui malattie come il cancro vengono analizzate nell'imaging medico. Ciò è particolarmente importante quando si tratta di individuare anomalie cliniche, come i tumori, nelle scansioni TC.

I metodi di annotazione tradizionali possono tralasciare i contorni più sottili o includere tessuto circostante, compromettendo così la precisione. Con Ultralytics , i team possono utilizzare l'annotazione poligonale per tracciare con precisione queste aree nei dati di addestramento, aiutando i modelli a produrre una segmentazione tumorale più accurata e affidabile.

Punti chiave

L'annotazione dei poligoni è fondamentale quando i modelli devono interpretare con elevata precisione le forme degli oggetti nelle immagini. Consente di rappresentare le forme complesse in modo più accurato, soprattutto quando si utilizza Ultralytics . Combinando la precisione con strumenti potenti, i team possono sviluppare modelli di IA più affidabili e performanti.

Sei pronto a integrare l'intelligenza artificiale visiva nei tuoi progetti? Unisciti alla nostra community e scopri l'intelligenza artificiale nel settore automobilistico e l'intelligenza artificiale visiva nella robotica. Esplora il nostro repository GitHub per saperne di più. Dai un'occhiata alle nostre opzioni di licenza per iniziare oggi stesso! 

Costruiamo insieme il futuro dell'intelligenza artificiale!

Inizia il tuo viaggio con il futuro del machine learning