Glossario

Annotazione dei dati

Che cos'è l'annotazione dei dati? Scoprite come l'etichettatura dei dati con caselle di delimitazione o poligoni sia essenziale per l'addestramento di modelli di intelligenza artificiale e di visione artificiale accurati.

L'annotazione dei dati è il processo di etichettatura o marcatura dei dati grezzi per aiutare i modelli di apprendimento automatico (ML) a comprenderli e a imparare da essi. Questa fase critica trasforma i dati non strutturati, come immagini o video, in informazioni strutturate che gli algoritmi possono interpretare. Nel contesto dell'apprendimento supervisionato, queste annotazioni servono come "verità di base", ovvero le risposte corrette che il modello utilizza per addestrarsi. La qualità e l'accuratezza dell'annotazione dei dati hanno un impatto diretto sulle prestazioni e sull'affidabilità del modello di intelligenza artificiale (AI) risultante. Senza annotazioni precise, anche i modelli più avanzati non riusciranno ad apprendere efficacemente i modelli.

Il ruolo dell'annotazione nella visione artificiale

Nella computer vision (CV), l'annotazione dei dati è fondamentale per insegnare ai modelli a "vedere" e interpretare il mondo. Si tratta di annotazioni umane che utilizzano software specializzati per identificare e contrassegnare gli oggetti di interesse all'interno dei dati visivi. Esistono diversi tipi di annotazione, ciascuno adatto a diversi compiti di CV:

  • Annotazione Bounding Box: È la forma più comune, utilizzata per il rilevamento degli oggetti. Gli annotatori disegnano delle caselle rettangolari attorno ai singoli oggetti e assegnano un'etichetta di classe (ad esempio, "auto", "persona").
  • Segmentazione poligonale: Per i compiti che richiedono una maggiore precisione, come la segmentazione delle istanze, gli annotatori tracciano il contorno esatto di ogni oggetto. Ciò consente al modello di comprendere la forma e i confini specifici di un oggetto, anche quando gli oggetti si sovrappongono.
  • Segmentazione semantica: Questo metodo prevede la classificazione di ogni singolo pixel di un'immagine in una categoria specifica (ad esempio, "cielo", "strada", "edificio"). A differenza della segmentazione per istanze, non distingue tra diverse istanze della stessa classe di oggetti.
  • Annotazione dei punti chiave: Utilizzata per la stima della posa, questa tecnica prevede la marcatura di specifici punti di interesse (keypoints) su un oggetto, come le articolazioni di un corpo umano o gli angoli di un volto.
  • Classificazione: La forma più semplice, in cui a un'intera immagine viene assegnata una singola etichetta. È fondamentale per i compiti di classificazione delle immagini.

La scelta del metodo di annotazione dipende dagli obiettivi specifici del progetto CV, illustrati nella guida alla definizione degli obiettivi del progetto.

Applicazioni del mondo reale

  1. Veicoli autonomi: Le auto a guida autonoma si affidano a modelli addestrati su dati ampiamente annotati. Gli annotatori etichettano tutto, dai pedoni ai ciclisti, dai semafori alla segnaletica stradale, in milioni di immagini e nuvole di punti LiDAR. Questi dati di addestramento dettagliati consentono al sistema di percezione del veicolo di comprendere l'ambiente circostante e di prendere decisioni di guida sicure. I dataset come Argoverse sono fondamentali per lo sviluppo di soluzioni robuste di intelligenza artificiale nel settore automobilistico.
  2. Analisi delle immagini mediche: Nell'IA per la sanità, radiologi ed esperti medici annotano scansioni mediche come risonanze magnetiche, TAC e radiografie per evidenziare tumori, lesioni, fratture o altre anomalie. Questi dataset annotati, come il dataset pubblico Brain Tumor, vengono utilizzati per addestrare modelli come Ultralytics YOLO, che possono aiutare nella diagnosi precoce e nella pianificazione del trattamento. La Radiological Society of North America (RSNA) fornisce diversi set di dati di questo tipo per la ricerca.

Annotazione dei dati e concetti correlati

L'annotazione dei dati viene spesso discussa insieme ad altre tecniche di preparazione dei dati, ma hanno scopi diversi.

  • Annotazione dei dati vs. etichettatura dei dati: Questi due termini sono spesso usati in modo intercambiabile e si riferiscono allo stesso processo di base. Il termine "annotazione" è spesso preferito nella computer vision per descrivere attività più complesse come il disegno di poligoni o punti chiave, mentre "etichettatura" può essere usato per attività più semplici come la classificazione. Tuttavia, per tutti gli scopi pratici, sono sinonimi. Per un approfondimento, potete leggere la nostra spiegazione sull'etichettatura dei dati per la computer vision.
  • Annotazione dei dati e incremento dei dati: L'annotazione è il processo di creazione delle etichette di verità iniziali. L'incremento dei dati, invece, è una tecnica utilizzata dopo l' annotazione per aumentare artificialmente le dimensioni del set di dati creando versioni modificate delle immagini annotate (ad esempio, ruotando, capovolgendo o cambiando la luminosità).
  • Annotazione dei dati vs. pulizia dei dati: La pulizia dei dati comporta la correzione degli errori, la rimozione dei duplicati e la gestione dei valori mancanti in un set di dati per garantirne la qualità complessiva. La pulizia può avvenire prima dell'annotazione (ad esempio, eliminando le immagini sfocate) o dopo (ad esempio, correggendo le etichette errate), ma è distinta dall'aggiunta di nuove etichette. Un'elevata qualità dei dati è essenziale per un'annotazione efficace.

Il processo di annotazione può essere gestito con diversi strumenti, dalle opzioni open-source come CVAT alle piattaforme commerciali come Scale AI e Labelbox. Piattaforme come Ultralytics HUB forniscono soluzioni integrate per gestire i set di dati, addestrare i modelli e ottimizzare l'intero flusso di lavoro, dalla raccolta e annotazione dei dati alla distribuzione.

Unitevi alla comunità di Ultralytics

Entrate a far parte del futuro dell'IA. Connettetevi, collaborate e crescete con gli innovatori globali.

Iscriviti ora
Link copiato negli appunti