Sintonizzati su YOLO Vision 2025!
25 settembre 2025
10:00 — 18:00 BST
Evento ibrido
Yolo Vision 2024
Glossario

Annotazione dei dati

Cos'è l'annotazione dei dati? Scopri come l'etichettatura dei dati con bounding box o poligoni è essenziale per l'addestramento di modelli di AI e computer vision accurati.

L'annotazione dei dati è il processo di etichettatura o tagging dei dati grezzi per aiutare i modelli di machine learning (ML) a comprendere e imparare da essi. Questo passaggio critico trasforma i dati non strutturati, come immagini o video, in informazioni strutturate che gli algoritmi possono interpretare. Nel contesto dell'apprendimento supervisionato, queste annotazioni fungono da "ground truth", le risposte corrette che il modello utilizza per addestrarsi. La qualità e l'accuratezza dell'annotazione dei dati influiscono direttamente sulle prestazioni e sull'affidabilità del modello di intelligenza artificiale (AI) risultante. Senza annotazioni precise, anche i modelli più avanzati non riusciranno a imparare efficacemente i modelli.

Il ruolo dell'annotazione nella computer vision

Nella computer vision (CV), l'annotazione dei dati è fondamentale per insegnare ai modelli a "vedere" e interpretare il mondo. Essa coinvolge annotatori umani che utilizzano software specializzato per identificare e contrassegnare oggetti di interesse all'interno dei dati visivi. Esistono diversi tipi di annotazione, ognuno adatto a diverse attività di CV:

  • Bounding Box Annotation: Questa è la forma più comune, utilizzata per l'object detection. Gli annotatori disegnano rettangoli attorno ai singoli oggetti e assegnano un'etichetta di classe (ad esempio, "auto", "persona").
  • Segmentazione poligonale: Per le attività che richiedono maggiore precisione, come la segmentazione delle istanze, gli annotatori tracciano il contorno esatto di ciascun oggetto. Ciò consente al modello di comprendere la forma e i confini specifici di un oggetto, anche quando gli oggetti si sovrappongono.
  • Segmentazione semantica: Questo metodo prevede la classificazione di ogni singolo pixel in un'immagine in una categoria specifica (ad esempio, "cielo", "strada", "edificio"). A differenza della segmentazione delle istanze, non distingue tra diverse istanze della stessa classe di oggetti.
  • Annotazione di punti chiave: Utilizzata per la stima della posa, questa tecnica prevede la marcatura di specifici punti di interesse (punti chiave) su un oggetto, come le articolazioni di un corpo umano o gli angoli di un volto.
  • Classificazione: La forma più semplice, in cui a un'intera immagine viene assegnata una singola etichetta. Questo è fondamentale per le attività di classificazione delle immagini.

La scelta del metodo di annotazione dipende dagli obiettivi specifici del progetto di CV, che sono delineati nella guida alla definizione degli obiettivi del progetto.

Applicazioni nel mondo reale

  1. Veicoli autonomi: Le auto a guida autonoma si basano su modelli addestrati su dati ampiamente annotati. Gli annotatori etichettano di tutto, dai pedoni e ciclisti ai semafori, alla segnaletica orizzontale e ai segnali stradali in milioni di immagini e nuvole di punti LiDAR. Questi dati di addestramento dettagliati consentono al sistema di percezione del veicolo di comprendere il suo ambiente e prendere decisioni di guida sicure. Dataset come Argoverse sono fondamentali per sviluppare soluzioni robuste di IA nel settore automobilistico.
  2. Analisi di immagini mediche: Nell'AI per la sanità, i radiologi e gli esperti medici annotano le scansioni mediche come risonanze magnetiche, TC e radiografie per evidenziare tumori, lesioni, fratture o altre anomalie. Questi set di dati annotati, come il set di dati pubblico sui tumori cerebrali, vengono utilizzati per addestrare modelli come Ultralytics YOLO che possono assistere nella diagnosi precoce e nella pianificazione del trattamento. La Radiological Society of North America (RSNA) fornisce diversi set di dati di questo tipo per la ricerca.

Annotazione dei dati vs. Concetti correlati

L'annotazione dei dati viene spesso discussa insieme ad altre tecniche di preparazione dei dati, ma hanno scopi diversi.

  • Annotazione dei dati vs. Data Labeling: Questi due termini sono frequentemente usati in modo intercambiabile e si riferiscono allo stesso processo principale. "Annotazione" è spesso preferito nella computer vision per descrivere compiti più complessi come il disegno di poligoni o keypoint, mentre "labeling" potrebbe essere usato per compiti più semplici come la classificazione. Tuttavia, per tutti gli scopi pratici, sono sinonimi. Per uno sguardo approfondito, puoi leggere di più nella nostra spiegazione sull'etichettatura dei dati per la computer vision.
  • Annotazione dei dati vs. Data Augmentation: L'annotazione è il processo di creazione delle etichette iniziali di ground truth. La data augmentation, d'altra parte, è una tecnica utilizzata dopo l'annotazione per aumentare artificialmente le dimensioni del set di dati creando versioni modificate delle immagini annotate (ad esempio, ruotando, capovolgendo o modificando la luminosità).
  • Annotazione dei dati vs. Data Cleaning: La pulizia dei dati comporta la correzione degli errori, la rimozione dei duplicati e la gestione dei valori mancanti all'interno di un set di dati per garantirne la qualità complessiva. La pulizia può avvenire prima dell'annotazione (ad esempio, la rimozione di immagini sfocate) o dopo (ad esempio, la correzione di etichette errate), ma è distinta dall'atto di aggiungere nuove etichette. Un'elevata qualità dei dati è essenziale per un'annotazione efficace.

Il processo di annotazione può essere gestito utilizzando vari strumenti, da opzioni open source come CVAT a piattaforme commerciali come Scale AI e Labelbox. Piattaforme come Ultralytics HUB forniscono soluzioni integrate per gestire i set di dati, addestrare i modelli e semplificare l'intero flusso di lavoro dalla raccolta e annotazione dei dati all'implementazione.

Unisciti alla community di Ultralytics

Entra nel futuro dell'AI. Connettiti, collabora e cresci con innovatori globali

Iscriviti ora
Link copiato negli appunti