Sintonizzati su YOLO Vision 2025!
25 settembre 2025
10:00 — 18:00 BST
Evento ibrido
Yolo Vision 2024
Glossario

Etichettatura dei dati

Scopri il ruolo fondamentale dell'etichettatura dei dati nel machine learning, il suo processo, le sfide e le applicazioni nel mondo reale nello sviluppo dell'AI.

L'etichettatura dei dati è il processo di identificazione dei dati grezzi (come immagini, file di testo o video) e di aggiunta di una o più etichette o annotazioni informative per fornire un contesto, consentendo a un modello di machine learning di imparare da essi. Questo processo è fondamentale per l'apprendimento supervisionato, dove il dataset etichettato funge da "verità di base" che l'algoritmo utilizza per addestrarsi a fare previsioni accurate su nuovi dati non etichettati. L'etichettatura dei dati di alta qualità è uno dei passaggi più critici e dispendiosi in termini di tempo nella costruzione di un modello di IA robusto, poiché le prestazioni del modello dipendono direttamente dalla qualità e dall'accuratezza delle etichette da cui apprende.

Perché l'etichettatura dei dati è importante?

L'etichettatura dei dati fornisce le basi necessarie affinché i modelli comprendano e interpretino il mondo. Nella computer vision (CV), le etichette insegnano a un modello a riconoscere cosa è un oggetto e dove si trova all'interno di un'immagine. Senza etichette accurate, un modello non può apprendere i modelli necessari per svolgere il suo compito, portando a una scarsa accuratezza e inaffidabilità. La qualità dei dati di training, che viene creata attraverso l'etichettatura, determina direttamente la qualità dell'IA risultante. Questo principio è spesso riassunto come "spazzatura in entrata, spazzatura in uscita". Dataset di riferimento ben etichettati come COCO e ImageNet sono stati fondamentali per far avanzare lo stato dell'arte nella computer vision.

Tipi di etichettatura dei dati nella Computer Vision

Diverse attività di CV richiedono diversi tipi di annotazione. I metodi più comuni includono:

  • Classificazione delle immagini: La forma più semplice, in cui viene assegnata una singola etichetta a un'intera immagine per descriverne il contenuto (ad esempio, "gatto", "cane"). Puoi esplorare dataset per questa attività come CIFAR-100.
  • Rilevamento di oggetti: Implica il disegno di un riquadro di delimitazione attorno a ciascun oggetto di interesse in un'immagine e l'assegnazione di un'etichetta di classe ad esso. Questo indica al modello sia cosa è l'oggetto sia dove si trova.
  • Segmentazione delle immagini: Un metodo più granulare che prevede la definizione della forma esatta di un oggetto a livello di pixel. Questo può essere ulteriormente suddiviso in segmentazione semantica, dove tutti gli oggetti della stessa classe condividono una maschera, e segmentazione di istanza, dove ogni singola istanza dell'oggetto viene segmentata separatamente.
  • Stima della posa: Questa tecnica identifica la posizione e l'orientamento degli oggetti annotando i punti chiave. Ad esempio, nella stima della posa umana, i punti chiave contrassegnerebbero le articolazioni come gomiti, ginocchia e polsi. Il dataset COCO Keypoints è una risorsa popolare per questa attività.

Applicazioni nel mondo reale

  1. Veicoli autonomi: L'etichettatura dei dati è essenziale per l'addestramento dei sistemi di percezione delle auto a guida autonoma. Gli annotatori umani etichettano meticolosamente milioni di immagini e fotogrammi video, disegnando bounding box attorno ad auto, pedoni e ciclisti, segmentando la segnaletica orizzontale e classificando i segnali stradali. Questi dati ricchi ed etichettati consentono a modelli come Ultralytics YOLO11 di imparare a navigare in ambienti urbani complessi in modo sicuro. Il lavoro svolto da aziende come Waymo si basa fortemente su set di dati vasti e accuratamente etichettati. Puoi saperne di più su questo campo nella nostra pagina sulle soluzioni di AI nel settore automobilistico.
  2. Analisi di immagini mediche: Nell'IA in ambito sanitario, i radiologi e gli esperti medici etichettano le scansioni come risonanze magnetiche, TAC e radiografie per identificare tumori, lesioni e altre anomalie. Ad esempio, su un brain tumor dataset, gli esperti delineerebbero i confini esatti di un tumore. Questi dati etichettati vengono utilizzati per addestrare modelli in grado di assistere nella diagnosi precoce, riducendo potenzialmente il carico di lavoro sui professionisti medici e migliorando gli esiti per i pazienti. La Radiological Society of North America (RSNA) esplora attivamente il ruolo dell'IA nella diagnostica medica.

Etichettatura dei dati vs. Concetti correlati

L'etichettatura dei dati viene spesso eseguita insieme ad altre attività di preparazione dei dati, ma è importante distinguere tra loro:

  • Aumento dei dati: Questa tecnica espande artificialmente il set di dati di addestramento creando versioni modificate di dati già etichettati (ad esempio, ruotando, capovolgendo o modificando la luminosità di un'immagine). L'aumento aumenta la diversità dei dati, ma dipende da un set iniziale di dati etichettati. Una panoramica dell'aumento dei dati fornisce maggiori dettagli.
  • Pulizia dei dati: Questo processo prevede l'identificazione e la correzione o la rimozione di errori, incongruenze e imprecisioni in un set di dati. Sebbene ciò possa includere la correzione di etichette errate, la pulizia dei dati è una fase di garanzia della qualità, mentre l'etichettatura dei dati è l'atto iniziale di creazione delle annotazioni. La pulizia dei dati su Wikipedia offre ulteriori informazioni.
  • Pre-elaborazione dei dati (Data Preprocessing): Questo è un termine ombrello più ampio che comprende l'etichettatura, la pulizia dei dati e altre trasformazioni come la normalizzazione o il ridimensionamento delle immagini per prepararle per un modello. L'etichettatura è una fase specifica e cruciale all'interno della pipeline di pre-elaborazione più ampia.

Sfide e soluzioni

Nonostante la sua importanza, l'etichettatura dei dati è irta di sfide, tra cui costi elevati, notevoli investimenti di tempo e il potenziale di errore umano o soggettività. Garantire la qualità e la coerenza delle etichette tra grandi team di annotatori è un importante ostacolo logistico.

Per semplificare questo processo, i team utilizzano spesso strumenti di annotazione specializzati come CVAT o piattaforme come Ultralytics HUB, che forniscono un ambiente collaborativo per la gestione dei set di dati e dei flussi di lavoro di etichettatura. Inoltre, tecniche avanzate come l'Active Learning possono aiutare selezionando in modo intelligente i punti dati più informativi da etichettare, ottimizzando l'uso del tempo e degli sforzi degli annotatori umani. Come dettagliato in un articolo dello Stanford AI Lab, l'attenzione alla qualità dei dati è fondamentale per il successo dell'IA.

Unisciti alla community di Ultralytics

Entra nel futuro dell'AI. Connettiti, collabora e cresci con innovatori globali

Iscriviti ora
Link copiato negli appunti