Annotazione dei dati
Cos'è l'annotazione dei dati? Scopri come l'etichettatura dei dati con bounding box o poligoni è essenziale per l'addestramento di modelli di AI e computer vision accurati.
L'annotazione dei dati è il processo fondamentale di etichettatura, taggatura o trascrizione dei dati grezzi per fornire il contesto necessario
richiesto da un modello di machine learning (ML)
per l'apprendimento. Questo passaggio è la pietra angolare dell'
apprendimento supervisionato, un metodo in cui gli algoritmi
vengono addestrati su coppie di input-output per riconoscere modelli e fare previsioni. Le informazioni etichettate fungono da
ground truth, rappresentando il risultato ideale che il modello
cerca di replicare. Senza un'annotazione precisa e coerente, anche architetture avanzate come
Ultralytics non possono funzionare in modo efficace, poiché l'
accuratezza del sistema dipende direttamente dalla qualità dei suoi
dati di addestramento.
Tipi comuni di annotazione nella visione artificiale
Nel campo della visione artificiale (CV), l'annotazione dei dati
comporta la marcatura di caratteristiche specifiche all'interno di immagini o fotogrammi video. Il metodo utilizzato dipende in larga misura dal
compito specifico per cui viene costruito il modello.
-
Rilevamento degli oggetti: gli annotatori
disegnano dei riquadri 2D attorno agli oggetti di interesse,
come veicoli o pedoni. Questo insegna al modello cos'è un oggetto e dove si trova all'interno della scena.
-
Segmentazione delle istanze:
Questa tecnica consiste nel tracciare poligoni precisi attorno ai bordi di un oggetto. A differenza delle semplici scatole, la segmentazione
mappa la forma e il contorno esatti, il che è fondamentale per compiti che richiedono un'elevata precisione come la
presa robotica.
-
Stima della posa: gli annotatori contrassegnano
punti chiave specifici su un soggetto, come le articolazioni
del corpo umano (gomiti, ginocchia, spalle). Ciò consente ai modelli di track , la postura e persino analizzare le
prestazioni atletiche.
-
Classificazione delle immagini: questa
è la forma più semplice, in cui un'unica etichetta di categoria (ad esempio, "foglia sana" contro "foglia malata")
viene assegnata all'intera immagine.
Applicazioni nel mondo reale
L'annotazione dei dati colma il divario tra i dati grezzi dei sensori e il processo decisionale intelligente in vari settori industriali.
-
Agricoltura intelligente: nell'
agricoltura basata sull'intelligenza artificiale, vasti set di dati di immagini delle colture
vengono annotati per identificare erbacce, parassiti o carenze nutrizionali. Addestrando modelli su questi dati, gli agricoltori
possono automatizzare il monitoraggio delle colture e applicare trattamenti solo dove necessario, riducendo gli sprechi e migliorando la resa.
-
Guida autonoma: le auto a guida autonoma si basano su enormi librerie di dati annotati in cui ogni indicatore di corsia
, segnale stradale e ostacolo è etichettato. I dati provenienti dalle telecamere e dai
sensori LiDAR vengono elaborati per addestrare il sistema di percezione del veicolo
, garantendo che possa navigare in modo sicuro in scenari di traffico complessi.
Distinguere i concetti correlati
È utile distinguere l'annotazione dei dati da altri termini spesso utilizzati nel flusso di lavoro di preparazione dei set di dati.
-
Annotazione vs. Etichettatura dei dati:
Sebbene spesso utilizzati in modo intercambiabile, il termine "etichettatura" si riferisce in genere a compiti di classificazione più semplici (assegnazione di un
tag), mentre "annotazione" implica la generazione di metadati più ricchi, come il disegno di geometrie complesse o la marcatura di
timestamp nei video.
-
Annotazione vs. Aumento dei dati:
L'annotazione crea la verità di base iniziale. L'aumento è un processo successivo che espande artificialmente il
set di dati applicando trasformazioni (come rotazioni o variazioni di colore) alle immagini annotate esistenti per migliorare la
robustezza del modello.
-
Annotazione vs. Apprendimento attivo:
L'apprendimento attivo è una strategia in cui il modello identifica quali specifici punti dati ritiene più confusi e
richiede l'annotazione umana solo per quegli esempi, ottimizzando i tempi e i costi del processo di annotazione.
Strumenti e flusso di lavoro
La creazione di annotazioni di alta qualità richiede in genere un software specializzato che esporti i dati in formati standard come
JSON o XML. I flussi di lavoro moderni
si stanno orientando sempre più verso ambienti integrati come Ultralytics , che semplifica l'approvvigionamento dei dati, l'annotazione automatica e l'
addestramento dei modelli in un'unica interfaccia.
Una volta annotati, i dati vengono referenziati in un file di configurazione (spesso YAML) per l'addestramento. L'esempio seguente
mostra come addestrare un modello YOLO26 utilizzando il
COCO8 standard COCO8 , che viene fornito con annotazioni preesistenti
.
from ultralytics import YOLO
# Load the latest YOLO26 model (nano version)
model = YOLO("yolo26n.pt")
# Train the model using a dataset configuration file
# The YAML file points to the annotated images and labels
results = model.train(data="coco8.yaml", epochs=5, imgsz=640)