Yolo Vision Shenzhen
Shenzhen
Iscriviti ora
Glossario

Annotazione dei dati

Cos'è l'annotazione dei dati? Scopri come l'etichettatura dei dati con bounding box o poligoni è essenziale per l'addestramento di modelli di AI e computer vision accurati.

L'annotazione dei dati è il processo fondamentale di etichettatura, taggatura o trascrizione dei dati grezzi per fornire il contesto necessario richiesto da un modello di machine learning (ML) per l'apprendimento. Questo passaggio è la pietra angolare dell' apprendimento supervisionato, un metodo in cui gli algoritmi vengono addestrati su coppie di input-output per riconoscere modelli e fare previsioni. Le informazioni etichettate fungono da ground truth, rappresentando il risultato ideale che il modello cerca di replicare. Senza un'annotazione precisa e coerente, anche architetture avanzate come Ultralytics non possono funzionare in modo efficace, poiché l' accuratezza del sistema dipende direttamente dalla qualità dei suoi dati di addestramento.

Tipi comuni di annotazione nella visione artificiale

Nel campo della visione artificiale (CV), l'annotazione dei dati comporta la marcatura di caratteristiche specifiche all'interno di immagini o fotogrammi video. Il metodo utilizzato dipende in larga misura dal compito specifico per cui viene costruito il modello.

  • Rilevamento degli oggetti: gli annotatori disegnano dei riquadri 2D attorno agli oggetti di interesse, come veicoli o pedoni. Questo insegna al modello cos'è un oggetto e dove si trova all'interno della scena.
  • Segmentazione delle istanze: Questa tecnica consiste nel tracciare poligoni precisi attorno ai bordi di un oggetto. A differenza delle semplici scatole, la segmentazione mappa la forma e il contorno esatti, il che è fondamentale per compiti che richiedono un'elevata precisione come la presa robotica.
  • Stima della posa: gli annotatori contrassegnano punti chiave specifici su un soggetto, come le articolazioni del corpo umano (gomiti, ginocchia, spalle). Ciò consente ai modelli di track , la postura e persino analizzare le prestazioni atletiche.
  • Classificazione delle immagini: questa è la forma più semplice, in cui un'unica etichetta di categoria (ad esempio, "foglia sana" contro "foglia malata") viene assegnata all'intera immagine.

Applicazioni nel mondo reale

L'annotazione dei dati colma il divario tra i dati grezzi dei sensori e il processo decisionale intelligente in vari settori industriali.

  1. Agricoltura intelligente: nell' agricoltura basata sull'intelligenza artificiale, vasti set di dati di immagini delle colture vengono annotati per identificare erbacce, parassiti o carenze nutrizionali. Addestrando modelli su questi dati, gli agricoltori possono automatizzare il monitoraggio delle colture e applicare trattamenti solo dove necessario, riducendo gli sprechi e migliorando la resa.
  2. Guida autonoma: le auto a guida autonoma si basano su enormi librerie di dati annotati in cui ogni indicatore di corsia , segnale stradale e ostacolo è etichettato. I dati provenienti dalle telecamere e dai sensori LiDAR vengono elaborati per addestrare il sistema di percezione del veicolo , garantendo che possa navigare in modo sicuro in scenari di traffico complessi.

Distinguere i concetti correlati

È utile distinguere l'annotazione dei dati da altri termini spesso utilizzati nel flusso di lavoro di preparazione dei set di dati.

  • Annotazione vs. Etichettatura dei dati: Sebbene spesso utilizzati in modo intercambiabile, il termine "etichettatura" si riferisce in genere a compiti di classificazione più semplici (assegnazione di un tag), mentre "annotazione" implica la generazione di metadati più ricchi, come il disegno di geometrie complesse o la marcatura di timestamp nei video.
  • Annotazione vs. Aumento dei dati: L'annotazione crea la verità di base iniziale. L'aumento è un processo successivo che espande artificialmente il set di dati applicando trasformazioni (come rotazioni o variazioni di colore) alle immagini annotate esistenti per migliorare la robustezza del modello.
  • Annotazione vs. Apprendimento attivo: L'apprendimento attivo è una strategia in cui il modello identifica quali specifici punti dati ritiene più confusi e richiede l'annotazione umana solo per quegli esempi, ottimizzando i tempi e i costi del processo di annotazione.

Strumenti e flusso di lavoro

La creazione di annotazioni di alta qualità richiede in genere un software specializzato che esporti i dati in formati standard come JSON o XML. I flussi di lavoro moderni si stanno orientando sempre più verso ambienti integrati come Ultralytics , che semplifica l'approvvigionamento dei dati, l'annotazione automatica e l' addestramento dei modelli in un'unica interfaccia.

Una volta annotati, i dati vengono referenziati in un file di configurazione (spesso YAML) per l'addestramento. L'esempio seguente mostra come addestrare un modello YOLO26 utilizzando il COCO8 standard COCO8 , che viene fornito con annotazioni preesistenti .

from ultralytics import YOLO

# Load the latest YOLO26 model (nano version)
model = YOLO("yolo26n.pt")

# Train the model using a dataset configuration file
# The YAML file points to the annotated images and labels
results = model.train(data="coco8.yaml", epochs=5, imgsz=640)

Unitevi alla comunità di Ultralytics

Entra nel futuro dell'AI. Connettiti, collabora e cresci con innovatori globali

Iscriviti ora