Scopri YOLO26: vision AI di prossima generazione.
Ultralytics
Torna al glossario Ultralytics

Benchmark Dataset

Esplora il ruolo dei dataset di benchmark nella valutazione dell'IA. Scopri come Ultralytics YOLO26 definisce nuovi standard di accuratezza e velocità per i compiti di computer vision.

Un Benchmark Dataset è una raccolta di dati standardizzata e di alta qualità, progettata per valutare le prestazioni dei modelli di machine learning (ML) in modo equo, riproducibile e oggettivo. A differenza dei dati proprietari utilizzati per i test interni, un benchmark dataset funge da "metro di paragone" pubblico per la comunità di ricerca e sviluppo. Testando diversi algoritmi sugli stessi identici input e utilizzando metriche di valutazione identiche, gli sviluppatori possono determinare con precisione quali modelli offrano una maggiore accuratezza, velocità o efficienza. Questi dataset sono fondamentali per monitorare il progresso scientifico in campi come la computer vision (CV) e l'elaborazione del linguaggio naturale.

Link to this sectionL'importanza della standardizzazione#

Nel panorama in rapida evoluzione dell'intelligenza artificiale (AI), affermare che un nuovo modello sia "più veloce" o "più accurato" è praticamente privo di significato senza un punto di riferimento condiviso. I benchmark dataset forniscono questo terreno comune necessario. Sono solitamente curati per rappresentare sfide specifiche, come il rilevamento di piccoli oggetti, la gestione di occlusioni o la navigazione in condizioni di scarsa illuminazione.

Le principali competizioni, come la ImageNet Large Scale Visual Recognition Challenge, si basano su questi dataset per promuovere una sana competizione e l'innovazione. Questa standardizzazione garantisce che i miglioramenti nell'architettura del modello rappresentino progressi tecnologici reali, anziché il risultato di test su dati più facili, non standardizzati o selezionati ad hoc. Inoltre, l'utilizzo di benchmark consolidati aiuta i ricercatori a identificare potenziali bias del dataset, garantendo che i modelli si generalizzino bene a diversi scenari del mondo reale.

Link to this sectionDistinguere i benchmark da altre suddivisioni dei dati#

È fondamentale differenziare un benchmark dataset dalle suddivisioni di dati utilizzate durante il ciclo di vita standard di sviluppo di un modello. Sebbene condividano alcune somiglianze, i loro ruoli sono distinti:

  • Training Data: il materiale utilizzato per istruire il modello. L'algoritmo regola i suoi pesi interni in base a questi dati.
  • Validation Data: un sottoinsieme utilizzato durante l'addestramento per regolare gli iperparametri e prevenire l'overfitting. Funge da controllo preliminare ma non rappresenta il punteggio finale.
  • Test Data: un dataset interno utilizzato per verificare le prestazioni prima del rilascio.
  • Benchmark Dataset: un set di test esterno universalmente accettato. Sebbene un benchmark funga da dati di test, la sua distinzione principale è il ruolo di standard pubblico per il confronto tra modelli.

Link to this sectionApplicazioni nel mondo reale#

I benchmark dataset definiscono il successo in vari settori stabilendo rigorosi standard di sicurezza e affidabilità. Consentono alle organizzazioni di verificare che un modello sia pronto per l'implementazione in ambienti critici.

Link to this sectionRilevamento di oggetti nella visione generica#

L'esempio più importante nel object detection è il dataset COCO (Common Objects in Context). Quando Ultralytics rilascia una nuova architettura come YOLO26, le sue prestazioni vengono rigorosamente misurate rispetto a COCO per verificare i miglioramenti nella mean Average Precision (mAP). Ciò consente ai ricercatori di vedere esattamente come YOLO26 si confronta con YOLO11 o altri modelli all'avanguardia nel riconoscere oggetti quotidiani come persone, biciclette e animali.

Link to this sectionSicurezza nella guida autonoma#

Nell'industria automobilistica, la sicurezza è fondamentale. Gli sviluppatori di veicoli autonomi utilizzano benchmark specializzati come la KITTI Vision Benchmark Suite o il Waymo Open Dataset. Questi dataset contengono registrazioni complesse e annotate di ambienti di guida urbani, inclusi pedoni, ciclisti e segnali stradali. Valutando i sistemi di percezione rispetto a questi benchmark, gli ingegneri possono quantificare la robustezza del loro sistema in scenari di traffico reali, assicurando che l'AI reagisca correttamente ai pericoli dinamici.

Link to this sectionBenchmarking con Ultralytics#

Per facilitare un confronto accurato, Ultralytics fornisce strumenti integrati per misurare le prestazioni dei modelli su diversi formati di esportazione, come ONNX o TensorRT. Questo aiuta gli utenti a identificare il miglior compromesso tra latenza di inferenza e accuratezza per il loro specifico hardware, che si tratti di implementazioni su dispositivi edge o server cloud.

Il seguente esempio mostra come eseguire il benchmark di un modello YOLO26 utilizzando la Python API. Questo processo valuta la velocità e l'accuratezza del modello su una configurazione di dataset standard.

from ultralytics import YOLO

# Load the official YOLO26 nano model
model = YOLO("yolo26n.pt")

# Run benchmarks to evaluate performance across different formats
# This checks speed and accuracy (mAP) on the COCO8 dataset
results = model.benchmark(data="coco8.yaml", imgsz=640, half=False)

Link to this sectionSfide e considerazioni#

Sebbene i benchmark siano essenziali, non sono privi di difetti. Un fenomeno noto come "teaching to the test" (insegnare per il test) può verificarsi se i ricercatori ottimizzano un modello specificamente per ottenere un punteggio elevato in un benchmark a scapito della generalizzazione su dati nuovi e mai visti prima. Inoltre, i benchmark statici possono diventare obsoleti man mano che le condizioni del mondo reale cambiano. Gli aggiornamenti continui ai dataset, come quelli visti nel progetto Objects365 o in Google's Open Images, aiutano a mitigare questi problemi aumentando varietà e scala. Gli utenti che desiderano gestire i propri dataset per il benchmarking personalizzato possono sfruttare la Ultralytics Platform per un reperimento e una valutazione dei dati ottimizzati.

Explore solutions

Real-time AI that works with your team

AI nella Robotica

Potenzia macchine più intelligenti con i modelli Ultralytics YOLO. La Vision AI nella robotica guida la navigazione autonoma, la percezione, il tracciamento degli oggetti e il controllo in tempo reale.

Scopri di più
Real-time AI that works with your team

IA nella logistica

Semplifica la logistica con i modelli Ultralytics YOLO. La Vision AI abilita l'ispezione dei pacchi, lo smistamento, il tracciamento dei veicoli e il monitoraggio della sicurezza in magazzino in tempo reale.

Scopri di più
Real-time AI that works with your team

AI nel settore Retail

Reimmagina il retail con i modelli Ultralytics YOLO. La Vision AI alimenta il tracciamento dell'inventario, il monitoraggio degli scaffali, la gestione delle code e insight più intelligenti sui clienti.

Scopri di più
Real-time AI that works with your team

IA nel settore sanitario

Crea soluzioni sanitarie con i modelli Ultralytics YOLO. La vision AI nella sanità potenzia l'imaging medico più rapido, diagnosi più intelligenti e il monitoraggio dei pazienti.

Scopri di più
Real-time AI that works with your team

IA nella produzione

Ottimizza la produzione con i modelli Ultralytics YOLO. La Vision AI guida il controllo qualità, il rilevamento dei difetti, la conformità ai DPI e l'automazione della linea di assemblaggio.

Scopri di più
Real-time AI that works with your operation

AI nel settore automobilistico

Applica la computer vision al settore automobilistico con i modelli Ultralytics YOLO. La vision AI migliora la sicurezza stradale, l'assistenza alla guida e l'automazione dei veicoli per strade più intelligenti.

Scopri di più
Real-time AI tailored to your operation

AI in Agricoltura

Porta la vision AI nell'agricoltura intelligente con i modelli Ultralytics YOLO. Potenzia il monitoraggio delle colture, il tracciamento del bestiame e l'agricoltura di precisione per rese più elevate e intelligenti.

Scopri di più
Real-time AI that works with your team

AI nella Robotica

Potenzia macchine più intelligenti con i modelli Ultralytics YOLO. La Vision AI nella robotica guida la navigazione autonoma, la percezione, il tracciamento degli oggetti e il controllo in tempo reale.

Scopri di più
Real-time AI that works with your team

IA nella logistica

Semplifica la logistica con i modelli Ultralytics YOLO. La Vision AI abilita l'ispezione dei pacchi, lo smistamento, il tracciamento dei veicoli e il monitoraggio della sicurezza in magazzino in tempo reale.

Scopri di più
Real-time AI that works with your team

AI nel settore Retail

Reimmagina il retail con i modelli Ultralytics YOLO. La Vision AI alimenta il tracciamento dell'inventario, il monitoraggio degli scaffali, la gestione delle code e insight più intelligenti sui clienti.

Scopri di più
Real-time AI that works with your team

IA nel settore sanitario

Crea soluzioni sanitarie con i modelli Ultralytics YOLO. La vision AI nella sanità potenzia l'imaging medico più rapido, diagnosi più intelligenti e il monitoraggio dei pazienti.

Scopri di più
Real-time AI that works with your team

IA nella produzione

Ottimizza la produzione con i modelli Ultralytics YOLO. La Vision AI guida il controllo qualità, il rilevamento dei difetti, la conformità ai DPI e l'automazione della linea di assemblaggio.

Scopri di più
Real-time AI that works with your operation

AI nel settore automobilistico

Applica la computer vision al settore automobilistico con i modelli Ultralytics YOLO. La vision AI migliora la sicurezza stradale, l'assistenza alla guida e l'automazione dei veicoli per strade più intelligenti.

Scopri di più
Real-time AI tailored to your operation

AI in Agricoltura

Porta la vision AI nell'agricoltura intelligente con i modelli Ultralytics YOLO. Potenzia il monitoraggio delle colture, il tracciamento del bestiame e l'agricoltura di precisione per rese più elevate e intelligenti.

Scopri di più
Real-time AI that works with your team

AI nella Robotica

Potenzia macchine più intelligenti con i modelli Ultralytics YOLO. La Vision AI nella robotica guida la navigazione autonoma, la percezione, il tracciamento degli oggetti e il controllo in tempo reale.

Scopri di più
Real-time AI that works with your team

IA nella logistica

Semplifica la logistica con i modelli Ultralytics YOLO. La Vision AI abilita l'ispezione dei pacchi, lo smistamento, il tracciamento dei veicoli e il monitoraggio della sicurezza in magazzino in tempo reale.

Scopri di più
Real-time AI that works with your team

AI nel settore Retail

Reimmagina il retail con i modelli Ultralytics YOLO. La Vision AI alimenta il tracciamento dell'inventario, il monitoraggio degli scaffali, la gestione delle code e insight più intelligenti sui clienti.

Scopri di più
Real-time AI that works with your team

IA nel settore sanitario

Crea soluzioni sanitarie con i modelli Ultralytics YOLO. La vision AI nella sanità potenzia l'imaging medico più rapido, diagnosi più intelligenti e il monitoraggio dei pazienti.

Scopri di più
Real-time AI that works with your team

IA nella produzione

Ottimizza la produzione con i modelli Ultralytics YOLO. La Vision AI guida il controllo qualità, il rilevamento dei difetti, la conformità ai DPI e l'automazione della linea di assemblaggio.

Scopri di più
Real-time AI that works with your operation

AI nel settore automobilistico

Applica la computer vision al settore automobilistico con i modelli Ultralytics YOLO. La vision AI migliora la sicurezza stradale, l'assistenza alla guida e l'automazione dei veicoli per strade più intelligenti.

Scopri di più
Real-time AI tailored to your operation

AI in Agricoltura

Porta la vision AI nell'agricoltura intelligente con i modelli Ultralytics YOLO. Potenzia il monitoraggio delle colture, il tracciamento del bestiame e l'agricoltura di precisione per rese più elevate e intelligenti.

Scopri di più

Costruiamo insieme il futuro dell'AI!

Inizia il tuo viaggio con il futuro del machine learning