Sintonizzati su YOLO Vision 2025!
25 settembre 2025
10:00 — 18:00 BST
Evento ibrido
Yolo Vision 2024
Glossario

Cross-Validation

Scopri la potenza della cross-validation nel machine learning per migliorare l'accuratezza del modello, prevenire l'overfitting e garantire prestazioni robuste.

La convalida incrociata è una potente tecnica di valutazione dei modelli nel machine learning (ML) utilizzata per valutare come i risultati di un'analisi statistica si generalizzeranno a un set di dati indipendente. È una procedura di ricampionamento utilizzata per valutare i modelli ML su un campione di dati limitato. L'obiettivo principale è prevenire l'overfitting, in cui un modello apprende così bene i dati di addestramento da ottenere scarse prestazioni su dati nuovi e non visti. Simulando le prestazioni di un modello nel mondo reale, la convalida incrociata fornisce una stima più solida e affidabile delle prestazioni del modello.

Come funziona la cross-validation

Il metodo più comune di cross-validation è la K-Fold Cross-Validation. Questo processo prevede la suddivisione di un singolo set di dati in più parti:

  1. Divisione dei Dati: L'intero dataset di training viene suddiviso casualmente in 'k' sottoinsiemi di uguali dimensioni, o "fold".
  2. Training e convalida iterativi: Il modello viene addestrato 'k' volte. In ogni iterazione, una delle fold viene esclusa come set di convalida e il modello viene addestrato sulle restanti k-1 fold.
  3. Valutazione delle prestazioni: Le prestazioni del modello vengono valutate sulla fold di hold-out. Le metriche chiave, come l'accuratezza o la precisione media media (mAP), vengono registrate per ogni iterazione.
  4. Media dei risultati: Dopo aver completato tutte le 'k' iterazioni, le metriche di performance vengono mediate per produrre una singola stima, più stabile, dell'efficacia del modello.

Questo approccio garantisce che ogni punto dati sia presente in un set di validazione esattamente una volta e in un set di training k-1 volte. Una guida dettagliata sull'implementazione è disponibile nella guida alla cross-validation K-Fold di Ultralytics.

Convalida incrociata vs. semplice suddivisione della convalida

In un tipico progetto di ML, i dati sono suddivisi in set di training, validazione e test.

Una semplice suddivisione train/validation può talvolta essere fuorviante se il set di validazione, per caso, contiene campioni particolarmente facili o difficili. La cross-validation ovvia a questo problema utilizzando ogni parte del dataset sia per il training che per la validazione, fornendo una misura più affidabile della capacità del modello di generalizzare. Questo la rende particolarmente utile quando la quantità di dati disponibili è limitata. Framework popolari come Scikit-learn forniscono implementazioni robuste di tecniche di cross-validation.

Applicazioni nel mondo reale

La cross-validation è indispensabile nella costruzione di sistemi di IA affidabili in vari domini:

  1. Analisi di immagini mediche: Quando si sviluppa una Rete Neurale Convoluzionale (CNN) per l'analisi di immagini mediche, come il rilevamento di tumori nelle scansioni cerebrali utilizzando dataset come il dataset Brain Tumor, la CV viene utilizzata per valutare rigorosamente l'accuratezza diagnostica e la generalizzazione del modello su diversi dati dei pazienti. Questa robusta valutazione è fondamentale prima di prendere in considerazione studi clinici o richiedere l'approvazione normativa da enti come la FDA.
  2. Veicoli autonomi: Per i modelli di rilevamento di oggetti come Ultralytics YOLO utilizzati nei veicoli autonomi, la CV aiuta a garantire prestazioni affidabili nel rilevamento di pedoni, ciclisti e altri veicoli in varie condizioni ambientali. Questa convalida su set di dati complessi come Argoverse è fondamentale prima della distribuzione del modello in sistemi critici per la sicurezza come quelli nelle soluzioni di AI nel settore automobilistico.

Altre applicazioni includono la valutazione di modelli per la segmentazione delle immagini, attività di elaborazione del linguaggio naturale (NLP) come l'analisi del sentiment e la valutazione del rischio nella modellazione finanziaria. Piattaforme come Ultralytics HUB possono aiutare a gestire gli esperimenti e gli artefatti prodotti durante tali tecniche di valutazione, semplificando il ciclo di vita dello sviluppo.

Unisciti alla community di Ultralytics

Entra nel futuro dell'AI. Connettiti, collabora e cresci con innovatori globali

Iscriviti ora
Link copiato negli appunti