Sintonizzati su YOLO Vision 2025!
25 settembre 2025
10:00 — 18:00 BST
Evento ibrido
Yolo Vision 2024
Glossario

Perdita focale

Scoprite come Focal Loss affronta lo sbilanciamento delle classi nel rilevamento degli oggetti, concentrando l'addestramento su esempi difficili per migliorare la precisione su set di dati sbilanciati.

La perdita focale è una funzione di perdita specializzata progettata per affrontare il problema dello squilibrio tra le classi durante l'addestramento dei modelli di apprendimento automatico. Questo problema è particolarmente comune nelle attività di rilevamento degli oggetti, dove il numero di esempi di sfondo (classe negativa) può superare di gran lunga gli oggetti di interesse in primo piano (classe positiva). Regolando dinamicamente il peso di ogni esempio, Focal Loss incoraggia il modello a concentrare i suoi sforzi di apprendimento sugli esempi difficili da classificare, piuttosto che essere sopraffatto dal gran numero di esempi negativi facili da classificare. Questo approccio migliora significativamente l'accuratezza e le prestazioni dei modelli addestrati su insiemi di dati sbilanciati.

Come funziona la perdita focale

La perdita focale è un miglioramento della perdita standard di entropia incrociata, ampiamente utilizzata per la classificazione delle immagini. L'innovazione chiave, introdotta nell'articolo su RetinaNet dai ricercatori di Meta AI (ex Facebook AI Research), è un fattore di modulazione che riduce il contributo di perdita degli esempi ben classificati. In questo modo, gli aggiornamenti di backpropagation del modello sono guidati principalmente dagli errori degli esempi difficili da classificare. La funzione include un "parametro di focalizzazione" che controlla il tasso di riduzione della perdita per gli esempi facili. Dando priorità a questi esempi difficili, l'algoritmo di ottimizzazione può apportare aggiustamenti più significativi ai pesi del modello, ottenendo prestazioni complessive migliori, soprattutto per i rilevatori di oggetti a una fase come RetinaNet e alcune versioni di YOLO. È possibile esplorare un'implementazione tecnica di Focal Loss nella documentazione di Ultralytics.

Applicazioni nel mondo reale

La perdita focale è fondamentale per l'addestramento di modelli robusti in vari scenari del mondo reale in cui lo squilibrio tra le classi rappresenta una sfida significativa.

  • Guida autonoma: Nello sviluppo di veicoli autonomi, i modelli devono rilevare un'ampia gamma di oggetti, alcuni dei quali appaiono di rado, come pedoni, ciclisti o segnali stradali distanti. La maggior parte dell'immagine potrebbe essere costituita dalla strada o dal cielo (sfondo). La perdita focale aiuta il modello a prestare maggiore attenzione a questi oggetti critici ma rari, garantendo che non vengano persi. Si tratta di un aspetto cruciale per la creazione di soluzioni di intelligenza artificiale sicure e affidabili nel settore automobilistico. Una panoramica delle sfide in questo settore è fornita da istituzioni come la Carnegie Mellon University.
  • Diagnosi medica: nell'analisi delle immagini mediche, i modelli vengono addestrati per rilevare anomalie come tumori o lesioni dalle scansioni. Spesso la regione anomala è molto piccola rispetto al tessuto sano circostante. La perdita focale consente al modello di concentrarsi sull'identificazione di queste aree sottili e difficili da rilevare, che altrimenti potrebbero essere ignorate a favore di una classe di sfondo troppo ampia. Questo porta a strumenti diagnostici più accurati e affidabili, come si è visto nelle applicazioni per il rilevamento di tumori su set di dati medici.

Confronto con altre funzioni di perdita

È importante distinguere la perdita focale da altre funzioni di perdita correlate utilizzate nella visione artificiale.

  • Perdita di antropia incrociata: Focal Loss è una modifica diretta di Cross-Entropy Loss. Mentre la Cross-Entropy tratta tutti gli esempi allo stesso modo, la Perdita focale introduce un termine per ridurre l'impatto degli esempi facili, rendendola più adatta a dati di allenamento sbilanciati. Per una comprensione più approfondita della Cross-Entropy, le note di Stanford CS231n offrono una buona spiegazione.
  • Varifocal Loss: è una funzione di perdita più recente che si basa sui principi di Focal Loss. Mentre Focal Loss tratta tutti gli esempi positivi allo stesso modo, Varifocal Loss li pondera in base al loro punteggio di classificazione, dando più peso agli esempi positivi di alta qualità. Per saperne di più sulla sua implementazione specifica, consultare il riferimento alla funzione di perdita di Ultralytics.
  • Perdite basate su IoU: Funzioni come Generalized Intersection over Union (IoU), DIoU e CIoU sono utilizzate per misurare l'accuratezza della localizzazione di un rettangolo di selezione previsto. Esse si occupano di dove si trova un oggetto, mentre la perdita focale si occupa di cosa è un oggetto (la sua classificazione). Nei rilevatori moderni, come Ultralytics YOLOv8, la perdita di classificazione (come la perdita focale) e la perdita di regressione (come la perdita basata su IoU) vengono utilizzate insieme per addestrare il modello.

Unisciti alla community di Ultralytics

Entra nel futuro dell'AI. Connettiti, collabora e cresci con innovatori globali

Iscriviti ora
Link copiato negli appunti