Glossario

Funzione di perdita

Scoprite il ruolo delle funzioni di perdita nell'apprendimento automatico, i loro tipi, la loro importanza e le applicazioni reali dell'IA come YOLO e il rilevamento di oggetti.

Una funzione di perdita, nota anche come funzione di costo o funzione obiettivo, è un componente fondamentale dell'apprendimento automatico (ML) e del deep learning (DL). Quantifica la differenza - o "perdita" - tra l'output previsto da un modello e l'etichetta effettiva della verità a terra per un dato dato. Il valore calcolato dalla funzione di perdita serve a misurare le scarse prestazioni del modello. L'obiettivo principale durante il processo di addestramento del modello è quello di minimizzare questo valore, migliorando così l'accuratezza e le prestazioni del modello.

Come funzionano le funzioni di perdita

Durante ogni iterazione dell'addestramento, il modello elabora un gruppo di dati di addestramento e fa delle previsioni. La funzione di perdita confronta poi queste previsioni con le etichette reali. Un valore di perdita più alto indica una maggiore discrepanza e una maggiore necessità di correzione, mentre un valore di perdita più basso indica che le previsioni del modello sono più vicine ai valori reali.

Questo valore di perdita è fondamentale perché fornisce il segnale necessario per l'apprendimento del modello. Questo segnale viene utilizzato da un algoritmo di ottimizzazione, come Stochastic Gradient Descent (SGD), per regolare i parametri interni del modello, o i pesi del modello. Il processo di retropropagazione calcola il gradiente della funzione di perdita rispetto a questi pesi, indicando la direzione in cui i pesi devono essere regolati per ridurre la perdita. Questo processo iterativo di calcolo della perdita e di aggiornamento dei pesi consente al modello di convergere gradualmente verso uno stato in cui è in grado di fare previsioni molto accurate.

Tipi comuni di funzioni di perdita

La scelta della funzione di perdita dipende in larga misura dal compito specifico che il modello è destinato a risolvere. Problemi diversi richiedono modi diversi di misurare l'errore. Alcuni tipi comuni includono:

  • Errore quadratico medio (MSE): Una funzione di perdita popolare per le attività di regressione, in cui l'obiettivo è prevedere un valore numerico continuo. Calcola la media dei quadrati delle differenze tra i valori previsti e quelli reali.
  • Perdita di entropia incrociata: ampiamente utilizzata per le attività di classificazione delle immagini. Misura le prestazioni di un modello di classificazione il cui output è un valore di probabilità compreso tra 0 e 1. È efficace quando si addestrano modelli per distinguere tra più classi, come nel caso della classificazione di immagini nel dataset ImageNet.
  • Intersection over Union (IoU) Loss: le varianti di IoU sono essenziali per le attività di rilevamento degli oggetti. Queste funzioni di perdita, come GIoU, DIoU e CIoU, misurano la discrepanza tra il rettangolo di selezione previsto e il rettangolo di riferimento. Sono parte integrante dell'addestramento di rilevatori di oggetti accurati come Ultralytics YOLO11.
  • Perdita di dadi: comunemente utilizzata nella segmentazione delle immagini, soprattutto nell'analisi delle immagini mediche, per misurare la sovrapposizione tra le maschere di segmentazione previste e quelle effettive. È particolarmente utile per gestire lo squilibrio tra le classi.

Applicazioni del mondo reale

Le funzioni di perdita sono al centro dell'addestramento di quasi tutti i modelli di deep learning.

  1. Veicoli autonomi: Nello sviluppo di veicoli autonomi, i modelli di rilevamento degli oggetti vengono addestrati per identificare pedoni, altre auto e segnali stradali. Durante l'addestramento, una funzione di perdita combina più componenti: una parte calcola l'errore nella classificazione di ogni oggetto (ad esempio, auto o pedone), mentre un'altra parte, spesso una perdita basata sull'IoU, calcola l'errore nella localizzazione del rettangolo di gioco dell'oggetto. La minimizzazione di questa perdita combinata aiuta a creare modelli robusti per una navigazione sicura, una componente chiave dell'intelligenza artificiale nelle soluzioni automobilistiche.
  2. Diagnosi medica: nell'IA in ambito sanitario, modelli come U-Net vengono addestrati per la segmentazione semantica per identificare i tumori nelle scansioni mediche. Una funzione di perdita come Dice Loss o una combinazione di Cross-Entropy e Dice Loss viene utilizzata per confrontare la maschera tumorale prevista dal modello con la maschera annotata da un radiologo. Minimizzando questa perdita su un set di immagini mediche, il modello impara a delineare con precisione le regioni patologiche, favorendo diagnosi più rapide e precise.

Relazione con altri concetti chiave

È importante distinguere le funzioni di perdita da altri concetti correlati nel ML.

  • Funzione di perdita e metrica di valutazione: Si tratta di una distinzione cruciale. Le funzioni di perdita vengono utilizzate durante l'addestramento per guidare il processo di ottimizzazione. Devono essere differenziabili per consentire l'apprendimento basato sul gradiente. Al contrario, le metriche di valutazione come l'accuratezza, la precisione, il richiamo e la precisione media (mAP) vengono utilizzate dopo l'addestramento (su dati di convalida o di test) per valutare le prestazioni reali di un modello. Sebbene una perdita minore sia generalmente correlata a punteggi migliori, le metriche hanno scopi diversi. Per saperne di più sulle metriche delle prestazioni, consultate la nostra guida.
  • Funzione di perdita e algoritmo di ottimizzazione: La funzione di perdita definisce l'obiettivo, ossia ciò che deve essere minimizzato. L'algoritmo di ottimizzazione, come l'ottimizzatore Adam, definisce il meccanismo che permette di minimizzare la perdita aggiornando i pesi del modello in base ai gradienti calcolati e al tasso di apprendimento.
  • Overfitting e Underfitting: Il monitoraggio della perdita su entrambi i set di addestramento e di validazione è fondamentale per diagnosticare questi problemi comuni. È probabile che si verifichi un overfitting se la perdita di addestramento continua a diminuire mentre la perdita di validazione inizia ad aumentare. L'underfitting è indicato da valori di perdita elevati su entrambi i set. Questi aspetti sono discussi in guide come i Suggerimenti per l'addestramento dei modelli.

La comprensione delle funzioni di perdita è essenziale per chiunque sia coinvolto nella costruzione e nell'addestramento di modelli di intelligenza artificiale. Piattaforme come Ultralytics HUB eliminano gran parte di questa complessità, gestendo automaticamente l'implementazione e l'ottimizzazione delle funzioni di perdita, rendendo più accessibile la costruzione di modelli avanzati di computer vision (CV).

Unitevi alla comunità di Ultralytics

Entrate a far parte del futuro dell'IA. Connettetevi, collaborate e crescete con gli innovatori globali.

Iscriviti ora
Link copiato negli appunti