Ottimizza i modelli di machine learning come Ultralytics YOLO per attività specifiche. Scopri metodi, applicazioni e best practice qui!
Il fine-tuning è una tecnica fondamentale nel machine learning (ML) che consiste nel prendere un modello pre-addestrato su un set di dati ampio e generale e addestrarlo ulteriormente su un set di dati più piccolo e specializzato. Questo processo, una forma di transfer learning, adatta la conoscenza appresa dal modello per eccellere in un compito specifico senza dover addestrare un modello da zero. Iniziando con un potente modello di base, gli sviluppatori possono ottenere elevate prestazioni con una quantità significativamente inferiore di dati e risorse computazionali, un concetto esplorato da istituzioni come lo Stanford AI Lab.
Il processo inizia con un modello i cui pesi sono già stati ottimizzati su un ampio set di dati come ImageNet per la visione o un enorme corpus di testo per i Large Language Models (LLM). Questo modello pre-addestrato comprende già le caratteristiche generali, come bordi e texture nelle immagini o grammatica e semantica nel testo. Il fine-tuning continua quindi il processo di addestramento, in genere utilizzando un learning rate inferiore, su un set di dati personalizzato su misura per l'applicazione di destinazione. Questo adatta i parametri del modello per specializzarsi nelle specifiche sfumature della nuova attività. Framework come PyTorch e TensorFlow forniscono ampi strumenti per l'implementazione di flussi di lavoro di fine-tuning.
Il fine-tuning è ampiamente utilizzato in computer vision (CV) e Natural Language Processing (NLP).
È importante distinguere il fine-tuning da altre tecniche di adattamento del modello:
Ultralytics semplifica il processo di fine-tuning dei suoi modelli YOLO all'avanguardia per applicazioni personalizzate. Gli utenti possono facilmente caricare i pesi pre-addestrati e iniziare l'addestramento sui propri dataset per attività come la classificazione delle immagini, il rilevamento o la segmentazione. La piattaforma Ultralytics HUB semplifica ulteriormente questo flusso di lavoro, fornendo una soluzione integrata per la gestione dei dataset, l'addestramento dei modelli e l'eventuale deployment. Per ottenere le migliori prestazioni, il fine-tuning viene spesso combinato con un'attenta ottimizzazione degli iperparametri.