Sintonizzati su YOLO Vision 2025!
25 settembre 2025
10:00 — 18:00 BST
Evento ibrido
Yolo Vision 2024
Glossario

Pesi del modello

Scopri l'importanza dei pesi del modello nel machine learning, il loro ruolo nelle previsioni e come Ultralytics YOLO semplifica il loro utilizzo per le attività di IA.

I pesi del modello sono i parametri numerici all'interno di una rete neurale che vengono regolati durante il processo di addestramento. Questi valori rappresentano essenzialmente la conoscenza appresa di un modello. Pensateli come i coefficienti in un'equazione molto complessa; regolando questi coefficienti, il modello impara a mappare i dati di input, come un'immagine, a un output desiderato, come un bounding box attorno a un oggetto. La qualità dei pesi di un modello determina direttamente le sue prestazioni su un determinato compito, come la classificazione delle immagini o il rilevamento degli oggetti.

Come vengono determinati i pesi

I pesi del modello non sono impostati manualmente, ma vengono "appresi" dai dati. Il processo inizia con l'inizializzazione dei pesi a piccoli numeri casuali. Durante l'addestramento, il modello fa previsioni sui dati di addestramento e una funzione di perdita calcola quanto sono errate queste previsioni. Questo segnale di errore viene quindi utilizzato in un processo chiamato backpropagation per calcolare il gradiente della perdita rispetto a ciascun peso. Un algoritmo di ottimizzazione, come lo Stochastic Gradient Descent (SGD), regola quindi i pesi nella direzione opposta del gradiente per minimizzare l'errore. Questo ciclo viene ripetuto per molte epoche fino a quando le prestazioni del modello su un dataset di validazione separato smettono di migliorare, un segno che ha appreso i modelli nei dati.

L'importanza dei pesi pre-addestrati

L'addestramento di un modello all'avanguardia da zero richiede immense risorse computazionali e set di dati massicci. Per superare questo problema, la comunità della computer vision utilizza ampiamente i pesi pre-addestrati. Questo implica l'utilizzo di un modello, come un modello Ultralytics YOLO, che è già stato addestrato su un ampio set di dati generico come COCO. Questi pesi fungono da eccellente punto di partenza per un nuovo compito specifico attraverso un processo chiamato transfer learning. Iniziando con pesi pre-addestrati, è possibile ottenere una maggiore precisione con meno dati e tempi di addestramento più brevi attraverso un processo noto come fine-tuning.

Applicazioni nel mondo reale

  • Analisi di immagini mediche: Uno sviluppatore può prendere un modello YOLOv8 con i suoi pesi pre-addestrati e metterlo a punto su un dataset personalizzato di scansioni di tumori cerebrali. Il modello risultante ha pesi specificamente ottimizzati per identificare i modelli sottili dei tumori, assistendo i radiologi nella diagnosi. Questa è un'applicazione chiave dell'AI in ambito sanitario.
  • Gestione delle Scorte nel Retail: Un'azienda retail può utilizzare un modello per monitorare gli scaffali e contare i prodotti. Un modello di object detection viene messo a punto su immagini dei prodotti del negozio. I pesi finali consentono al modello di rilevare e contare accuratamente articoli specifici per il tracciamento automatizzato dell'inventario.

Pesi vs. concetti correlati

È importante distinguere i pesi del modello da altri termini correlati nel machine learning:

  • Iperparametri: A differenza dei pesi, che vengono appresi, gli iperparametri vengono configurati prima dell'inizio del training. Gli esempi includono il learning rate, la dimensione del batch e la scelta dell'ottimizzatore. Il processo di ricerca della migliore configurazione degli iperparametri è noto come ottimizzazione degli iperparametri.
  • Bias: Pesi e bias sono entrambi parametri appresi. Tuttavia, i pesi scalano l'output di un neurone, mentre un termine di bias lo sposta. Insieme, danno a una rete neurale la flessibilità di adattarsi ai dati.
  • Architettura del Modello: L'architettura (ad esempio, il backbone o l'detection head) è il progetto del modello: definisce i layer e come sono connessi. I pesi sono i valori all'interno di quella struttura. La stessa architettura può avere innumerevoli set di pesi diversi a seconda di come è stata addestrata. Puoi esplorare diversi confronti tra modelli per vedere come variano le architetture.

Gestione e tracciamento dei pesi

Man mano che i modelli diventano più complessi, la gestione dei loro pesi e degli esperimenti che li producono diventa fondamentale per la riproducibilità e la collaborazione. Strumenti come Weights & Biases (W&B) forniscono una piattaforma specifica per MLOps, consentendo ai team di tracciare iperparametri, metriche, versioni del codice e i pesi del modello risultanti per ogni esperimento. È importante notare che "Weights & Biases", la piattaforma, è distinta dai concetti di "pesi" e "bias" come parametri all'interno di una rete neurale; la piattaforma aiuta a gestire il processo di ricerca di pesi e bias ottimali. Puoi saperne di più sull'integrazione di Ultralytics con W&B nella documentazione. Una gestione efficiente è fondamentale per attività che vanno dalla regolazione degli iperparametri al deployment del modello utilizzando framework come PyTorch o TensorFlow. Piattaforme come Ultralytics HUB forniscono anche soluzioni integrate per la gestione dell'intero ciclo di vita del modello.

Unisciti alla community di Ultralytics

Entra nel futuro dell'AI. Connettiti, collabora e cresci con innovatori globali

Iscriviti ora
Link copiato negli appunti