Glossario

Pesi del modello

Scopri l'importanza dei pesi dei modelli nell'apprendimento automatico, il loro ruolo nelle previsioni e come Ultralytics YOLO semplifica il loro utilizzo per le attività di AI.

I pesi del modello sono i parametri fondamentali che un modello di apprendimento automatico (ML) apprende durante il processo di formazione. Questi valori numerici rappresentano la conoscenza acquisita dai dati di addestramento e sono fondamentali per il modo in cui il modello fa previsioni o prende decisioni su nuovi dati non visti. In sostanza, i pesi determinano la forza e l'importanza delle connessioni all'interno del modello, come ad esempio tra i neuroni di una rete neurale (NN). Sono le "manopole" regolabili che catturano i modelli appresi dal modello.

Capire i pesi del modello

Immagina una macchina complessa con molte manopole regolabili; i pesi del modello agiscono come queste manopole. Durante il processo di addestramento del modello, gli vengono mostrati degli esempi da un set di dati e fa delle previsioni iniziali. La differenza tra queste previsioni e le risposte effettivamente corrette (verità di base) viene misurata da una funzione di perdita. Un algoritmo di ottimizzazione, come Stochastic Gradient Descent (SGD) o Adam, regola sistematicamente i pesi utilizzando tecniche come la retropropagazione per minimizzare la perdita. Questo processo viene ripetuto per molte iterazioni, o epoche, affinando gradualmente i pesi.

Inizialmente, i pesi sono spesso impostati su piccoli valori casuali, ma con l'addestramento convergono verso valori che catturano i modelli sottostanti nei dati. È fondamentale distinguere i pesi dagli iperparametri, come il tasso di apprendimento o la dimensione del batch. Gli iperparametri sono impostazioni di configurazione impostate prima dell' inizio della formazione e guidano il processo di apprendimento stesso, mentre i pesi sono parametri appresi durante la formazione. Le bias, un altro tipo di parametro appreso che spesso si trova accanto ai pesi nelle NN, rappresentano il livello di attivazione di base di un neurone, indipendente dai suoi input. Mentre i pesi scalano l'influenza degli ingressi, le polarizzazioni spostano l'uscita della funzione di attivazione.

L'importanza dei pesi del modello

I pesi del modello sono fondamentali perché codificano direttamente i modelli e le relazioni apprese dai dati di formazione. Pesi ben ottimizzati consentono a un modello di ottenere una buona generalizzazione, facendo previsioni accurate su dati che non ha mai incontrato prima. La qualità dei pesi influisce direttamente sulle metriche di performance del modello, come l'accuratezza, la precisione, il richiamo e la robustezza, spesso riassunte in metriche come mAP. Pesi mal addestrati, spesso dovuti a problemi come dati insufficienti, tempo di addestramento inadeguato o overfitting (in cui il modello apprende troppo bene i dati di addestramento, compreso il rumore), portano a previsioni inaffidabili su nuovi dati.

In molte applicazioni moderne di intelligenza artificiale, soprattutto nella computer vision (CV), i modelli sono spesso pre-addestrati su grandi set di dati generali come ImageNet o COCO. I pesi risultanti catturano ampie caratteristiche visive applicabili a molti compiti. Questi pesi pre-addestrati, come quelli disponibili per i modelliUltralytics YOLO , possono essere utilizzati direttamente per l'inferenza o come punto di partenza per la messa a punto su un compito specifico o un set di dati personalizzato. Questa tecnica, nota come apprendimento per trasferimento, accelera notevolmente la formazione e spesso porta a prestazioni migliori, soprattutto quando i dati personalizzati sono limitati. Piattaforme come Ultralytics HUB consentono agli utenti di gestire i dataset, addestrare i modelli e gestire in modo efficiente i pesi dei modelli risultanti.

Applicazioni del mondo reale

I pesi dei modelli sono il motore di innumerevoli applicazioni di intelligenza artificiale:

Rilevamento degli oggetti nei veicoli autonomi: Modelli come Ultralytics YOLOv8 utilizzano i pesi appresi per identificare pedoni, altri veicoli e segnali stradali in tempo reale, consentendo di prendere decisioni sulla navigazione e sulla sicurezza. I pesi codificano le caratteristiche visive necessarie per distinguere questi oggetti in varie condizioni. La tecnologia di Waymo si basa molto su questi modelli sofisticati.
Analisi di immagini mediche per il rilevamento di malattie: Nel settore sanitario, i pesi dei modelli addestrati su dataset come quello dei tumori cerebrali consentono ai sistemi di intelligenza artificiale di rilevare anomalie come tumori o lesioni nelle scansioni (radiografie, TAC, risonanze magnetiche) con un'elevata precisione, aiutando i radiologi nella diagnosi. Organizzazioni come la Radiological Society of North America (RSNA) esplorano ampiamente il ruolo dell'IA.

Gestione e monitoraggio dei pesi

Man mano che i modelli diventano più complessi, la gestione dei loro pesi e degli esperimenti che li producono diventa fondamentale per la riproducibilità e la collaborazione. Strumenti come Weights & Biases (W&B) forniscono una piattaforma specifica per gli MLOps, consentendo ai team di tenere traccia degli iperparametri, delle metriche, delle versioni del codice e dei pesi dei modelli risultanti per ogni esperimento. È importante notare che la piattaformaWeights & Biases" si distingue dai concetti di "pesi" e "biases" come parametri di una rete neurale; la piattaforma aiuta a gestire il processo di ricerca dei weights and biases ottimali. Per saperne di più sull'integrazione di Ultralytics con W&B, consulta la documentazione. Una gestione efficiente è fondamentale per attività che vanno dalla messa a punto degli iperparametri all'implementazione dei modelli utilizzando framework come PyTorch o TensorFlow.

Pesi del modello

Addestra i modelli YOLO semplicemente
con Ultralytics HUB

Una soluzione flessibile di licenze aziendali per alimentare la tua innovazione

Addestra i modelli di intelligenza artificiale in pochi secondi con Ultralytics YOLO

Addestra i modelli di YOLO in modo semplice con Ultralytics HUB

Capire i pesi del modello

L'importanza dei pesi del modello

Applicazioni del mondo reale

Gestione e monitoraggio dei pesi

Leggi altri blog

Unisciti alla comunità di Ultralytics

Pesi del modello

Addestra i modelli YOLO semplicementecon Ultralytics HUB

Una soluzione flessibile di licenze aziendali per alimentare la tua innovazione

Addestra i modelli di intelligenza artificiale in pochi secondi con Ultralytics YOLO

Addestra i modelli di YOLO in modo semplice con Ultralytics HUB

Capire i pesi del modello

L'importanza dei pesi del modello

Applicazioni del mondo reale

Gestione e monitoraggio dei pesi

Leggi altri blog

Unisciti alla comunità di Ultralytics

Addestra i modelli YOLO semplicemente
con Ultralytics HUB