Yolo Vision Shenzhen
Shenzhen
Iscriviti ora
Glossario

Pesi del modello

Scoprite l'importanza dei pesi del modello nell'apprendimento automatico, il loro ruolo nelle previsioni e come Ultralytics YOLO ne semplifica l'uso per le attività di IA.

I pesi del modello sono i parametri fondamentali e apprendibili all'interno di una rete rete neurale che trasformano i dati in ingresso in predizioni significative. Funzionando in modo simile alla forza delle sinapsi in un cervello biologico, questi valori numerici determinano l'influenza di una specifica caratteristica in ingresso sull'uscita della rete. valori numerici determinano l'influenza che una specifica caratteristica di input ha sull'output della rete. Quando un modello elabora informazioni, come un'immagine o un testo, i dati in ingresso vengono moltiplicati per questi pesi strato per strato. La combinazione finale combinazione finale di questi segnali ponderati produce il risultato, sia che si tratti di classificazione di immagini, di traduzione linguistica o di di un'immagine, la traduzione di una lingua o l'identificazione di oggetti in un flusso video.

Come si apprendono i pesi del modello

I pesi non sono statici, ma valori dinamici affinati durante il processo di formazione. processo di addestramento. Inizialmente, un modello parte con pesi pesi casuali, il che significa che le sue previsioni sono essenzialmente delle congetture. Attraverso un ciclo noto come apprendimento supervisionato, il modello confronta le sue predizioni rispetto a un set di dati di addestramento etichettati. A formula matematica chiamata funzione di funzione di perdita calcola l'errore, la differenza tra la previsione e la verità effettiva.

Per ridurre al minimo questo errore, il modello impiega un algoritmo di algoritmo di ottimizzazione, come Stochastic Gradient Descent (SGD) o Adam. Questo algoritmo calcola i gradienti tramite backpropagation per determinare esattamente come ogni peso, aumentandolo o diminuendolo, per ridurre l'errore nell'iterazione successiva. Questo ciclo si ripete per molte epoche fino a quando i pesi non convergono a uno stato ottimale in cui il modello stato ottimale in cui il modello raggiunge un'elevata accuratezza.

Differenziare i concetti chiave

Per comprendere appieno i pesi del modello, è utile distinguerli dai termini correlati nell'apprendimento automatico. apprendimento automatico:

  • Le biasie: Mentre i pesi controllano la ripidità o la scala della trasformazione, le polarizzazioni consentono di spostare la funzione di attivazione verso destra o verso sinistra. di attivazione. Insieme, i weights and biases consentono alla rete di adattarsi a modelli di dati complessi e non lineari.
  • Iperparametri: I pesi vengono appresi dai dati, mentre gli iperparametri sono impostazioni strutturali configurate prima dell'inizio dell'addestramento. prima dell' inizio dell'addestramento. Esempi sono il tasso di apprendimento, dimensione del batch e il numero di livelli della rete.
  • Modello di architettura: L'architettura agisce come il progetto o lo scheletro della rete (ad esempio, ResNet o un Transformer), definendo il modo in cui i neuroni si connettono. neuroni si connettono. I pesi sono i valori specifici memorizzati all'interno della struttura.

Il potere dell'apprendimento per trasferimento

L'addestramento di un modello ex novo richiede enormi insiemi di dati e notevoli risorse risorse computazionali. Per risolvere questo problema, gli sviluppatori utilizzano spesso pesi pre-addestrati. Si tratta di prendere un modello come YOLO11che ha già appreso le rappresentazioni delle caratteristiche rappresentazioni di caratteristiche ricche da un grande set di dati come COCOe applicarlo a un nuovo problema. problema.

Questa tecnica, nota come apprendimento per trasferimento, consente di perfezionare il modello su un set di dati più piccolo e personalizzato, dataset personalizzato. I pesi pre-addestrati forniscono un "vantaggio", consentendo al modello di riconoscere immediatamente bordi, texture e forme, consentendo un addestramento più rapido e prestazioni migliori.

Il seguente snippet Python mostra come caricare pesi specifici pre-addestrati in un modello YOLO11 per il rilevamento immediato di oggetti. rilevamento immediato degli oggetti.

from ultralytics import YOLO

# Load the YOLO11 model with pre-trained weights (learned on COCO)
model = YOLO("yolo11n.pt")

# Run inference on an image using the loaded weights
# The weights determine the model's ability to recognize the bus
results = model("https://ultralytics.com/images/bus.jpg")

# Display the resulting bounding boxes and classes
results[0].show()

Applicazioni nel mondo reale

L'utilità pratica dei pesi ottimizzati dei modelli è evidente in diversi settori in cui vengono impiegate le soluzioni di soluzioni di intelligenza artificiale:

  • L'intelligenza artificiale nell'assistenza sanitaria: I radiologi utilizzano modelli con pesi affinati sulle immagini mediche per assistere nella diagnosi. Ad esempio, un modello può identificare i tumori cerebrali nelle scansioni MRI. I pesi di questo pesi di questo modello specifico hanno imparato a distinguere le sottili differenze testuali tra tessuto sano e anomalie, fornendo un secondo parere che aumenta la diagnosi. e le anomalie, fornendo un secondo parere che aumenta la sicurezza diagnostica.
  • Sistemi di vendita al dettaglio intelligenti: I rivenditori utilizzano la computer vision per automatizzare i processi di cassa. Un sistema di telecamere dotato di pesi modello addestrati sulla confezione del prodotto può riconoscere istantaneamente riconoscere istantaneamente gli articoli posizionati su un bancone. Questa applicazione si basa sulla capacità dei pesi di mappare gli input visivi, come il colore e il logo di una scatola di cereali, e di identificare la SKU corretta del prodotto. di una scatola di cereali, come il colore e il logo, al corretto codice prodotto per la gestione dell'inventario. gestione dell'inventario.

Il futuro dei pesi dei modelli

Con il progredire della ricerca, il modo in cui vengono gestiti i pesi continua a evolversi. Tecniche come quantizzazione del modello riducono la precisione dei dei pesi (ad esempio, da un float a 32 bit a un intero a 8 bit) per ridurre le dimensioni del file e accelerare l'inferenza sui dispositivi edge, senza sacrificare in modo significativo la precisione. dispositivi edge senza sacrificare significativamente l'accuratezza. Inoltre, le architetture di prossima realizzazione, come YOLO26, mirano a modelli più efficienti, assicurando che i pesi appresi forniscano le massime prestazioni possibili per parametro. prestazioni per parametro.

Anche la gestione efficiente di questi file è fondamentale. Piattaforme come la Ultralytics Platform consentono ai team di versionare, track e distribuire i pesi dei modelli senza soluzione di continuità, assicurando che la versione più performante di un modello sia sempre quella in produzione. senza soluzione di continuità, garantendo che la versione più performante di un modello sia sempre quella in produzione.

Unitevi alla comunità di Ultralytics

Entra nel futuro dell'AI. Connettiti, collabora e cresci con innovatori globali

Iscriviti ora