Scopri YOLO26: vision AI di prossima generazione.
Ultralytics
Torna al glossario Ultralytics

SwiGLU

Esplora SwiGLU, l'avanzata funzione di attivazione utilizzata negli LLM e in Ultralytics YOLO26. Scopri come il suo meccanismo di gating migliori l'addestramento e l'efficienza delle reti neurali.

SwiGLU (Swish Gated Linear Unit) è una funzione di attivazione avanzata e un blocco architettonico di rete neurale che potenzia la tradizionale Feed-Forward Network (FFN) utilizzata nel deep machine learning. Combinando le proprietà lisce e non monotone della funzione di attivazione Swish con un meccanismo Gated Linear Unit (GLU), SwiGLU fornisce un routing delle caratteristiche dinamico e dipendente dai dati. Applicando una proiezione lineare a un input, facendo passare un ramo attraverso un'attivazione Swish e moltiplicandolo elemento per elemento con un altro ramo lineare, la rete ottiene una superiore potenza espressiva. Ciò consente alle moderne architetture di intelligenza artificiale di catturare dipendenze complesse e non lineari in modo molto più efficace rispetto ai layer statici standard utilizzati nei modelli di deep learning meno recenti.

Link to this sectionCome funziona SwiGLU#

A differenza delle tradizionali reti feed-forward che mappano semplicemente un input in una dimensione superiore, applicano una non linearità di base e lo riproiettano verso il basso, SwiGLU introduce un meccanismo di gating moltiplicativo. L'input è suddiviso in due proiezioni parametrizzate: un "gate" e un "valore". Il ramo del gate viene attivato utilizzando la funzione SiLU / Swish, che preserva i piccoli valori negativi e garantisce derivate fluide e diverse da zero quasi ovunque. Questo gate attivato viene quindi moltiplicato elemento per elemento con il ramo del valore. Questo filtraggio dinamico consente alla rete neurale di controllare in modo intelligente il flusso di informazioni, evitando i problemi di "neurone morto" comuni nelle architetture più vecchie e stabilizzando il segnale del gradiente durante il processo di addestramento del modello, un concetto ampiamente studiato nei meccanismi di attenzione.

Link to this sectionDifferenziare SwiGLU da altre funzioni di attivazione#

Mentre le funzioni di attivazione standard come ReLU utilizzano una soglia fissa per tagliare i valori negativi a zero, SwiGLU regola dinamicamente le attivazioni in base ai dati di input stessi. Rispetto a GELU, che pondera gli input in base alla loro probabilità secondo una distribuzione gaussiana, SwiGLU sfrutta specificamente layer lineari parametrizzati per imparare come gestire il gating delle informazioni. In sostanza, SwiGLU non è solo un calcolo matematico elemento per elemento; funge da componente strutturale completo che spesso sostituisce l'intero meccanismo del layer nascosto all'interno di un blocco Transformer. Per un confronto esteso delle proprietà matematiche, i ricercatori fanno spesso riferimento a complete guide alle funzioni di attivazione.

Link to this sectionApplicazioni nel mondo reale#

Grazie alla sua efficienza computazionale e ai significativi miglioramenti delle prestazioni, SwiGLU è diventato un componente fondamentale nei moderni sistemi di intelligenza artificiale.

Link to this sectionImplementazione di SwiGLU in PyTorch#

Per gli sviluppatori che costruiscono reti personalizzate o adattano modelli di visione per dispositivi edge utilizzando la Piattaforma Ultralytics, implementare SwiGLU tramite la documentazione di PyTorch è semplice. (In alternativa, gli sviluppatori in altri ecosistemi potrebbero utilizzare implementazioni TensorFlow). Il seguente conciso frammento di codice Python dimostra un modulo SwiGLU di base utilizzando la funzione integrata F.silu di PyTorch:

import torch
import torch.nn as nn
import torch.nn.functional as F


class SwiGLU(nn.Module):
    def __init__(self, in_features, hidden_features):
        super().__init__()
        # SwiGLU requires two projections: one for the gate, one for the value
        self.gate_proj = nn.Linear(in_features, hidden_features)
        self.value_proj = nn.Linear(in_features, hidden_features)
        self.out_proj = nn.Linear(hidden_features, in_features)

    def forward(self, x):
        # Element-wise multiplication of the SiLU-activated gate and the linear value
        hidden = F.silu(self.gate_proj(x)) * self.value_proj(x)
        return self.out_proj(hidden)


# Example usage with a dummy input tensor
module = SwiGLU(in_features=512, hidden_features=1365)
output = module(torch.randn(1, 512))

Questo approccio strutturale ai blocchi di attivazione garantisce che le architetture neurali all'avanguardia estraggano rappresentazioni più ricche da complessi dati di addestramento, sia che vengano applicati al Natural Language Processing (NLP) o all'analisi spaziale in tempo reale. Per una comprensione più profonda della costruzione e dell'accelerazione di modelli efficienti, gli sviluppatori spesso fanno riferimento alla ricerca fondamentale sulle varianti originali GLU su arXiv, ai repository open-source di Meta e alla documentazione sull'ottimizzazione di PyTorch per massimizzare il throughput dell'hardware.

Explore solutions

Real-time AI tailored to your operation

IA in agricoltura

Porta l'IA visiva nell'agricoltura intelligente con i modelli Ultralytics YOLO. Potenzia il monitoraggio delle colture, il tracciamento del bestiame e l'agricoltura di precisione per raccolti più elevati e intelligenti.

Scopri di più
Real-time AI that works with your operation

IA nel settore automobilistico

Applica la computer vision nel settore automobilistico con i modelli Ultralytics YOLO. La Vision AI migliora la sicurezza stradale, l'assistenza alla guida e l'automazione dei veicoli per strade più intelligenti.

Scopri di più
Real-time AI that works with your team

IA nell'assistenza sanitaria

Sviluppa soluzioni sanitarie con i modelli Ultralytics YOLO. L'IA di visione nell'assistenza sanitaria potenzia l'imaging medico, la diagnostica più intelligente e il monitoraggio dei pazienti.

Scopri di più
Real-time AI that works with your team

AI nel settore retail

Reimmagina il retail con i modelli Ultralytics YOLO. La Vision AI potenzia il tracciamento dell'inventario, il monitoraggio degli scaffali, la gestione delle code e offre insight più intelligenti sui clienti.

Scopri di più
Real-time AI that works with your team

L'AI nella robotica

Potenzia macchine più intelligenti con i modelli Ultralytics YOLO. La Vision AI nella robotica guida la navigazione autonoma, la percezione, il tracciamento degli oggetti e il controllo in tempo reale.

Scopri di più
Real-time AI that works with your team

IA nella produzione

Ottimizza la produzione con i modelli Ultralytics YOLO. La Vision AI potenzia il controllo qualità, il rilevamento dei difetti, la conformità ai DPI e l'automazione della catena di montaggio.

Scopri di più
Real-time AI that works with your team

IA nella logistica

Semplifica la logistica con i modelli Ultralytics YOLO. L'IA basata sulla visione artificiale consente l'ispezione dei pacchi, lo smistamento, il tracciamento dei veicoli e il monitoraggio in tempo reale della sicurezza nei magazzini.

Scopri di più
Real-time AI tailored to your operation

IA in agricoltura

Porta l'IA visiva nell'agricoltura intelligente con i modelli Ultralytics YOLO. Potenzia il monitoraggio delle colture, il tracciamento del bestiame e l'agricoltura di precisione per raccolti più elevati e intelligenti.

Scopri di più
Real-time AI that works with your operation

IA nel settore automobilistico

Applica la computer vision nel settore automobilistico con i modelli Ultralytics YOLO. La Vision AI migliora la sicurezza stradale, l'assistenza alla guida e l'automazione dei veicoli per strade più intelligenti.

Scopri di più
Real-time AI that works with your team

IA nell'assistenza sanitaria

Sviluppa soluzioni sanitarie con i modelli Ultralytics YOLO. L'IA di visione nell'assistenza sanitaria potenzia l'imaging medico, la diagnostica più intelligente e il monitoraggio dei pazienti.

Scopri di più
Real-time AI that works with your team

AI nel settore retail

Reimmagina il retail con i modelli Ultralytics YOLO. La Vision AI potenzia il tracciamento dell'inventario, il monitoraggio degli scaffali, la gestione delle code e offre insight più intelligenti sui clienti.

Scopri di più
Real-time AI that works with your team

L'AI nella robotica

Potenzia macchine più intelligenti con i modelli Ultralytics YOLO. La Vision AI nella robotica guida la navigazione autonoma, la percezione, il tracciamento degli oggetti e il controllo in tempo reale.

Scopri di più
Real-time AI that works with your team

IA nella produzione

Ottimizza la produzione con i modelli Ultralytics YOLO. La Vision AI potenzia il controllo qualità, il rilevamento dei difetti, la conformità ai DPI e l'automazione della catena di montaggio.

Scopri di più
Real-time AI that works with your team

IA nella logistica

Semplifica la logistica con i modelli Ultralytics YOLO. L'IA basata sulla visione artificiale consente l'ispezione dei pacchi, lo smistamento, il tracciamento dei veicoli e il monitoraggio in tempo reale della sicurezza nei magazzini.

Scopri di più
Real-time AI tailored to your operation

IA in agricoltura

Porta l'IA visiva nell'agricoltura intelligente con i modelli Ultralytics YOLO. Potenzia il monitoraggio delle colture, il tracciamento del bestiame e l'agricoltura di precisione per raccolti più elevati e intelligenti.

Scopri di più
Real-time AI that works with your operation

IA nel settore automobilistico

Applica la computer vision nel settore automobilistico con i modelli Ultralytics YOLO. La Vision AI migliora la sicurezza stradale, l'assistenza alla guida e l'automazione dei veicoli per strade più intelligenti.

Scopri di più
Real-time AI that works with your team

IA nell'assistenza sanitaria

Sviluppa soluzioni sanitarie con i modelli Ultralytics YOLO. L'IA di visione nell'assistenza sanitaria potenzia l'imaging medico, la diagnostica più intelligente e il monitoraggio dei pazienti.

Scopri di più
Real-time AI that works with your team

AI nel settore retail

Reimmagina il retail con i modelli Ultralytics YOLO. La Vision AI potenzia il tracciamento dell'inventario, il monitoraggio degli scaffali, la gestione delle code e offre insight più intelligenti sui clienti.

Scopri di più
Real-time AI that works with your team

L'AI nella robotica

Potenzia macchine più intelligenti con i modelli Ultralytics YOLO. La Vision AI nella robotica guida la navigazione autonoma, la percezione, il tracciamento degli oggetti e il controllo in tempo reale.

Scopri di più
Real-time AI that works with your team

IA nella produzione

Ottimizza la produzione con i modelli Ultralytics YOLO. La Vision AI potenzia il controllo qualità, il rilevamento dei difetti, la conformità ai DPI e l'automazione della catena di montaggio.

Scopri di più
Real-time AI that works with your team

IA nella logistica

Semplifica la logistica con i modelli Ultralytics YOLO. L'IA basata sulla visione artificiale consente l'ispezione dei pacchi, lo smistamento, il tracciamento dei veicoli e il monitoraggio in tempo reale della sicurezza nei magazzini.

Scopri di più

Costruiamo insieme il futuro dell'AI!

Inizia il tuo viaggio con il futuro del machine learning