Découvre YOLO26 : l'IA de vision de nouvelle génération.
Ultralytics
Retour au glossaire Ultralytics

SwiGLU

Découvre SwiGLU, la fonction d'activation avancée utilisée dans les LLM et Ultralytics YOLO26. Apprends comment son mécanisme de « gating » améliore l'entraînement et l'efficacité des réseaux de neurones.

SwiGLU (Swish Gated Linear Unit) est une fonction d'activation avancée et un bloc architectural de réseau de neurones qui améliore le réseau à propagation avant (FFN) traditionnel utilisé dans le deep learning. En combinant les propriétés fluides et non monotones de la fonction d'activation Swish avec un mécanisme de Gated Linear Unit (GLU), SwiGLU permet un routage dynamique des caractéristiques dépendant des données. En appliquant une projection linéaire à une entrée, en faisant passer une branche par une activation Swish et en la multipliant élément par élément avec une autre branche linéaire, le réseau gagne une puissance expressive supérieure. Cela permet aux architectures IA modernes de capturer des dépendances complexes et non linéaires bien plus efficacement que les couches statiques standard utilisées dans les anciens modèles de deep learning.

Link to this sectionComment fonctionne SwiGLU#

Contrairement aux réseaux à propagation avant traditionnels qui mappent simplement une entrée vers une dimension supérieure, appliquent une non-linéarité de base et la re-projettent, SwiGLU introduit un mécanisme de « gating » multiplicatif. L'entrée est divisée en deux projections paramétrées : une « porte » (gate) et une « valeur » (value). La branche « porte » est activée en utilisant la fonction SiLU / Swish, qui préserve les petites valeurs négatives et garantit des dérivées fluides et non nulles presque partout. Cette porte activée est ensuite multipliée élément par élément avec la branche « valeur ». Ce filtrage dynamique permet au réseau de neurones de contrôler intelligemment le flux d'informations, évitant les problèmes de « neurones morts » courants dans les architectures plus anciennes tout en stabilisant le signal du gradient pendant le processus d'entraînement du modèle, un concept largement étudié dans les mécanismes d'attention.

Link to this sectionDifférencier SwiGLU des autres fonctions d'activation#

Alors que les fonctions d'activation standard comme ReLU utilisent un seuil fixe pour écrêter les valeurs négatives à zéro, SwiGLU ajuste dynamiquement les activations en fonction des données d'entrée elles-mêmes. Par rapport à GELU, qui pondère les entrées par leur probabilité selon une distribution gaussienne, SwiGLU exploite spécifiquement des couches linéaires paramétrées pour apprendre comment réguler l'information. En substance, SwiGLU n'est pas seulement un calcul mathématique élément par élément ; il fonctionne comme un composant structurel complet qui remplace souvent tout le mécanisme de couche cachée à l'intérieur d'un bloc Transformer. Pour une comparaison approfondie des propriétés mathématiques, les chercheurs se réfèrent souvent aux guides complets sur les fonctions d'activation.

Link to this sectionApplications concrètes#

En raison de son efficacité computationnelle et de ses gains de performance significatifs, SwiGLU est devenu un composant fondamental des systèmes IA modernes.

Link to this sectionImplémenter SwiGLU dans PyTorch#

Pour les développeurs qui créent des réseaux personnalisés ou adaptent des modèles de vision pour des appareils en périphérie (edge) en utilisant la plateforme Ultralytics, l'implémentation de SwiGLU via la documentation PyTorch est simple. (Alternativement, les développeurs dans d'autres écosystèmes peuvent utiliser des implémentations TensorFlow). Le court extrait Python suivant démontre un module SwiGLU de base utilisant la fonction intégrée F.silu de PyTorch :

import torch
import torch.nn as nn
import torch.nn.functional as F


class SwiGLU(nn.Module):
    def __init__(self, in_features, hidden_features):
        super().__init__()
        # SwiGLU requires two projections: one for the gate, one for the value
        self.gate_proj = nn.Linear(in_features, hidden_features)
        self.value_proj = nn.Linear(in_features, hidden_features)
        self.out_proj = nn.Linear(hidden_features, in_features)

    def forward(self, x):
        # Element-wise multiplication of the SiLU-activated gate and the linear value
        hidden = F.silu(self.gate_proj(x)) * self.value_proj(x)
        return self.out_proj(hidden)


# Example usage with a dummy input tensor
module = SwiGLU(in_features=512, hidden_features=1365)
output = module(torch.randn(1, 512))

Cette approche structurelle des blocs d'activation garantit que les architectures neuronales de pointe extraient des représentations plus riches à partir de données d'entraînement complexes, qu'elles soient appliquées au traitement du langage naturel (NLP) ou à l'analyse spatiale en temps réel. Pour une compréhension plus approfondie de la construction et de l'accélération de modèles efficaces, les développeurs se réfèrent souvent aux recherches fondamentales sur les variantes originales de GLU sur arXiv, aux dépôts open source de Meta et à la documentation sur l'optimisation de PyTorch pour maximiser le débit matériel.

Explore solutions

Real-time AI tailored to your operation

L'IA dans l'agriculture

Apporte l'IA visuelle à l'agriculture intelligente avec les modèles Ultralytics YOLO. Optimise la surveillance des cultures, le suivi du bétail et l'agriculture de précision pour des rendements plus élevés et plus intelligents.

En savoir plus
Real-time AI that works with your operation

L'IA dans le secteur automobile

Applique la vision par ordinateur au secteur automobile avec les modèles Ultralytics YOLO. L'IA de vision améliore la sécurité routière, l'assistance au conducteur et l'automatisation des véhicules pour des routes plus intelligentes.

En savoir plus
Real-time AI that works with your team

L'IA dans le secteur de la santé

Crée tes solutions de santé avec les modèles Ultralytics YOLO. L'IA visuelle dans le secteur de la santé permet une imagerie médicale plus rapide, des diagnostics plus intelligents et un meilleur suivi des patients.

En savoir plus
Real-time AI that works with your team

L'IA dans le secteur du commerce de détail

Réinvente le commerce de détail avec les modèles Ultralytics YOLO. L'IA visuelle propulse le suivi des stocks, la surveillance des rayons, la gestion des files d'attente et des analyses client plus intelligentes.

En savoir plus
Real-time AI that works with your team

L'IA en robotique

Booste tes machines intelligentes avec les modèles Ultralytics YOLO. L'IA visuelle en robotique permet la navigation autonome, la perception, le suivi d'objets et le contrôle en temps réel.

En savoir plus
Real-time AI that works with your team

IA dans la fabrication

Optimise la fabrication avec les modèles Ultralytics YOLO. L'IA visuelle permet le contrôle qualité, la détection de défauts, la conformité des EPI et l'automatisation des chaînes de montage.

En savoir plus
Real-time AI that works with your team

IA dans la logistique

Optimise ta logistique avec les modèles Ultralytics YOLO. L'IA par vision permet l'inspection de colis, le tri, le suivi de véhicules et la surveillance de la sécurité des entrepôts en temps réel.

En savoir plus
Real-time AI tailored to your operation

L'IA dans l'agriculture

Apporte l'IA visuelle à l'agriculture intelligente avec les modèles Ultralytics YOLO. Optimise la surveillance des cultures, le suivi du bétail et l'agriculture de précision pour des rendements plus élevés et plus intelligents.

En savoir plus
Real-time AI that works with your operation

L'IA dans le secteur automobile

Applique la vision par ordinateur au secteur automobile avec les modèles Ultralytics YOLO. L'IA de vision améliore la sécurité routière, l'assistance au conducteur et l'automatisation des véhicules pour des routes plus intelligentes.

En savoir plus
Real-time AI that works with your team

L'IA dans le secteur de la santé

Crée tes solutions de santé avec les modèles Ultralytics YOLO. L'IA visuelle dans le secteur de la santé permet une imagerie médicale plus rapide, des diagnostics plus intelligents et un meilleur suivi des patients.

En savoir plus
Real-time AI that works with your team

L'IA dans le secteur du commerce de détail

Réinvente le commerce de détail avec les modèles Ultralytics YOLO. L'IA visuelle propulse le suivi des stocks, la surveillance des rayons, la gestion des files d'attente et des analyses client plus intelligentes.

En savoir plus
Real-time AI that works with your team

L'IA en robotique

Booste tes machines intelligentes avec les modèles Ultralytics YOLO. L'IA visuelle en robotique permet la navigation autonome, la perception, le suivi d'objets et le contrôle en temps réel.

En savoir plus
Real-time AI that works with your team

IA dans la fabrication

Optimise la fabrication avec les modèles Ultralytics YOLO. L'IA visuelle permet le contrôle qualité, la détection de défauts, la conformité des EPI et l'automatisation des chaînes de montage.

En savoir plus
Real-time AI that works with your team

IA dans la logistique

Optimise ta logistique avec les modèles Ultralytics YOLO. L'IA par vision permet l'inspection de colis, le tri, le suivi de véhicules et la surveillance de la sécurité des entrepôts en temps réel.

En savoir plus
Real-time AI tailored to your operation

L'IA dans l'agriculture

Apporte l'IA visuelle à l'agriculture intelligente avec les modèles Ultralytics YOLO. Optimise la surveillance des cultures, le suivi du bétail et l'agriculture de précision pour des rendements plus élevés et plus intelligents.

En savoir plus
Real-time AI that works with your operation

L'IA dans le secteur automobile

Applique la vision par ordinateur au secteur automobile avec les modèles Ultralytics YOLO. L'IA de vision améliore la sécurité routière, l'assistance au conducteur et l'automatisation des véhicules pour des routes plus intelligentes.

En savoir plus
Real-time AI that works with your team

L'IA dans le secteur de la santé

Crée tes solutions de santé avec les modèles Ultralytics YOLO. L'IA visuelle dans le secteur de la santé permet une imagerie médicale plus rapide, des diagnostics plus intelligents et un meilleur suivi des patients.

En savoir plus
Real-time AI that works with your team

L'IA dans le secteur du commerce de détail

Réinvente le commerce de détail avec les modèles Ultralytics YOLO. L'IA visuelle propulse le suivi des stocks, la surveillance des rayons, la gestion des files d'attente et des analyses client plus intelligentes.

En savoir plus
Real-time AI that works with your team

L'IA en robotique

Booste tes machines intelligentes avec les modèles Ultralytics YOLO. L'IA visuelle en robotique permet la navigation autonome, la perception, le suivi d'objets et le contrôle en temps réel.

En savoir plus
Real-time AI that works with your team

IA dans la fabrication

Optimise la fabrication avec les modèles Ultralytics YOLO. L'IA visuelle permet le contrôle qualité, la détection de défauts, la conformité des EPI et l'automatisation des chaînes de montage.

En savoir plus
Real-time AI that works with your team

IA dans la logistique

Optimise ta logistique avec les modèles Ultralytics YOLO. L'IA par vision permet l'inspection de colis, le tri, le suivi de véhicules et la surveillance de la sécurité des entrepôts en temps réel.

En savoir plus

Construisons ensemble le futur de l'IA !

Commence ton aventure avec le futur de l'apprentissage automatique