Découvre YOLO26 : l'IA de vision de nouvelle génération.
Ultralytics
Retour au glossaire Ultralytics

Linear Attention

Découvre comment l'attention linéaire optimise les modèles de deep learning en réduisant la complexité des Transformer à O(N). Apprends comment elle améliore l'efficacité pour les applications d'IA.

L'attention linéaire est une technique d'optimisation fondamentale conçue pour améliorer radicalement l'efficacité computationnelle des modèles modernes d'apprentissage profond (DL). Dans les architectures Transformer traditionnelles, les mécanismes d'attention standard traitent les séquences en comparant chaque jeton à tous les autres jetons. Cela crée un goulot d'étranglement sévère au niveau du calcul et de la mémoire, connu sous le nom de complexité temporelle quadratique, ou O(N au carré), où N est la longueur de la séquence. L'attention linéaire modifie cette opération mathématique sous-jacente afin qu'elle s'adapte de manière linéaire, ou O(N). Cette avancée permet aux modèles d'intelligence artificielle (IA) de traiter des jeux de données massifs, tels que des livres entiers ou des images gigapixels, sans épuiser la mémoire du matériel.

Link to this sectionComment fonctionne l'attention linéaire#

Dans l'attention standard, les réseaux de neurones traitent trois vecteurs principaux : Requêtes (Q), Clés (K) et Valeurs (V). La formule classique calcule la similitude entre toutes les Requêtes et les Clés en utilisant une fonction softmax, générant une matrice massive N x N avant de la multiplier par les Valeurs.

L'attention linéaire contourne la génération de cette matrice intermédiaire massive. Au lieu de cela, elle s'appuie sur la propriété associative de la multiplication matricielle. En supprimant ou en approximant la couche softmax à l'aide de fonctions de noyau spécialisées, le modèle regroupe la multiplication différemment. Il multiplie d'abord les Clés et les Valeurs ensemble pour créer une matrice de contexte de taille fixe, puis multiplie les Requêtes par cette nouvelle matrice compressée. Cette simple réorganisation réduit considérablement la complexité computationnelle, libérant du matériel comme un GPU (Graphics Processing Unit) pour gérer nativement des entrées beaucoup plus longues.

Link to this sectionDéveloppements récents et DeltaNet#

La communauté de recherche en IA, dirigée par des institutions comme Stanford University et des géants de la technologie tels que Google DeepMind, innove continuellement sur les formulations linéaires pour augmenter la précision. En 2024 et 2025, les chercheurs ont introduit DeltaNet, une nouvelle architecture qui remplace les mises à jour additives standard dans les transformateurs linéaires par une « Règle Delta ». Cela permet au réseau de mettre à jour sa mémoire interne par rapport à ce qui est déjà stocké, plutôt que de calculer des valeurs absolues à partir de zéro.

Des avancées ultérieures, telles que les architectures Gated DeltaNet, introduisent des taux de déclin par canal, permettant aux modèles d'oublier ou de conserver sélectivement des caractéristiques clés spécifiques au fil du temps. Ces innovations économes en matériel comblent l'écart de performance entre les transformateurs linéaires et l'attention softmax traditionnelle, spécifiquement dans les tâches complexes de récupération en contexte.

Link to this sectionAttention linéaire vs. autres mécanismes d'attention#

Comprendre comment cette technique diffère des concepts connexes au sein de la famille plus large des mécanismes d'attention est crucial pour les ingénieurs en IA qui optimisent leurs réseaux :

  • Self-Attention : Le mécanisme fondateur qui utilise la matrice softmax complète et coûteuse en calcul O(N au carré) pour capturer un contexte global parfait.
  • Flash Attention : Une optimisation sensible aux E/S qui accélère les calculs exacts d'auto-attention O(N au carré) en déplaçant efficacement les données entre les niveaux de mémoire du GPU. Contrairement à l'attention linéaire, Flash Attention ne modifie pas la formule mathématique sous-jacente.
  • Sparse Attention : Une méthode qui économise de la mémoire en forçant le réseau à ne regarder qu'une fenêtre localisée de jetons voisins, tandis que l'attention linéaire compresse mathématiquement l'ensemble de la vue globale en un état fixe.

Link to this sectionApplications concrètes#

En brisant la barrière de la longueur de séquence, la mise à l'échelle linéaire débloque des capacités puissantes dans de multiples domaines de l'IA :

Link to this sectionExemple de code#

Les frameworks modernes comme PyTorch et TensorFlow rendent la mise en œuvre de ces concepts mathématiques directe. Vous trouverez ci-dessous un extrait conceptuel de PyTorch démontrant comment l'attention linéaire modifie l'ordre de la multiplication matricielle pour atteindre une efficacité O(N).

import torch
import torch.nn as nn
import torch.nn.functional as F


class SimpleLinearAttention(nn.Module):
    def __init__(self, dim):
        super().__init__()
        self.qkv = nn.Linear(dim, dim * 3)

    def forward(self, x):
        # x shape: (Batch, Sequence Length, Channels)
        q, k, v = self.qkv(x).chunk(3, dim=-1)

        # Apply an activation function as a kernel approximation (replaces softmax)
        q = F.elu(q) + 1.0
        k = F.elu(k) + 1.0

        # Associative trick: Multiply Key and Value first (O(N) complexity)
        # k^T @ v yields a fixed (Batch, Channels, Channels) matrix
        kv_context = torch.matmul(k.transpose(-2, -1), v)

        # Multiply Query by the fixed context matrix to get the final output
        return torch.matmul(q, kv_context)


# Example: Processing a sequence of 1024 tokens
model = SimpleLinearAttention(dim=64)
dummy_input = torch.randn(1, 1024, 64)
output = model(dummy_input)
print(f"Output shape: {output.shape}")

Bien que les modèles communautaires expérimentaux puissent intégrer diverses couches d'attention linéaire ou clairsemée, ils peuvent souvent souffrir de vitesses CPU lentes ou d'une instabilité d'entraînement. Pour des déploiements de vision par ordinateur robustes et prêts pour la production, Ultralytics YOLO26 est le standard recommandé. Il dispose d'une architecture nativement de bout en bout hautement optimisée qui maximise la vitesse et la précision pour des tâches critiques telles que la détection d'objets sans dépendre de lourdes couches d'attention. Les développeurs peuvent annoter des jeux de données, entraîner, déployer et surveiller ces modèles de premier ordre en utilisant la plateforme Ultralytics complète.

Explore solutions

Real-time AI that works with your team

IA dans la robotique

Équipe tes machines plus intelligentes avec les modèles Ultralytics YOLO. La vision par IA dans la robotique propulse la navigation autonome, la perception, le suivi d'objets et le contrôle en temps réel.
En savoir plus
Real-time AI that works with your team

IA dans la logistique

Simplifie la logistique avec les modèles Ultralytics YOLO. La vision par IA permet l'inspection des colis, le tri, le suivi des véhicules et la surveillance de la sécurité des entrepôts en temps réel.
En savoir plus
Real-time AI that works with your team

IA dans le commerce de détail

Réinvente le commerce de détail avec les modèles Ultralytics YOLO. La vision par IA alimente le suivi des stocks, la surveillance des étagères, la gestion des files d'attente et des informations plus intelligentes sur les clients.
En savoir plus
Real-time AI that works with your team

IA dans la santé

Construis des solutions de santé avec les modèles Ultralytics YOLO. L'IA de vision dans la santé permet une imagerie médicale plus rapide, des diagnostics plus intelligents et une surveillance des patients.
En savoir plus
Real-time AI that works with your team

IA dans la fabrication

Optimise la fabrication avec les modèles Ultralytics YOLO. La vision par IA favorise le contrôle qualité, la détection des défauts, la conformité aux EPI et l'automatisation des chaînes de montage.
En savoir plus
Real-time AI that works with your operation

IA dans l'automobile

Applique la vision par ordinateur dans l'automobile avec les modèles Ultralytics YOLO. L'IA de vision améliore la sécurité routière, l'assistance à la conduite et l'automatisation des véhicules pour des routes plus intelligentes.
En savoir plus
Real-time AI tailored to your operation

IA en agriculture

Intègre l'IA de vision à l'agriculture intelligente avec les modèles Ultralytics YOLO. Optimise la surveillance des cultures, le suivi du bétail et l'agriculture de précision pour des rendements plus élevés et plus intelligents.
En savoir plus
Real-time AI that works with your team

IA dans la robotique

Équipe tes machines plus intelligentes avec les modèles Ultralytics YOLO. La vision par IA dans la robotique propulse la navigation autonome, la perception, le suivi d'objets et le contrôle en temps réel.
En savoir plus
Real-time AI that works with your team

IA dans la logistique

Simplifie la logistique avec les modèles Ultralytics YOLO. La vision par IA permet l'inspection des colis, le tri, le suivi des véhicules et la surveillance de la sécurité des entrepôts en temps réel.
En savoir plus
Real-time AI that works with your team

IA dans le commerce de détail

Réinvente le commerce de détail avec les modèles Ultralytics YOLO. La vision par IA alimente le suivi des stocks, la surveillance des étagères, la gestion des files d'attente et des informations plus intelligentes sur les clients.
En savoir plus
Real-time AI that works with your team

IA dans la santé

Construis des solutions de santé avec les modèles Ultralytics YOLO. L'IA de vision dans la santé permet une imagerie médicale plus rapide, des diagnostics plus intelligents et une surveillance des patients.
En savoir plus
Real-time AI that works with your team

IA dans la fabrication

Optimise la fabrication avec les modèles Ultralytics YOLO. La vision par IA favorise le contrôle qualité, la détection des défauts, la conformité aux EPI et l'automatisation des chaînes de montage.
En savoir plus
Real-time AI that works with your operation

IA dans l'automobile

Applique la vision par ordinateur dans l'automobile avec les modèles Ultralytics YOLO. L'IA de vision améliore la sécurité routière, l'assistance à la conduite et l'automatisation des véhicules pour des routes plus intelligentes.
En savoir plus
Real-time AI tailored to your operation

IA en agriculture

Intègre l'IA de vision à l'agriculture intelligente avec les modèles Ultralytics YOLO. Optimise la surveillance des cultures, le suivi du bétail et l'agriculture de précision pour des rendements plus élevés et plus intelligents.
En savoir plus
Real-time AI that works with your team

IA dans la robotique

Équipe tes machines plus intelligentes avec les modèles Ultralytics YOLO. La vision par IA dans la robotique propulse la navigation autonome, la perception, le suivi d'objets et le contrôle en temps réel.
En savoir plus
Real-time AI that works with your team

IA dans la logistique

Simplifie la logistique avec les modèles Ultralytics YOLO. La vision par IA permet l'inspection des colis, le tri, le suivi des véhicules et la surveillance de la sécurité des entrepôts en temps réel.
En savoir plus
Real-time AI that works with your team

IA dans le commerce de détail

Réinvente le commerce de détail avec les modèles Ultralytics YOLO. La vision par IA alimente le suivi des stocks, la surveillance des étagères, la gestion des files d'attente et des informations plus intelligentes sur les clients.
En savoir plus
Real-time AI that works with your team

IA dans la santé

Construis des solutions de santé avec les modèles Ultralytics YOLO. L'IA de vision dans la santé permet une imagerie médicale plus rapide, des diagnostics plus intelligents et une surveillance des patients.
En savoir plus
Real-time AI that works with your team

IA dans la fabrication

Optimise la fabrication avec les modèles Ultralytics YOLO. La vision par IA favorise le contrôle qualité, la détection des défauts, la conformité aux EPI et l'automatisation des chaînes de montage.
En savoir plus
Real-time AI that works with your operation

IA dans l'automobile

Applique la vision par ordinateur dans l'automobile avec les modèles Ultralytics YOLO. L'IA de vision améliore la sécurité routière, l'assistance à la conduite et l'automatisation des véhicules pour des routes plus intelligentes.
En savoir plus
Real-time AI tailored to your operation

IA en agriculture

Intègre l'IA de vision à l'agriculture intelligente avec les modèles Ultralytics YOLO. Optimise la surveillance des cultures, le suivi du bétail et l'agriculture de précision pour des rendements plus élevés et plus intelligents.
En savoir plus

Construisons ensemble le futur de l'IA !

Commence ton aventure avec le futur de l'apprentissage automatique