Découvre YOLO26 : l'IA de vision de nouvelle génération.
Ultralytics
Retour au glossaire Ultralytics

Self-Attention

Explore les fondamentaux de l'auto-attention (self-attention) en apprentissage profond. Apprends comment les vecteurs Query, Key et Value propulsent les Transformers et Ultralytics YOLO26 pour une IA supérieure.

L'auto-attention est un mécanisme fondamental de l'apprentissage profond qui permet aux modèles de pondérer l'importance de différents éléments au sein d'une séquence d'entrée les uns par rapport aux autres. Contrairement aux architectures traditionnelles qui traitent les données de manière séquentielle ou ne se concentrent que sur les voisinages locaux, l'auto-attention permet à un réseau de neurones d'examiner l'intégralité du contexte simultanément. Cette capacité aide les systèmes à identifier des relations complexes entre des parties distantes de données, comme des mots dans une phrase ou des régions distinctes dans une image. Elle sert de bloc de construction central pour l'architecture Transformer, qui a entraîné des avancées massives dans l'IA générative et les systèmes de perception modernes.

Link to this sectionComment fonctionne l'auto-attention#

Le mécanisme imite la concentration cognitive en attribuant un poids, souvent appelé « score d'attention », à chaque caractéristique d'entrée. Pour calculer ces scores, le modèle transforme les données d'entrée — généralement représentées sous forme de plongements — en trois vecteurs distincts : la Requête (Query), la Clé (Key) et la Valeur (Value).

  • Requête (Query) (Q) : Représente l'élément actuel cherchant un contexte pertinent dans le reste de la séquence.
  • Clé (Key) (K) : Agit comme une étiquette ou un identifiant pour chaque élément de la séquence avec lequel la requête est mise en correspondance.
  • Valeur (Value) (V) : Contient le contenu informatif réel de l'élément qui sera agrégé.

Le modèle compare la Requête d'un élément avec les Clés de tous les autres éléments pour déterminer la compatibilité. Ces scores de compatibilité sont normalisés en utilisant une fonction softmax pour créer des poids similaires à des probabilités. Ces poids sont ensuite appliqués aux Valeurs, générant une représentation riche en contexte. Ce processus permet aux Grands Modèles Linguistiques (LLM) et aux systèmes de vision de prioriser les informations significatives tout en filtrant le bruit.

Link to this sectionApplications concrètes#

La polyvalence de l'auto-attention a conduit à son adoption généralisée dans divers domaines de l'Intelligence Artificielle (IA).

  • Traitement du Langage Naturel (NLP) : Dans des tâches telles que la traduction automatique, l'auto-attention résout l'ambiguïté en reliant les pronoms à leurs référents. Par exemple, dans la phrase « L'animal n'a pas traversé la rue parce qu'il était trop fatigué », le modèle utilise l'auto-attention pour associer fortement « il » à « animal » plutôt qu'à « rue ». Cette conscience contextuelle alimente des outils comme Google Translate.
  • Contexte Global de l'Image : En Vision par Ordinateur (CV), des architectures comme le Vision Transformer (ViT) divisent les images en patchs et appliquent l'auto-attention pour comprendre la scène globalement. Ceci est vital pour la détection d'objets dans des environnements complexes où l'identification d'un objet repose sur la compréhension de son environnement.

Link to this sectionDistinguer les termes associés#

Bien qu'ils soient souvent discutés aux côtés de concepts similaires, ces termes ont des définitions techniques distinctes :

  • Mécanisme d'Attention : La vaste catégorie de techniques permettant aux modèles de se concentrer sur des parties spécifiques de données. Elle englobe l'Attention Croisée (Cross-Attention), où un modèle utilise une séquence (comme une sortie de décodeur) pour interroger une séquence différente (comme une entrée d'encodeur).
  • Auto-attention : Un type spécifique d'attention où la Requête, la Clé et la Valeur proviennent toutes de la même séquence d'entrée. Elle est conçue pour apprendre les dépendances internes au sein d'un ensemble de données unique.
  • Flash Attention : Un algorithme d'optimisation développé par des chercheurs de l'Université Stanford qui rend le calcul de l'auto-attention nettement plus rapide et plus économe en mémoire sur les GPU sans modifier le résultat mathématique.

Link to this sectionExemple de code#

L'extrait Python suivant montre comment utiliser RTDETR, un détecteur d'objets basé sur Transformer inclus dans le package ultralytics. Contrairement aux réseaux convolutionnels standard, ce modèle repose fortement sur l'auto-attention pour traiter les caractéristiques visuelles.

from ultralytics import RTDETR

# Load the RT-DETR model which utilizes self-attention for detection
model = RTDETR("rtdetr-l.pt")

# Perform inference on an image to detect objects with global context
# Self-attention helps the model understand relationships between distant objects
results = model("https://ultralytics.com/images/bus.jpg")

# Print the number of objects detected
print(f"Detected {len(results[0].boxes)} objects using Transformer attention.")

Link to this sectionÉvolution et impact futur#

L'auto-attention a résolu efficacement le problème du gradient disparaissant qui entravait les anciens Réseaux de Neurones Récurrents (RNN), permettant l'entraînement de modèles de fondation massifs. Bien qu'elle soit très efficace, le coût computationnel de l'auto-attention standard croît de manière quadratique avec la longueur de la séquence. Pour remédier à cela, la recherche actuelle se concentre sur des mécanismes d'attention linéaire efficaces.

Ultralytics intègre ces avancées dans des modèles de pointe comme YOLO26, qui combine la vitesse des CNN avec la puissance contextuelle de l'attention pour une inférence en temps réel supérieure. Ces modèles optimisés peuvent être facilement entraînés et déployés via la Plateforme Ultralytics, rationalisant le flux de travail pour les développeurs construisant la prochaine génération d'applications intelligentes.

Explore solutions

Real-time AI that works with your team

IA dans la robotique

Équipe tes machines plus intelligentes avec les modèles Ultralytics YOLO. La vision par IA dans la robotique propulse la navigation autonome, la perception, le suivi d'objets et le contrôle en temps réel.

En savoir plus
Real-time AI that works with your team

IA dans la logistique

Simplifie la logistique avec les modèles Ultralytics YOLO. La vision par IA permet l'inspection des colis, le tri, le suivi des véhicules et la surveillance de la sécurité des entrepôts en temps réel.

En savoir plus
Real-time AI that works with your team

IA dans le commerce de détail

Réinvente le commerce de détail avec les modèles Ultralytics YOLO. La vision par IA alimente le suivi des stocks, la surveillance des étagères, la gestion des files d'attente et des informations plus intelligentes sur les clients.

En savoir plus
Real-time AI that works with your team

IA dans la santé

Construis des solutions de santé avec les modèles Ultralytics YOLO. L'IA de vision dans la santé permet une imagerie médicale plus rapide, des diagnostics plus intelligents et une surveillance des patients.

En savoir plus
Real-time AI that works with your team

IA dans la fabrication

Optimise la fabrication avec les modèles Ultralytics YOLO. La vision par IA favorise le contrôle qualité, la détection des défauts, la conformité aux EPI et l'automatisation des chaînes de montage.

En savoir plus
Real-time AI that works with your operation

IA dans l'automobile

Applique la vision par ordinateur dans l'automobile avec les modèles Ultralytics YOLO. L'IA de vision améliore la sécurité routière, l'assistance à la conduite et l'automatisation des véhicules pour des routes plus intelligentes.

En savoir plus
Real-time AI tailored to your operation

IA en agriculture

Intègre l'IA de vision à l'agriculture intelligente avec les modèles Ultralytics YOLO. Optimise la surveillance des cultures, le suivi du bétail et l'agriculture de précision pour des rendements plus élevés et plus intelligents.

En savoir plus
Real-time AI that works with your team

IA dans la robotique

Équipe tes machines plus intelligentes avec les modèles Ultralytics YOLO. La vision par IA dans la robotique propulse la navigation autonome, la perception, le suivi d'objets et le contrôle en temps réel.

En savoir plus
Real-time AI that works with your team

IA dans la logistique

Simplifie la logistique avec les modèles Ultralytics YOLO. La vision par IA permet l'inspection des colis, le tri, le suivi des véhicules et la surveillance de la sécurité des entrepôts en temps réel.

En savoir plus
Real-time AI that works with your team

IA dans le commerce de détail

Réinvente le commerce de détail avec les modèles Ultralytics YOLO. La vision par IA alimente le suivi des stocks, la surveillance des étagères, la gestion des files d'attente et des informations plus intelligentes sur les clients.

En savoir plus
Real-time AI that works with your team

IA dans la santé

Construis des solutions de santé avec les modèles Ultralytics YOLO. L'IA de vision dans la santé permet une imagerie médicale plus rapide, des diagnostics plus intelligents et une surveillance des patients.

En savoir plus
Real-time AI that works with your team

IA dans la fabrication

Optimise la fabrication avec les modèles Ultralytics YOLO. La vision par IA favorise le contrôle qualité, la détection des défauts, la conformité aux EPI et l'automatisation des chaînes de montage.

En savoir plus
Real-time AI that works with your operation

IA dans l'automobile

Applique la vision par ordinateur dans l'automobile avec les modèles Ultralytics YOLO. L'IA de vision améliore la sécurité routière, l'assistance à la conduite et l'automatisation des véhicules pour des routes plus intelligentes.

En savoir plus
Real-time AI tailored to your operation

IA en agriculture

Intègre l'IA de vision à l'agriculture intelligente avec les modèles Ultralytics YOLO. Optimise la surveillance des cultures, le suivi du bétail et l'agriculture de précision pour des rendements plus élevés et plus intelligents.

En savoir plus
Real-time AI that works with your team

IA dans la robotique

Équipe tes machines plus intelligentes avec les modèles Ultralytics YOLO. La vision par IA dans la robotique propulse la navigation autonome, la perception, le suivi d'objets et le contrôle en temps réel.

En savoir plus
Real-time AI that works with your team

IA dans la logistique

Simplifie la logistique avec les modèles Ultralytics YOLO. La vision par IA permet l'inspection des colis, le tri, le suivi des véhicules et la surveillance de la sécurité des entrepôts en temps réel.

En savoir plus
Real-time AI that works with your team

IA dans le commerce de détail

Réinvente le commerce de détail avec les modèles Ultralytics YOLO. La vision par IA alimente le suivi des stocks, la surveillance des étagères, la gestion des files d'attente et des informations plus intelligentes sur les clients.

En savoir plus
Real-time AI that works with your team

IA dans la santé

Construis des solutions de santé avec les modèles Ultralytics YOLO. L'IA de vision dans la santé permet une imagerie médicale plus rapide, des diagnostics plus intelligents et une surveillance des patients.

En savoir plus
Real-time AI that works with your team

IA dans la fabrication

Optimise la fabrication avec les modèles Ultralytics YOLO. La vision par IA favorise le contrôle qualité, la détection des défauts, la conformité aux EPI et l'automatisation des chaînes de montage.

En savoir plus
Real-time AI that works with your operation

IA dans l'automobile

Applique la vision par ordinateur dans l'automobile avec les modèles Ultralytics YOLO. L'IA de vision améliore la sécurité routière, l'assistance à la conduite et l'automatisation des véhicules pour des routes plus intelligentes.

En savoir plus
Real-time AI tailored to your operation

IA en agriculture

Intègre l'IA de vision à l'agriculture intelligente avec les modèles Ultralytics YOLO. Optimise la surveillance des cultures, le suivi du bétail et l'agriculture de précision pour des rendements plus élevés et plus intelligents.

En savoir plus

Construisons ensemble le futur de l'IA !

Commence ton aventure avec le futur de l'apprentissage automatique