Découvre YOLO26 : l'IA de vision de nouvelle génération.
Ultralytics
Retour au glossaire Ultralytics

Reformer

Explore l'architecture Reformer, une variante efficace de Transformer pour les séquences longues. Apprends comment l'attention LSH et les RevNets optimisent la mémoire pour la recherche en IA.

Le Reformer est une variante efficace de l'architecture Transformer conçue pour traiter de très longues séquences de données qui seraient prohibitives en termes de calcul pour les modèles standard. Introduit pour résoudre les goulots d'étranglement de mémoire inhérents aux systèmes de deep learning traditionnels, le Reformer réduit la complexité du mécanisme d'attention de termes quadratiques à logarithmiques linéaires. Cette innovation permet aux chercheurs en intelligence artificielle d'entraîner des modèles sur des fenêtres de contexte couvrant des dizaines de milliers de tokens — comme des livres entiers, des images haute résolution ou de longues compositions musicales — sur un seul GPU.

Link to this sectionInnovations clés du Reformer#

Le Reformer atteint son efficacité grâce à deux changements architecturaux majeurs qui le distinguent de modèles comme BERT ou la série originale GPT. Ces techniques répondent aux besoins étendus en mémoire requis pour stocker les activations pendant l'entraînement du modèle.

  • Attention par hachage sensible à la localité (LSH) : Dans un Transformer standard, chaque élément d'une séquence porte attention à chaque autre élément, créant une charge de calcul massive. Le Reformer utilise le hachage sensible à la localité pour regrouper des vecteurs similaires. Au lieu de calculer les scores d'attention pour toutes les paires, le modèle ne les calcule que pour un petit sous-ensemble de plus proches voisins, accélérant considérablement le moteur d'inférence.
  • Couches résiduelles réversibles (RevNets) : Les réseaux de neurones traditionnels doivent stocker les activations de chaque couche pour calculer les gradients pendant la rétropropagation. Le Reformer utilise des réseaux de neurones réversibles, qui permettent de recalculer l'entrée d'une couche à partir de sa sortie lors de la passe arrière. Cette technique élimine le besoin de mettre en cache les activations intermédiaires, libérant ainsi de la mémoire pour des tailles de lots plus grandes.

Link to this sectionReformer vs Transformer standard#

Bien que les deux architectures reposent sur le mécanisme d'auto-attention, elles servent des objectifs différents au sein de l'écosystème du machine learning.

  • Transformer standard : Excellent pour les séquences de longueur courte à moyenne. Cependant, son utilisation de la mémoire croît de façon quadratique ($O(L^2)$) avec la longueur de la séquence ($L$). Il constitue la base de nombreux grands modèles de langage (LLM) utilisés pour des tâches comme l'analyse des sentiments ou les chatbots.
  • Reformer : Optimisé pour des longueurs extrêmes ($O(L \log L)$). Il sacrifie une petite quantité de précision dans certains contextes pour la capacité de gérer des entrées impossibles pour les Transformers standard, comme le traitement de données extrêmement longues en analyse de séries temporelles ou la génération d'images pixel par pixel.

Link to this sectionApplications concrètes#

La capacité du Reformer à gérer de vastes fenêtres de contexte ouvre de nouvelles possibilités dans des domaines où les données ne peuvent pas être facilement fragmentées.

  1. Analyse génomique : Les séquences d'ADN consistent en des millions de paires de bases. Le Reformer peut analyser ces longues chaînes pour identifier des modèles en bioinformatique sans perdre le contexte plus large, aidant ainsi à la prédiction de la structure des protéines.

  2. Génération de texte long : Contrairement aux modèles de génération de texte standard qui peuvent perdre en cohérence après quelques paragraphes, un Reformer peut maintenir une cohérence sur des milliers de mots, ce qui le rend adapté à la génération de résumés de longs contrats juridiques ou de chapitres entiers de romans.

Link to this sectionEfficacité en vision par ordinateur#

Bien que les Reformers soient souvent associés au texte, le principe d'efficacité est crucial en vision par ordinateur. Tout comme le Reformer optimise les Transformers, des modèles de vision modernes comme YOLO26 optimisent les réseaux de neurones convolutifs (CNN) pour l'inférence en temps réel. Comprendre les contraintes de mémoire est vital lors du déploiement de modèles sur des appareils périphériques via la plateforme Ultralytics, où les ressources matérielles sont limitées.

Le code suivant montre comment inspecter l'empreinte mémoire d'un modèle en utilisant PyTorch, un concept central dans le développement d'architectures économes en mémoire comme le Reformer.

import torch
import torch.nn as nn

# Define a simple Transformer layer (Standard, not Reformer optimized)
layer = nn.TransformerEncoderLayer(d_model=512, nhead=8)
model = nn.TransformerEncoder(layer, num_layers=6)

# Create a long sequence input (Sequence Length: 2000, Batch: 1, Features: 512)
# Standard Transformers struggle as this length increases.
input_data = torch.rand(2000, 1, 512)

# Check parameter count to understand model complexity
params = sum(p.numel() for p in model.parameters())
print(f"Model Parameters: {params:,}")

# Perform a forward pass
output = model(input_data)
print(f"Output shape: {output.shape}")

Link to this sectionConcepts associés#

  • Attention creuse : Une catégorie plus large de techniques, incluant le LSH, où le modèle ne porte attention qu'à un sous-ensemble de tokens pour économiser du calcul.
  • Point de contrôle de gradient : Une technique similaire aux couches réversibles utilisée pour échanger du temps de calcul contre de la mémoire pendant l'entraînement du modèle.
  • Optimisation du modèle : La pratique générale consistant à améliorer l'efficacité du modèle, qui englobe la quantification, l'élagage et les changements architecturaux comme ceux du Reformer.

Explore solutions

Real-time AI that works with your team

IA dans la robotique

Équipe tes machines plus intelligentes avec les modèles Ultralytics YOLO. La vision par IA dans la robotique propulse la navigation autonome, la perception, le suivi d'objets et le contrôle en temps réel.
En savoir plus
Real-time AI that works with your team

IA dans la logistique

Simplifie la logistique avec les modèles Ultralytics YOLO. La vision par IA permet l'inspection des colis, le tri, le suivi des véhicules et la surveillance de la sécurité des entrepôts en temps réel.
En savoir plus
Real-time AI that works with your team

IA dans le commerce de détail

Réinvente le commerce de détail avec les modèles Ultralytics YOLO. La vision par IA alimente le suivi des stocks, la surveillance des étagères, la gestion des files d'attente et des informations plus intelligentes sur les clients.
En savoir plus
Real-time AI that works with your team

IA dans la santé

Construis des solutions de santé avec les modèles Ultralytics YOLO. L'IA de vision dans la santé permet une imagerie médicale plus rapide, des diagnostics plus intelligents et une surveillance des patients.
En savoir plus
Real-time AI that works with your team

IA dans la fabrication

Optimise la fabrication avec les modèles Ultralytics YOLO. La vision par IA favorise le contrôle qualité, la détection des défauts, la conformité aux EPI et l'automatisation des chaînes de montage.
En savoir plus
Real-time AI that works with your operation

IA dans l'automobile

Applique la vision par ordinateur dans l'automobile avec les modèles Ultralytics YOLO. L'IA de vision améliore la sécurité routière, l'assistance à la conduite et l'automatisation des véhicules pour des routes plus intelligentes.
En savoir plus
Real-time AI tailored to your operation

IA en agriculture

Intègre l'IA de vision à l'agriculture intelligente avec les modèles Ultralytics YOLO. Optimise la surveillance des cultures, le suivi du bétail et l'agriculture de précision pour des rendements plus élevés et plus intelligents.
En savoir plus
Real-time AI that works with your team

IA dans la robotique

Équipe tes machines plus intelligentes avec les modèles Ultralytics YOLO. La vision par IA dans la robotique propulse la navigation autonome, la perception, le suivi d'objets et le contrôle en temps réel.
En savoir plus
Real-time AI that works with your team

IA dans la logistique

Simplifie la logistique avec les modèles Ultralytics YOLO. La vision par IA permet l'inspection des colis, le tri, le suivi des véhicules et la surveillance de la sécurité des entrepôts en temps réel.
En savoir plus
Real-time AI that works with your team

IA dans le commerce de détail

Réinvente le commerce de détail avec les modèles Ultralytics YOLO. La vision par IA alimente le suivi des stocks, la surveillance des étagères, la gestion des files d'attente et des informations plus intelligentes sur les clients.
En savoir plus
Real-time AI that works with your team

IA dans la santé

Construis des solutions de santé avec les modèles Ultralytics YOLO. L'IA de vision dans la santé permet une imagerie médicale plus rapide, des diagnostics plus intelligents et une surveillance des patients.
En savoir plus
Real-time AI that works with your team

IA dans la fabrication

Optimise la fabrication avec les modèles Ultralytics YOLO. La vision par IA favorise le contrôle qualité, la détection des défauts, la conformité aux EPI et l'automatisation des chaînes de montage.
En savoir plus
Real-time AI that works with your operation

IA dans l'automobile

Applique la vision par ordinateur dans l'automobile avec les modèles Ultralytics YOLO. L'IA de vision améliore la sécurité routière, l'assistance à la conduite et l'automatisation des véhicules pour des routes plus intelligentes.
En savoir plus
Real-time AI tailored to your operation

IA en agriculture

Intègre l'IA de vision à l'agriculture intelligente avec les modèles Ultralytics YOLO. Optimise la surveillance des cultures, le suivi du bétail et l'agriculture de précision pour des rendements plus élevés et plus intelligents.
En savoir plus
Real-time AI that works with your team

IA dans la robotique

Équipe tes machines plus intelligentes avec les modèles Ultralytics YOLO. La vision par IA dans la robotique propulse la navigation autonome, la perception, le suivi d'objets et le contrôle en temps réel.
En savoir plus
Real-time AI that works with your team

IA dans la logistique

Simplifie la logistique avec les modèles Ultralytics YOLO. La vision par IA permet l'inspection des colis, le tri, le suivi des véhicules et la surveillance de la sécurité des entrepôts en temps réel.
En savoir plus
Real-time AI that works with your team

IA dans le commerce de détail

Réinvente le commerce de détail avec les modèles Ultralytics YOLO. La vision par IA alimente le suivi des stocks, la surveillance des étagères, la gestion des files d'attente et des informations plus intelligentes sur les clients.
En savoir plus
Real-time AI that works with your team

IA dans la santé

Construis des solutions de santé avec les modèles Ultralytics YOLO. L'IA de vision dans la santé permet une imagerie médicale plus rapide, des diagnostics plus intelligents et une surveillance des patients.
En savoir plus
Real-time AI that works with your team

IA dans la fabrication

Optimise la fabrication avec les modèles Ultralytics YOLO. La vision par IA favorise le contrôle qualité, la détection des défauts, la conformité aux EPI et l'automatisation des chaînes de montage.
En savoir plus
Real-time AI that works with your operation

IA dans l'automobile

Applique la vision par ordinateur dans l'automobile avec les modèles Ultralytics YOLO. L'IA de vision améliore la sécurité routière, l'assistance à la conduite et l'automatisation des véhicules pour des routes plus intelligentes.
En savoir plus
Real-time AI tailored to your operation

IA en agriculture

Intègre l'IA de vision à l'agriculture intelligente avec les modèles Ultralytics YOLO. Optimise la surveillance des cultures, le suivi du bétail et l'agriculture de précision pour des rendements plus élevés et plus intelligents.
En savoir plus

Construisons ensemble le futur de l'IA !

Commence ton aventure avec le futur de l'apprentissage automatique