Découvre YOLO26 : l'IA de vision de nouvelle génération.
Ultralytics
Retour au glossaire Ultralytics

Rotary Position Embedding (RoPE)

Explore comment l'intégration de position rotative (RoPE) améliore les transformers en encodant les positions relatives. Apprends son rôle dans les LLM et les tâches de vision d'Ultralytics YOLO26.

Rotary Position Embedding (RoPE) est une technique hautement efficace utilisée dans les architectures de réseaux de neurones modernes pour injecter des informations positionnelles dans les plongements de jetons (token embeddings). Dans les modèles d'apprentissage profond comme les transformers, les jetons d'entrée sont traités simultanément plutôt que séquentiellement. Comme ces modèles manquent de sens inné de l'ordre, ils nécessitent des mécanismes externes pour comprendre la séquence des données. RoPE résout ce problème en encodant la position absolue d'un jeton à l'aide d'une matrice de rotation et en intégrant de manière transparente les dépendances positionnelles relatives dans le attention mechanism, permettant aux modèles de mieux comprendre les relations entre les jetons en fonction de leur distance les uns par rapport aux autres.

Link to this sectionComment fonctionne le Rotary Position Embedding#

Contrairement aux méthodes traditionnelles qui ajoutent un vecteur positionnel fixe à une représentation de jeton, RoPE applique une rotation géométrique aux caractéristiques du jeton dans un espace multidimensionnel. L'angle de cette rotation est directement proportionnel à la position du jeton dans la séquence. Lorsque le modèle calcule le score d'attention entre deux jetons, les propriétés mathématiques de ces rotations garantissent que le score résultant dépend naturellement de la distance relative entre eux. Cette approche permet aux advanced AI systems de maintenir une conscience structurelle robuste sur des context windows beaucoup plus grandes sans nécessiter une mémoire excessive.

Pour comprendre comment cela fonctionne en pratique, les développeurs implémentent souvent RoPE à l'aide de manipulations de tenseurs dans des frameworks like PyTorch. Voici un extrait de code simplifié et exécutable démontrant comment la logique de rotation principale est appliquée aux caractéristiques d'entrée pendant l'entraînement ou l'inférence du modèle :

import torch


def apply_rotary_emb(x, cos, sin):
    # A simplified PyTorch demonstration of applying rotary embeddings
    # Splits the feature dimension and rotates the halves
    half_dim = x.shape[-1] // 2
    x1, x2 = x[..., :half_dim], x[..., half_dim:]

    # Rotate the components to encode relative positional information
    rotated_x = torch.cat((-x2, x1), dim=-1)

    # Combine original features with cosine and sine transformations
    return (x * cos) + (rotated_x * sin)


# Example usage with dummy token features and sinusoidal matrices
dummy_features = torch.randn(2, 10, 64)  # (batch_size, sequence_length, features)
cos, sin = torch.randn(2, 10, 64), torch.randn(2, 10, 64)
embedded_features = apply_rotary_emb(dummy_features, cos, sin)

Link to this sectionApplications réelles de RoPE#

Les plongements rotatifs sont devenus une norme industrielle pour la modélisation de séquences, en particulier dans les tâches avancées de natural language processing (NLP) et les systèmes de vision de pointe.

  1. Large Language Models (LLMs) : RoPE est le mécanisme de codage positionnel fondamental derrière certains des systèmes de génération de texte les plus performants au monde, y compris Meta's LLaMA architecture. En tirant parti de RoPE, ces Large Language Models (LLMs) peuvent traiter des livres entiers ou des bases de code en une seule invite, offrant des sequence extrapolation capabilities inégalées qui se généralisent bien au-delà des longueurs observées pendant l'entraînement.

  2. Vision Transformers et détection d'objets : Dans le domaine de la computer vision, les jetons visuels dérivés de patchs d'images nécessitent une structuration spatiale précise. Alors que les modèles convolutifs comme Ultralytics YOLO26 capturent naturellement des hiérarchies spatiales grâce à des champs récepteurs locaux, les architectures d'auto-attention comme les Vision Transformers intègrent souvent des extensions 2D de type RoPE. Cela aide les pipelines de object detection et d'instance segmentation basés sur des transformers à mieux comprendre le positionnement relatif des éléments visuels, améliorant la précision dans des scènes complexes.

Link to this sectionDifférencier RoPE des plongements de position absolue#

Il est important de distinguer RoPE des absolute position embeddings standards. Les plongements absolus attribuent un vecteur fixe et indépendant à chaque emplacement dans une séquence, ce qui signifie que le modèle doit apprendre indépendamment comment la position 5 se rapporte à la position 10. RoPE, en revanche, intègre le concept de distance directement dans les transformations de jetons. Cette différence fondamentale rend RoPE largement supérieur pour la compréhension de longs documents et les flux de travail en generative AI où les séquences varient considérablement en longueur.

Lors du développement et de la mise à l'échelle de ces architectures massives, la gestion efficace des données et de l'infrastructure est cruciale. Pour une annotation simplifiée des jeux de données, un entraînement dans le cloud et un déploiement dans tous les environnements périphériques, les développeurs s'appuient souvent sur les outils complets fournis par la Ultralytics Platform, qui gère le travail difficile consistant à mettre en production la recherche en vision par ordinateur de pointe. L'utilisation de RoPE conjointement avec les meilleures pratiques de fine-tuning garantit que les pipelines d'IA modernes restent à la fois très précis et robustes sur le plan informatique.

Explore solutions

Real-time AI that works with your team

IA dans la robotique

Équipe tes machines plus intelligentes avec les modèles Ultralytics YOLO. La vision par IA dans la robotique propulse la navigation autonome, la perception, le suivi d'objets et le contrôle en temps réel.

En savoir plus
Real-time AI that works with your team

IA dans la logistique

Simplifie la logistique avec les modèles Ultralytics YOLO. La vision par IA permet l'inspection des colis, le tri, le suivi des véhicules et la surveillance de la sécurité des entrepôts en temps réel.

En savoir plus
Real-time AI that works with your team

IA dans le commerce de détail

Réinvente le commerce de détail avec les modèles Ultralytics YOLO. La vision par IA alimente le suivi des stocks, la surveillance des étagères, la gestion des files d'attente et des informations plus intelligentes sur les clients.

En savoir plus
Real-time AI that works with your team

IA dans la santé

Construis des solutions de santé avec les modèles Ultralytics YOLO. L'IA de vision dans la santé permet une imagerie médicale plus rapide, des diagnostics plus intelligents et une surveillance des patients.

En savoir plus
Real-time AI that works with your team

IA dans la fabrication

Optimise la fabrication avec les modèles Ultralytics YOLO. La vision par IA favorise le contrôle qualité, la détection des défauts, la conformité aux EPI et l'automatisation des chaînes de montage.

En savoir plus
Real-time AI that works with your operation

IA dans l'automobile

Applique la vision par ordinateur dans l'automobile avec les modèles Ultralytics YOLO. L'IA de vision améliore la sécurité routière, l'assistance à la conduite et l'automatisation des véhicules pour des routes plus intelligentes.

En savoir plus
Real-time AI tailored to your operation

IA en agriculture

Intègre l'IA de vision à l'agriculture intelligente avec les modèles Ultralytics YOLO. Optimise la surveillance des cultures, le suivi du bétail et l'agriculture de précision pour des rendements plus élevés et plus intelligents.

En savoir plus
Real-time AI that works with your team

IA dans la robotique

Équipe tes machines plus intelligentes avec les modèles Ultralytics YOLO. La vision par IA dans la robotique propulse la navigation autonome, la perception, le suivi d'objets et le contrôle en temps réel.

En savoir plus
Real-time AI that works with your team

IA dans la logistique

Simplifie la logistique avec les modèles Ultralytics YOLO. La vision par IA permet l'inspection des colis, le tri, le suivi des véhicules et la surveillance de la sécurité des entrepôts en temps réel.

En savoir plus
Real-time AI that works with your team

IA dans le commerce de détail

Réinvente le commerce de détail avec les modèles Ultralytics YOLO. La vision par IA alimente le suivi des stocks, la surveillance des étagères, la gestion des files d'attente et des informations plus intelligentes sur les clients.

En savoir plus
Real-time AI that works with your team

IA dans la santé

Construis des solutions de santé avec les modèles Ultralytics YOLO. L'IA de vision dans la santé permet une imagerie médicale plus rapide, des diagnostics plus intelligents et une surveillance des patients.

En savoir plus
Real-time AI that works with your team

IA dans la fabrication

Optimise la fabrication avec les modèles Ultralytics YOLO. La vision par IA favorise le contrôle qualité, la détection des défauts, la conformité aux EPI et l'automatisation des chaînes de montage.

En savoir plus
Real-time AI that works with your operation

IA dans l'automobile

Applique la vision par ordinateur dans l'automobile avec les modèles Ultralytics YOLO. L'IA de vision améliore la sécurité routière, l'assistance à la conduite et l'automatisation des véhicules pour des routes plus intelligentes.

En savoir plus
Real-time AI tailored to your operation

IA en agriculture

Intègre l'IA de vision à l'agriculture intelligente avec les modèles Ultralytics YOLO. Optimise la surveillance des cultures, le suivi du bétail et l'agriculture de précision pour des rendements plus élevés et plus intelligents.

En savoir plus
Real-time AI that works with your team

IA dans la robotique

Équipe tes machines plus intelligentes avec les modèles Ultralytics YOLO. La vision par IA dans la robotique propulse la navigation autonome, la perception, le suivi d'objets et le contrôle en temps réel.

En savoir plus
Real-time AI that works with your team

IA dans la logistique

Simplifie la logistique avec les modèles Ultralytics YOLO. La vision par IA permet l'inspection des colis, le tri, le suivi des véhicules et la surveillance de la sécurité des entrepôts en temps réel.

En savoir plus
Real-time AI that works with your team

IA dans le commerce de détail

Réinvente le commerce de détail avec les modèles Ultralytics YOLO. La vision par IA alimente le suivi des stocks, la surveillance des étagères, la gestion des files d'attente et des informations plus intelligentes sur les clients.

En savoir plus
Real-time AI that works with your team

IA dans la santé

Construis des solutions de santé avec les modèles Ultralytics YOLO. L'IA de vision dans la santé permet une imagerie médicale plus rapide, des diagnostics plus intelligents et une surveillance des patients.

En savoir plus
Real-time AI that works with your team

IA dans la fabrication

Optimise la fabrication avec les modèles Ultralytics YOLO. La vision par IA favorise le contrôle qualité, la détection des défauts, la conformité aux EPI et l'automatisation des chaînes de montage.

En savoir plus
Real-time AI that works with your operation

IA dans l'automobile

Applique la vision par ordinateur dans l'automobile avec les modèles Ultralytics YOLO. L'IA de vision améliore la sécurité routière, l'assistance à la conduite et l'automatisation des véhicules pour des routes plus intelligentes.

En savoir plus
Real-time AI tailored to your operation

IA en agriculture

Intègre l'IA de vision à l'agriculture intelligente avec les modèles Ultralytics YOLO. Optimise la surveillance des cultures, le suivi du bétail et l'agriculture de précision pour des rendements plus élevés et plus intelligents.

En savoir plus

Construisons ensemble le futur de l'IA !

Commence ton aventure avec le futur de l'apprentissage automatique