Conoce YOLO26: IA de visión de nueva generación.
Ultralytics
Volver al glosario de Ultralytics

Rotary Position Embedding (RoPE)

Explora cómo la incrustación de posición rotatoria (RoPE) mejora los Transformers al codificar posiciones relativas. Aprende su papel en los LLM y las tareas de visión con Ultralytics YOLO26.

Rotary Position Embedding (RoPE) es una técnica altamente eficaz utilizada en arquitecturas modernas de redes neuronales para inyectar información posicional en las incrustaciones (embeddings) de tokens. En modelos de aprendizaje profundo como transformers, los tokens de entrada se procesan de forma simultánea en lugar de secuencial. Debido a que estos modelos carecen de un sentido de orden inherente, requieren mecanismos externos para comprender la secuencia de los datos. RoPE resuelve esto codificando la posición absoluta de un token mediante una matriz de rotación e integrando sin problemas las dependencias posicionales relativas en el attention mechanism, lo que permite a los modelos comprender mejor las relaciones entre tokens en función de su distancia entre sí.

Link to this sectionCómo funciona Rotary Position Embedding#

A diferencia de los métodos tradicionales que añaden un vector posicional fijo a una representación de token, RoPE aplica una rotación geométrica a las características del token en un espacio multidimensional. El ángulo de esta rotación es directamente proporcional a la posición del token en la secuencia. Cuando el modelo calcula la puntuación de atención entre dos tokens, las propiedades matemáticas de estas rotaciones garantizan que la puntuación resultante dependa naturalmente de la distancia relativa entre ellos. Este enfoque permite a los advanced AI systems mantener una conciencia estructural robusta sobre context windows mucho más grandes sin requerir una memoria excesiva.

Para entender cómo funciona esto en la práctica, los desarrolladores suelen implementar RoPE mediante manipulaciones de tensores en frameworks like PyTorch. A continuación, se muestra un fragmento de código simplificado y ejecutable que demuestra cómo se aplica la lógica de rotación central a las características de entrada durante el entrenamiento o la inferencia del modelo:

import torch


def apply_rotary_emb(x, cos, sin):
    # A simplified PyTorch demonstration of applying rotary embeddings
    # Splits the feature dimension and rotates the halves
    half_dim = x.shape[-1] // 2
    x1, x2 = x[..., :half_dim], x[..., half_dim:]

    # Rotate the components to encode relative positional information
    rotated_x = torch.cat((-x2, x1), dim=-1)

    # Combine original features with cosine and sine transformations
    return (x * cos) + (rotated_x * sin)


# Example usage with dummy token features and sinusoidal matrices
dummy_features = torch.randn(2, 10, 64)  # (batch_size, sequence_length, features)
cos, sin = torch.randn(2, 10, 64), torch.randn(2, 10, 64)
embedded_features = apply_rotary_emb(dummy_features, cos, sin)

Link to this sectionAplicaciones reales de RoPE#

Las incrustaciones rotatorias (rotary embeddings) se han convertido en un estándar industrial para el modelado de secuencias, particularmente en tareas avanzadas de natural language processing (NLP) y sistemas de visión de última generación.

  1. Large Language Models (LLMs): RoPE es el mecanismo de codificación posicional fundamental detrás de algunos de los sistemas de generación de texto más capaces del mundo, incluida la Meta's LLaMA architecture. Al aprovechar RoPE, estos Large Language Models (LLMs) pueden procesar libros completos o bases de código en un solo prompt, ofreciendo sequence extrapolation capabilities inigualables que se generalizan bien más allá de las longitudes observadas durante el entrenamiento.

  2. Vision Transformers y detección de objetos: En el ámbito de la computer vision, los tokens visuales derivados de parches de imagen requieren una estructuración espacial precisa. Mientras que modelos convolucionales como Ultralytics YOLO26 capturan naturalmente jerarquías espaciales a través de campos receptivos locales, las arquitecturas de autoatención como Vision Transformers a menudo integran extensiones 2D similares a RoPE. Esto ayuda a que las tuberías de object detection y instance segmentation basadas en transformers comprendan mejor el posicionamiento relativo de los elementos visuales, mejorando la precisión en escenas complejas.

Link to this sectionDiferenciación de RoPE respecto a las incrustaciones de posición absoluta (Absolute Position Embeddings)#

Es importante distinguir RoPE de los absolute position embeddings estándar. Las incrustaciones absolutas asignan un vector fijo e independiente a cada ranura en una secuencia, lo que significa que el modelo debe aprender de forma independiente cómo se relaciona la posición 5 con la posición 10. RoPE, por otro lado, integra el concepto de distancia directamente en las transformaciones de tokens. Esta diferencia fundamental hace que RoPE sea muy superior para la comprensión de documentos largos y flujos de trabajo de generative AI donde las secuencias varían drásticamente en longitud.

Al desarrollar y escalar estas arquitecturas masivas, gestionar los datos y la infraestructura de manera eficiente es fundamental. Para la anotación de conjuntos de datos, el entrenamiento en la nube y la implementación en todos los entornos perimetrales de forma optimizada, los desarrolladores suelen confiar en las herramientas integrales proporcionadas por la Ultralytics Platform, que se encarga del trabajo pesado de llevar la investigación de visión artificial de vanguardia a producción. Utilizar RoPE junto con las mejores prácticas de fine-tuning garantiza que los flujos de trabajo de IA modernos sigan siendo altamente precisos y robustos desde el punto de vista computacional.

Explore solutions

Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.

Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.

Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.

Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.

Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.

Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.

Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.

Más información
Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.

Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.

Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.

Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.

Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.

Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.

Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.

Más información
Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.

Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.

Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.

Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.

Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.

Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.

Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.

Más información

¡Construyamos juntos el futuro de la IA!

Comienza tu viaje con el futuro del aprendizaje automático