Встречай YOLO26: ИИ компьютерного зрения нового поколения.
Ultralytics
Назад к глоссарию Ultralytics

Rotary Position Embedding (RoPE)

Изучи, как вращательное позиционное встраивание (RoPE) улучшает трансформеры путем кодирования относительных позиций. Узнай его роль в LLM и визуальных задачах Ultralytics YOLO26.

Rotary Position Embedding (RoPE) — это высокоэффективная методика, используемая в современных архитектурах нейронных сетей для внедрения позиционной информации в эмбеддинги токенов. В моделях глубокого обучения, таких как transformers, входные токены обрабатываются одновременно, а не последовательно. Поскольку таким моделям не хватает встроенного чувства порядка, им требуются внешние механизмы для понимания последовательности данных. RoPE решает эту задачу, кодируя абсолютную позицию токена с помощью матрицы поворота и органично интегрируя относительные позиционные зависимости в attention mechanism, что позволяет моделям лучше понимать взаимосвязи между токенами на основе расстояния между ними.

Link to this sectionКак работает Rotary Position Embedding#

В отличие от традиционных методов, которые добавляют фиксированный позиционный вектор к представлению токена, RoPE применяет геометрический поворот к признакам токена в многомерном пространстве. Угол этого поворота прямо пропорционален позиции токена в последовательности. Когда модель вычисляет оценку внимания (attention score) между двумя токенами, математические свойства этих поворотов гарантируют, что итоговая оценка естественным образом зависит от относительного расстояния между ними. Такой подход позволяет advanced AI systems поддерживать надежную структурную осведомленность в гораздо более крупных context windows без необходимости чрезмерного использования памяти.

Чтобы понять, как это работает на практике, разработчики часто реализуют RoPE, используя манипуляции с тензорами в frameworks like PyTorch. Ниже приведен упрощенный рабочий фрагмент кода, демонстрирующий, как базовая логика поворота применяется к входным признакам во время обучения модели или инференса:

import torch


def apply_rotary_emb(x, cos, sin):
    # A simplified PyTorch demonstration of applying rotary embeddings
    # Splits the feature dimension and rotates the halves
    half_dim = x.shape[-1] // 2
    x1, x2 = x[..., :half_dim], x[..., half_dim:]

    # Rotate the components to encode relative positional information
    rotated_x = torch.cat((-x2, x1), dim=-1)

    # Combine original features with cosine and sine transformations
    return (x * cos) + (rotated_x * sin)


# Example usage with dummy token features and sinusoidal matrices
dummy_features = torch.randn(2, 10, 64)  # (batch_size, sequence_length, features)
cos, sin = torch.randn(2, 10, 64), torch.randn(2, 10, 64)
embedded_features = apply_rotary_emb(dummy_features, cos, sin)

Link to this sectionРеальные применения RoPE#

Ротационные эмбеддинги стали отраслевым стандартом для моделирования последовательностей, особенно в передовых задачах natural language processing (NLP) и современных системах компьютерного зрения.

  1. Large Language Models (LLMs): RoPE является фундаментальным механизмом позиционного кодирования, лежащим в основе некоторых из самых мощных в мире систем генерации текста, включая Meta's LLaMA architecture. Используя RoPE, эти Large Language Models (LLMs) могут обрабатывать целые книги или кодовые базы в рамках одного промпта, предлагая непревзойденные sequence extrapolation capabilities, которые хорошо обобщаются на длину, превышающую ту, что была видна во время обучения.

  2. Vision Transformers и детекция объектов: В области computer vision визуальные токены, полученные из патчей изображений, требуют точной пространственной структуризации. В то время как сверточные модели, такие как Ultralytics YOLO26, естественным образом улавливают пространственные иерархии через локальные рецептивные поля, архитектуры самовнимания, такие как Vision Transformers, часто интегрируют 2D-расширения типа RoPE. Это помогает конвейерам object detection и instance segmentation на базе трансформеров лучше понимать относительное расположение визуальных элементов, повышая точность в сложных сценах.

Link to this sectionОтличие RoPE от абсолютных позиционных эмбеддингов#

Важно отличать RoPE от стандартных absolute position embeddings. Абсолютные эмбеддинги назначают фиксированный независимый вектор для каждого слота в последовательности, что означает, что модель должна независимо изучать, как позиция 5 соотносится с позицией 10. RoPE, с другой стороны, «вшивает» понятие расстояния непосредственно в трансформации токенов. Это фундаментальное различие делает RoPE значительно более предпочтительным для понимания длинных документов и рабочих процессов generative AI, где длина последовательностей сильно варьируется.

При разработке и масштабировании таких огромных архитектур крайне важно эффективно управлять данными и инфраструктурой. Для оптимизации аннотирования наборов данных, облачного обучения и развертывания во всех граничных (edge) средах разработчики часто полагаются на комплексные инструменты, предоставляемые Ultralytics Platform, которая берет на себя всю сложную работу по внедрению передовых исследований в области компьютерного зрения в производство. Использование RoPE в сочетании с лучшими практиками fine-tuning гарантирует, что современные AI-конвейеры останутся как высокоточными, так и вычислительно надежными.

Explore solutions

Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.

Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.

Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.

Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.

Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.

Узнать больше
Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.

Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.

Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.

Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.

Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.

Узнать больше
Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.

Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.

Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.

Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.

Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.

Узнать больше

Давай строить будущее ИИ вместе!

Начни свой путь в будущее машинного обучения