YOLO26の紹介: 次世代のビジョンAI。
Ultralytics
Ultralytics用語集に戻る

Rotary Position Embedding (RoPE)

回転位置埋め込み(RoPE)が相対位置をエンコードすることで、どのようにTransformerを強化するかを解説します。LLMおよびUltralytics YOLO26のビジョンタスクにおける役割を学びましょう。

Rotary Position Embedding (RoPE)は、現代のニューラルネットワークアーキテクチャにおいて、トークンエンベディングに位置情報を注入するために使用される非常に効果的な手法です。transformersのようなディープラーニングモデルでは、入力トークンは逐次的ではなく同時に処理されます。これらのモデルは本来的な順序の概念を持たないため、データのシーケンスを理解するために外部のメカニズムを必要とします。RoPEは、回転行列を使用してトークンの絶対位置をエンコードし、attention mechanismに相対的な位置依存関係をシームレスに統合することでこれを解決し、モデルがトークン間の距離に基づいてトークン同士の関係をより深く理解できるようにします。

Link to this sectionRotary Position Embeddingの仕組み#

トークン表現に固定の位置ベクトルを加算する従来の手法とは異なり、RoPEは多次元空間においてトークンの特徴量に幾何学的な回転を適用します。この回転角は、シーケンス内でのトークンの位置に直接比例します。モデルが2つのトークン間のアテンションスコアを計算する際、これらの回転の数学的特性により、結果として得られるスコアが自然にそれらの間の相対距離に依存するようになります。このアプローチにより、advanced AI systemsは、過剰なメモリを消費することなく、より広範なcontext windowsにわたって堅牢な構造的認識を維持できます。

これが実際にどのように機能するかを理解するために、開発者はframeworks like PyTorchでのテンソル操作を使用してRoPEを実装することがよくあります。以下は、モデルのトレーニングまたは推論中に入力特徴量に対してコアとなる回転ロジックがどのように適用されるかを示す、簡略化された実行可能なコードスニペットです。

import torch


def apply_rotary_emb(x, cos, sin):
    # A simplified PyTorch demonstration of applying rotary embeddings
    # Splits the feature dimension and rotates the halves
    half_dim = x.shape[-1] // 2
    x1, x2 = x[..., :half_dim], x[..., half_dim:]

    # Rotate the components to encode relative positional information
    rotated_x = torch.cat((-x2, x1), dim=-1)

    # Combine original features with cosine and sine transformations
    return (x * cos) + (rotated_x * sin)


# Example usage with dummy token features and sinusoidal matrices
dummy_features = torch.randn(2, 10, 64)  # (batch_size, sequence_length, features)
cos, sin = torch.randn(2, 10, 64), torch.randn(2, 10, 64)
embedded_features = apply_rotary_emb(dummy_features, cos, sin)

Link to this sectionRoPEの実際のアプリケーション#

Rotary embeddingは、特に高度なnatural language processing (NLP)タスクや最先端のビジョンシステムにおいて、シーケンスモデリングの業界標準となっています。

  1. Large Language Models (LLMs): RoPEは、Meta's LLaMA architectureを含む、世界で最も高性能なテキスト生成システムを支える基礎的な位置エンコーディングメカニズムです。RoPEを活用することで、これらのLarge Language Models (LLMs)は書籍一冊分やコードベース全体を単一のプロンプトで処理することができ、学習時に見られた長さを大きく超えて汎用化できる、比類のないsequence extrapolation capabilitiesを提供します。

  2. Vision Transformersおよび物体検出: computer visionの領域では、画像パッチから得られるビジュアルトークンに正確な空間構造が必要です。Ultralytics YOLO26のような畳み込みモデルは局所的な受容野を通じて空間階層を自然に捉えますが、Vision Transformersのような自己注意アーキテクチャでは、しばしばRoPEのような2D拡張が統合されます。これは、transformerベースのobject detectionおよびinstance segmentationパイプラインが視覚要素の相対的な位置関係をよりよく理解するのに役立ち、複雑なシーンにおける精度を向上させます。

Link to this sectionRoPEと絶対位置エンコーディングの区別#

RoPEを標準的なabsolute position embeddingsと区別することが重要です。絶対エンコーディングはシーケンス内の各スロットに固定の独立したベクトルを割り当てますが、これはモデルが位置5と位置10の関係を個別に学習しなければならないことを意味します。一方でRoPEは、距離の概念をトークンの変換処理に直接組み込みます。この根本的な違いにより、RoPEは長文の理解や、シーケンスの長さが大幅に変動するgenerative AIワークフローにおいて圧倒的に優れています。

これらの巨大なアーキテクチャを開発・スケーリングする際には、データとインフラストラクチャを効率的に管理することが極めて重要です。合理化されたデータセットのアノテーション、クラウドトレーニング、およびあらゆるエッジ環境へのデプロイメントのために、開発者はUltralytics Platformが提供する包括的なツール群に頼ることが多く、これにより最先端のコンピュータビジョン研究を本番環境へ移行するための重い作業が軽減されます。fine-tuningのベストプラクティスと組み合わせてRoPEを利用することで、現代のAIパイプラインは高い精度と計算上の堅牢性を維持できます。

Explore solutions

Real-time AI that works with your team

ロボティクスにおけるAI

Ultralytics YOLOモデルで、よりスマートなマシンを実現しましょう。ロボティクスにおけるビジョンAIは、自律航行、認識、物体追跡、リアルタイム制御を推進します。

詳細はこちら
Real-time AI that works with your team

物流におけるAI

Ultralytics YOLOモデルで物流を効率化しましょう。ビジョンAIにより、荷物の検査、仕分け、車両追跡、リアルタイムの倉庫安全モニタリングが可能になります。

詳細はこちら
Real-time AI that works with your team

小売業界におけるAI

Ultralytics YOLOモデルで小売を再定義しましょう。ビジョンAIは、在庫追跡、棚のモニタリング、キュー管理、そしてより賢明な顧客インサイトを促進します。

詳細はこちら
Real-time AI that works with your team

ヘルスケアにおけるAI

Ultralytics YOLOモデルを使用してヘルスケアソリューションを構築しましょう。ヘルスケア分野におけるビジョンAIは、より高速な医療画像診断、よりスマートな診断、患者モニタリングを推進します。

詳細はこちら
Real-time AI that works with your team

製造におけるAI

Ultralytics YOLOモデルで製造を最適化しましょう。ビジョンAIは、品質管理、欠陥検出、PPEコンプライアンス、組立ラインの自動化を促進します。

詳細はこちら
Real-time AI that works with your operation

自動車におけるAI

Ultralytics YOLOモデルを使用して、自動車分野にコンピュータビジョンを適用しましょう。ビジョンAIは、道路の安全性、運転支援、車両の自動化を向上させ、よりスマートな道路を実現します。

詳細はこちら
Real-time AI tailored to your operation

農業におけるAI

Ultralytics YOLOモデルを使用して、スマート農業にビジョンAIを導入しましょう。作物モニタリング、家畜のトラッキング、精密農業を強化し、より高くスマートな収穫を実現します。

詳細はこちら
Real-time AI that works with your team

ロボティクスにおけるAI

Ultralytics YOLOモデルで、よりスマートなマシンを実現しましょう。ロボティクスにおけるビジョンAIは、自律航行、認識、物体追跡、リアルタイム制御を推進します。

詳細はこちら
Real-time AI that works with your team

物流におけるAI

Ultralytics YOLOモデルで物流を効率化しましょう。ビジョンAIにより、荷物の検査、仕分け、車両追跡、リアルタイムの倉庫安全モニタリングが可能になります。

詳細はこちら
Real-time AI that works with your team

小売業界におけるAI

Ultralytics YOLOモデルで小売を再定義しましょう。ビジョンAIは、在庫追跡、棚のモニタリング、キュー管理、そしてより賢明な顧客インサイトを促進します。

詳細はこちら
Real-time AI that works with your team

ヘルスケアにおけるAI

Ultralytics YOLOモデルを使用してヘルスケアソリューションを構築しましょう。ヘルスケア分野におけるビジョンAIは、より高速な医療画像診断、よりスマートな診断、患者モニタリングを推進します。

詳細はこちら
Real-time AI that works with your team

製造におけるAI

Ultralytics YOLOモデルで製造を最適化しましょう。ビジョンAIは、品質管理、欠陥検出、PPEコンプライアンス、組立ラインの自動化を促進します。

詳細はこちら
Real-time AI that works with your operation

自動車におけるAI

Ultralytics YOLOモデルを使用して、自動車分野にコンピュータビジョンを適用しましょう。ビジョンAIは、道路の安全性、運転支援、車両の自動化を向上させ、よりスマートな道路を実現します。

詳細はこちら
Real-time AI tailored to your operation

農業におけるAI

Ultralytics YOLOモデルを使用して、スマート農業にビジョンAIを導入しましょう。作物モニタリング、家畜のトラッキング、精密農業を強化し、より高くスマートな収穫を実現します。

詳細はこちら
Real-time AI that works with your team

ロボティクスにおけるAI

Ultralytics YOLOモデルで、よりスマートなマシンを実現しましょう。ロボティクスにおけるビジョンAIは、自律航行、認識、物体追跡、リアルタイム制御を推進します。

詳細はこちら
Real-time AI that works with your team

物流におけるAI

Ultralytics YOLOモデルで物流を効率化しましょう。ビジョンAIにより、荷物の検査、仕分け、車両追跡、リアルタイムの倉庫安全モニタリングが可能になります。

詳細はこちら
Real-time AI that works with your team

小売業界におけるAI

Ultralytics YOLOモデルで小売を再定義しましょう。ビジョンAIは、在庫追跡、棚のモニタリング、キュー管理、そしてより賢明な顧客インサイトを促進します。

詳細はこちら
Real-time AI that works with your team

ヘルスケアにおけるAI

Ultralytics YOLOモデルを使用してヘルスケアソリューションを構築しましょう。ヘルスケア分野におけるビジョンAIは、より高速な医療画像診断、よりスマートな診断、患者モニタリングを推進します。

詳細はこちら
Real-time AI that works with your team

製造におけるAI

Ultralytics YOLOモデルで製造を最適化しましょう。ビジョンAIは、品質管理、欠陥検出、PPEコンプライアンス、組立ラインの自動化を促進します。

詳細はこちら
Real-time AI that works with your operation

自動車におけるAI

Ultralytics YOLOモデルを使用して、自動車分野にコンピュータビジョンを適用しましょう。ビジョンAIは、道路の安全性、運転支援、車両の自動化を向上させ、よりスマートな道路を実現します。

詳細はこちら
Real-time AI tailored to your operation

農業におけるAI

Ultralytics YOLOモデルを使用して、スマート農業にビジョンAIを導入しましょう。作物モニタリング、家畜のトラッキング、精密農業を強化し、より高くスマートな収穫を実現します。

詳細はこちら

AIの未来を共に築き上げましょう!

機械学習の未来とともに旅を始めましょう