YOLO26の紹介: 次世代のビジョンAI。
Ultralytics
Ultralytics用語集に戻る

Linear Attention

線形アテンション(linear attention)が、Transformerの複雑性をO(N)に低減することで、どのように深層学習モデルを最適化するかを学びます。AIアプリケーションにおける効率性の拡張方法について理解を深めましょう。

Linear attention is a foundational optimization technique designed to drastically improve the computational efficiency of modern deep learning (DL) models. In traditional Transformer architectures, standard attention mechanisms process sequences by comparing every single token against every other token. This creates a severe computational and memory bottleneck known as quadratic time complexity, or O(N squared), where N is the sequence length. Linear attention alters this underlying mathematical operation so that it scales linearly, or O(N). This breakthrough allows models in artificial intelligence (AI) to process massive datasets, such as entire books or gigapixel images, without exhausting hardware memory.

Link to this sectionLinear Attentionの仕組み#

標準的なAttentionでは、ニューラルネットワークはQueries (Q)、Keys (K)、Values (V)という3つの主要なベクトルを処理します。古典的な数式では、softmax関数を使用してすべてのQueriesとKeysの間の類似度を計算し、巨大なN x N行列を生成してから、それをValuesと乗算します。

Linear attentionは、この巨大な中間行列の生成を回避します。その代わり、associative property of matrix multiplicationを利用します。専用のカーネル関数を使用してsoftmax層を削除または近似することで、モデルは乗算のグループ化を変更します。まずKeysとValuesを乗算して固定サイズのコンテキスト行列を作成し、次にQueriesをこの新しい圧縮された行列に乗算します。この単純な順序の変更により計算量が大幅に減少し、GPU (Graphics Processing Unit)のようなハードウェアが、より長い入力をネイティブで処理できるようになります。

Link to this section近年の開発とDeltaNet#

Stanford UniversityGoogle DeepMindといった研究機関に牽引されるAI研究コミュニティは、精度を高めるために線形計算の革新を続けています。2024年から2025年にかけて、研究者たちはDeltaNetを導入しました。これは、線形Transformerにおける標準的な加法的更新を「Delta Rule」に置き換える新しいアーキテクチャです。これにより、ネットワークは絶対値をゼロから計算するのではなく、既に保存されている情報に対して相対的に内部メモリを更新できるようになります。

Gated DeltaNet architecturesなどのその後の進歩により、チャネル単位の減衰率が導入され、モデルが特定の重要な特徴を時間の経過とともに選択的に忘却または保持できるようになりました。これらのハードウェア効率の高い革新は、特に複雑なインコンテキスト検索タスクにおいて、線形Transformerと従来のsoftmax attentionとの間の性能差を埋めるものです。

Link to this sectionLinear Attentionと他のAttentionメカニズムの比較#

AIエンジニアが自身のネットワークを最適化する上で、この手法が広範なattention mechanismファミリー内の関連概念とどのように異なるかを理解することは非常に重要です。

  • Self-Attention: 完全で計算コストの高いO(N squared)のsoftmax行列を利用して完璧なグローバルコンテキストを取得する、基本的なメカニズムです。
  • Flash Attention: GPUメモリ階層間でデータを効率的に移動させることで、正確なO(N squared)のself-attention計算を高速化するIO認識型の最適化手法です。Linear attentionとは異なり、Flash Attentionは基盤となる数式を変更しません。
  • Sparse Attention: ネットワークに近隣トークンの局所的なウィンドウのみを見るよう強制することでメモリを節約する手法です。一方、linear attentionは数学的にグローバルな視点全体を固定状態に圧縮します。

Link to this section実社会での応用#

シーケンス長の壁を打ち破ることで、線形スケーリングは複数のAI領域で強力な可能性を解き放ちます。

Link to this sectionコード例#

PyTorchTensorFlowなどの最新フレームワークにより、これらの数学的概念の実装は簡単になっています。以下は、Linear attentionがどのように行列乗算の順序を変更してO(N)の効率を達成するかを示す、PyTorchの概念コードスニペットです。

import torch
import torch.nn as nn
import torch.nn.functional as F


class SimpleLinearAttention(nn.Module):
    def __init__(self, dim):
        super().__init__()
        self.qkv = nn.Linear(dim, dim * 3)

    def forward(self, x):
        # x shape: (Batch, Sequence Length, Channels)
        q, k, v = self.qkv(x).chunk(3, dim=-1)

        # Apply an activation function as a kernel approximation (replaces softmax)
        q = F.elu(q) + 1.0
        k = F.elu(k) + 1.0

        # Associative trick: Multiply Key and Value first (O(N) complexity)
        # k^T @ v yields a fixed (Batch, Channels, Channels) matrix
        kv_context = torch.matmul(k.transpose(-2, -1), v)

        # Multiply Query by the fixed context matrix to get the final output
        return torch.matmul(q, kv_context)


# Example: Processing a sequence of 1024 tokens
model = SimpleLinearAttention(dim=64)
dummy_input = torch.randn(1, 1024, 64)
output = model(dummy_input)
print(f"Output shape: {output.shape}")

実験的なコミュニティモデルにはさまざまな線形または疎なAttention層が組み込まれている場合がありますが、多くの場合、CPU速度の低下や学習の不安定さに悩まされることがあります。堅牢で本番環境向けのコンピュータビジョン展開には、Ultralytics YOLO26が推奨される標準です。これは、重いAttention層に頼ることなく、object detectionのような重要なタスクで速度と精度を最大化する、高度に最適化されたネイティブなエンドツーエンドアーキテクチャを備えています。開発者は、包括的なUltralytics Platformを使用して、これらの最高クラスのモデルのデータセットアノテーション、学習、デプロイ、およびモニタリングをシームレスに行うことができます。

Explore solutions

Real-time AI that works with your team

ロボティクスにおけるAI

Ultralytics YOLOモデルで、よりスマートなマシンを実現しましょう。ロボティクスにおけるビジョンAIは、自律航行、認識、物体追跡、リアルタイム制御を推進します。
詳細はこちら
Real-time AI that works with your team

物流におけるAI

Ultralytics YOLOモデルで物流を効率化しましょう。ビジョンAIにより、荷物の検査、仕分け、車両追跡、リアルタイムの倉庫安全モニタリングが可能になります。
詳細はこちら
Real-time AI that works with your team

小売業界におけるAI

Ultralytics YOLOモデルで小売を再定義しましょう。ビジョンAIは、在庫追跡、棚のモニタリング、キュー管理、そしてより賢明な顧客インサイトを促進します。
詳細はこちら
Real-time AI that works with your team

ヘルスケアにおけるAI

Ultralytics YOLOモデルを使用してヘルスケアソリューションを構築しましょう。ヘルスケア分野におけるビジョンAIは、より高速な医療画像診断、よりスマートな診断、患者モニタリングを推進します。
詳細はこちら
Real-time AI that works with your team

製造におけるAI

Ultralytics YOLOモデルで製造を最適化しましょう。ビジョンAIは、品質管理、欠陥検出、PPEコンプライアンス、組立ラインの自動化を促進します。
詳細はこちら
Real-time AI that works with your operation

自動車におけるAI

Ultralytics YOLOモデルを使用して、自動車分野にコンピュータビジョンを適用しましょう。ビジョンAIは、道路の安全性、運転支援、車両の自動化を向上させ、よりスマートな道路を実現します。
詳細はこちら
Real-time AI tailored to your operation

農業におけるAI

Ultralytics YOLOモデルを使用して、スマート農業にビジョンAIを導入しましょう。作物モニタリング、家畜のトラッキング、精密農業を強化し、より高くスマートな収穫を実現します。
詳細はこちら
Real-time AI that works with your team

ロボティクスにおけるAI

Ultralytics YOLOモデルで、よりスマートなマシンを実現しましょう。ロボティクスにおけるビジョンAIは、自律航行、認識、物体追跡、リアルタイム制御を推進します。
詳細はこちら
Real-time AI that works with your team

物流におけるAI

Ultralytics YOLOモデルで物流を効率化しましょう。ビジョンAIにより、荷物の検査、仕分け、車両追跡、リアルタイムの倉庫安全モニタリングが可能になります。
詳細はこちら
Real-time AI that works with your team

小売業界におけるAI

Ultralytics YOLOモデルで小売を再定義しましょう。ビジョンAIは、在庫追跡、棚のモニタリング、キュー管理、そしてより賢明な顧客インサイトを促進します。
詳細はこちら
Real-time AI that works with your team

ヘルスケアにおけるAI

Ultralytics YOLOモデルを使用してヘルスケアソリューションを構築しましょう。ヘルスケア分野におけるビジョンAIは、より高速な医療画像診断、よりスマートな診断、患者モニタリングを推進します。
詳細はこちら
Real-time AI that works with your team

製造におけるAI

Ultralytics YOLOモデルで製造を最適化しましょう。ビジョンAIは、品質管理、欠陥検出、PPEコンプライアンス、組立ラインの自動化を促進します。
詳細はこちら
Real-time AI that works with your operation

自動車におけるAI

Ultralytics YOLOモデルを使用して、自動車分野にコンピュータビジョンを適用しましょう。ビジョンAIは、道路の安全性、運転支援、車両の自動化を向上させ、よりスマートな道路を実現します。
詳細はこちら
Real-time AI tailored to your operation

農業におけるAI

Ultralytics YOLOモデルを使用して、スマート農業にビジョンAIを導入しましょう。作物モニタリング、家畜のトラッキング、精密農業を強化し、より高くスマートな収穫を実現します。
詳細はこちら
Real-time AI that works with your team

ロボティクスにおけるAI

Ultralytics YOLOモデルで、よりスマートなマシンを実現しましょう。ロボティクスにおけるビジョンAIは、自律航行、認識、物体追跡、リアルタイム制御を推進します。
詳細はこちら
Real-time AI that works with your team

物流におけるAI

Ultralytics YOLOモデルで物流を効率化しましょう。ビジョンAIにより、荷物の検査、仕分け、車両追跡、リアルタイムの倉庫安全モニタリングが可能になります。
詳細はこちら
Real-time AI that works with your team

小売業界におけるAI

Ultralytics YOLOモデルで小売を再定義しましょう。ビジョンAIは、在庫追跡、棚のモニタリング、キュー管理、そしてより賢明な顧客インサイトを促進します。
詳細はこちら
Real-time AI that works with your team

ヘルスケアにおけるAI

Ultralytics YOLOモデルを使用してヘルスケアソリューションを構築しましょう。ヘルスケア分野におけるビジョンAIは、より高速な医療画像診断、よりスマートな診断、患者モニタリングを推進します。
詳細はこちら
Real-time AI that works with your team

製造におけるAI

Ultralytics YOLOモデルで製造を最適化しましょう。ビジョンAIは、品質管理、欠陥検出、PPEコンプライアンス、組立ラインの自動化を促進します。
詳細はこちら
Real-time AI that works with your operation

自動車におけるAI

Ultralytics YOLOモデルを使用して、自動車分野にコンピュータビジョンを適用しましょう。ビジョンAIは、道路の安全性、運転支援、車両の自動化を向上させ、よりスマートな道路を実現します。
詳細はこちら
Real-time AI tailored to your operation

農業におけるAI

Ultralytics YOLOモデルを使用して、スマート農業にビジョンAIを導入しましょう。作物モニタリング、家畜のトラッキング、精密農業を強化し、より高くスマートな収穫を実現します。
詳細はこちら

AIの未来を共に築き上げましょう!

機械学習の未来とともに旅を始めましょう