Triff YOLO26: Vision-KI der nächsten Generation.
Ultralytics
Zurück zum Ultralytics Glossar

Linear Attention

Entdecke, wie lineare Attention Deep-Learning-Modelle optimiert, indem sie die Komplexität von Transformer auf O(N) reduziert. Erfahre, wie sie die Effizienz für KI-Anwendungen skaliert.

Lineare Attention ist eine grundlegende Optimierungstechnik, die dazu entwickelt wurde, die computational efficiency moderner deep learning (DL) Modelle drastisch zu verbessern. In traditionellen Transformer architectures verarbeiten Standard-Attention-Mechanismen Sequenzen, indem sie jedes einzelne Token mit jedem anderen Token vergleichen. Dies erzeugt einen schwerwiegenden Rechen- und Speicherengpass, der als quadratic time complexity oder O(N squared) bekannt ist, wobei N die Sequenzlänge darstellt. Lineare Attention verändert diese zugrunde liegende mathematische Operation so, dass sie linear skaliert, also O(N). Dieser Durchbruch ermöglicht es Modellen in der artificial intelligence (AI), riesige Datensätze wie ganze Bücher oder Gigapixel-Bilder zu verarbeiten, ohne den Hardware-Speicher zu erschöpfen.

Link to this sectionWie lineare Attention funktioniert#

Bei der Standard-Attention verarbeiten neuronale Netzwerke drei Hauptvektoren: Queries (Q), Keys (K) und Values (V). Die klassische Formel berechnet die Ähnlichkeit zwischen allen Queries und Keys mithilfe einer softmax Funktion, wodurch eine massive N x N Matrix erzeugt wird, bevor diese mit den Values multipliziert wird.

Lineare Attention umgeht die Erstellung dieser massiven Zwischenmatrix. Stattdessen stützt sie sich auf die associative property of matrix multiplication. Durch das Weglassen oder Approximieren der softmax Schicht unter Verwendung spezialisierter Kernelfunktionen gruppiert das Modell die Multiplikation anders. Es multipliziert zuerst die Keys und Values miteinander, um eine fixgroße Kontextmatrix zu erstellen, und multipliziert dann die Queries mit dieser neuen komprimierten Matrix. Diese einfache Umordnung senkt die Rechenkomplexität erheblich und setzt Hardware wie eine GPU (Graphics Processing Unit) frei, um wesentlich längere Eingaben nativ zu verarbeiten.

Link to this sectionAktuelle Entwicklungen und DeltaNet#

Die KI-Forschungsgemeinschaft, angeführt von Institutionen wie der Stanford University und Technologiegiganten wie Google DeepMind, arbeitet kontinuierlich an linearen Formulierungen, um die Genauigkeit zu steigern. In den Jahren 2024 und 2025 stellten Forscher DeltaNet vor, eine neuartige Architektur, die standardmäßige additive Aktualisierungen in linearen Transformern durch eine „Delta-Regel“ ersetzt. Dies ermöglicht es dem Netzwerk, seinen internen Speicher relativ zu dem bereits Gespeicherten zu aktualisieren, anstatt absolute Werte von Grund auf neu zu berechnen.

Nachfolgende Fortschritte, wie Gated DeltaNet architectures, führen kanalweise Zerfallsraten ein, die es Modellen ermöglichen, spezifische Schlüsselmerkmale im Laufe der Zeit selektiv zu vergessen oder beizubehalten. Diese hardwareeffizienten Innovationen überbrücken die Leistungslücke zwischen linearen Transformern und traditioneller softmax Attention, insbesondere bei komplexen In-Context-Retrieval-Aufgaben.

Link to this sectionLineare Attention vs. andere Attention-Mechanismen#

Zu verstehen, wie sich diese Technik von verwandten Konzepten innerhalb der breiteren attention mechanism Familie unterscheidet, ist für KI-Ingenieure bei der Optimierung ihrer Netzwerke entscheidend:

  • Self-Attention: Der grundlegende Mechanismus, der die vollständige, rechenintensive O(N squared) softmax Matrix nutzt, um einen perfekten globalen Kontext zu erfassen.
  • Flash Attention: Eine IO-bewusste Optimierung, die die exakte O(N squared) Self-Attention-Mathematik beschleunigt, indem Daten effizient zwischen den GPU-Speicherebenen verschoben werden. Im Gegensatz zur linearen Attention ändert Flash Attention nicht die zugrunde liegende mathematische Formel.
  • Sparse Attention: Eine Methode, die Speicher spart, indem sie das Netzwerk zwingt, nur ein lokalisiertes Fenster benachbarter Token zu betrachten, wohingegen die lineare Attention mathematisch den gesamten globalen Blick in einen festen Zustand komprimiert.

Link to this sectionPraxisanwendungen#

Durch das Durchbrechen der Barriere der Sequenzlänge erschließt die lineare Skalierung leistungsstarke Fähigkeiten in mehreren KI-Domänen:

Link to this sectionCode-Beispiel#

Moderne Frameworks wie PyTorch und TensorFlow machen die Implementierung dieser mathematischen Konzepte unkompliziert. Unten ist ein konzeptioneller PyTorch-Schnipsel, der demonstriert, wie lineare Attention die Reihenfolge der Matrixmultiplikation ändert, um eine O(N)-Effizienz zu erreichen.

import torch
import torch.nn as nn
import torch.nn.functional as F


class SimpleLinearAttention(nn.Module):
    def __init__(self, dim):
        super().__init__()
        self.qkv = nn.Linear(dim, dim * 3)

    def forward(self, x):
        # x shape: (Batch, Sequence Length, Channels)
        q, k, v = self.qkv(x).chunk(3, dim=-1)

        # Apply an activation function as a kernel approximation (replaces softmax)
        q = F.elu(q) + 1.0
        k = F.elu(k) + 1.0

        # Associative trick: Multiply Key and Value first (O(N) complexity)
        # k^T @ v yields a fixed (Batch, Channels, Channels) matrix
        kv_context = torch.matmul(k.transpose(-2, -1), v)

        # Multiply Query by the fixed context matrix to get the final output
        return torch.matmul(q, kv_context)


# Example: Processing a sequence of 1024 tokens
model = SimpleLinearAttention(dim=64)
dummy_input = torch.randn(1, 1024, 64)
output = model(dummy_input)
print(f"Output shape: {output.shape}")

Während experimentelle Community-Modelle verschiedene lineare oder sparse Attention-Schichten enthalten können, leiden sie oft unter langsamen CPU-Geschwindigkeiten oder Trainingsinstabilität. Für robuste, produktionsreife Computer-Vision-Bereitstellungen ist Ultralytics YOLO26 der empfohlene Standard. Es bietet eine hochoptimierte, nativ Ende-zu-Ende-Architektur, die Geschwindigkeit und Genauigkeit für kritische Aufgaben wie object detection maximiert, ohne auf schwere Attention-Schichten angewiesen zu sein. Entwickler können Datensätze nahtlos annotieren, trainieren, bereitstellen und diese erstklassigen Modelle mithilfe der umfassenden Ultralytics Platform überwachen.

Explore solutions

Real-time AI that works with your team

KI in der Robotik

Stärke intelligentere Maschinen mit Ultralytics YOLO Modellen. Vision AI in der Robotik treibt autonome Navigation, Wahrnehmung, Objektverfolgung und Echtzeitsteuerung voran.
Erfahre mehr
Real-time AI that works with your team

KI in der Logistik

Optimiere die Logistik mit Ultralytics YOLO-Modellen. Vision AI ermöglicht Paketkontrolle, Sortierung, Fahrzeugverfolgung und Echtzeit-Überwachung der Lagersicherheit.
Erfahre mehr
Real-time AI that works with your team

KI im Einzelhandel

Erfinde den Einzelhandel neu mit Ultralytics YOLO-Modellen. Vision AI fördert Bestandsverfolgung, Regalüberwachung, Warteschlangenmanagement und intelligentere Kundeneinblicke.
Erfahre mehr
Real-time AI that works with your team

KI im Gesundheitswesen

Baue Gesundheitslösungen mit Ultralytics YOLO Modellen. Vision AI im Gesundheitswesen ermöglicht schnellere medizinische Bildgebung, intelligentere Diagnostik und Patientenüberwachung.
Erfahre mehr
Real-time AI that works with your team

KI in der Fertigung

Optimiere die Fertigung mit Ultralytics YOLO-Modellen. Vision AI treibt Qualitätskontrolle, Fehlererkennung, PSA-Einhaltung und die Automatisierung von Montagelinien voran.
Erfahre mehr
Real-time AI that works with your operation

KI in der Automobilbranche

Nutze Computer Vision in der Automobilindustrie mit Ultralytics YOLO Modellen. Vision AI steigert die Verkehrssicherheit, Fahrerassistenz und Fahrzeugautomatisierung für intelligentere Straßen.
Erfahre mehr
Real-time AI tailored to your operation

KI in der Landwirtschaft

Bringe Vision AI mit Ultralytics YOLO Modellen in die smarte Landwirtschaft. Optimiere die Ernteüberwachung, Viehverfolgung und Präzisionslandwirtschaft für höhere, intelligentere Erträge.
Erfahre mehr
Real-time AI that works with your team

KI in der Robotik

Stärke intelligentere Maschinen mit Ultralytics YOLO Modellen. Vision AI in der Robotik treibt autonome Navigation, Wahrnehmung, Objektverfolgung und Echtzeitsteuerung voran.
Erfahre mehr
Real-time AI that works with your team

KI in der Logistik

Optimiere die Logistik mit Ultralytics YOLO-Modellen. Vision AI ermöglicht Paketkontrolle, Sortierung, Fahrzeugverfolgung und Echtzeit-Überwachung der Lagersicherheit.
Erfahre mehr
Real-time AI that works with your team

KI im Einzelhandel

Erfinde den Einzelhandel neu mit Ultralytics YOLO-Modellen. Vision AI fördert Bestandsverfolgung, Regalüberwachung, Warteschlangenmanagement und intelligentere Kundeneinblicke.
Erfahre mehr
Real-time AI that works with your team

KI im Gesundheitswesen

Baue Gesundheitslösungen mit Ultralytics YOLO Modellen. Vision AI im Gesundheitswesen ermöglicht schnellere medizinische Bildgebung, intelligentere Diagnostik und Patientenüberwachung.
Erfahre mehr
Real-time AI that works with your team

KI in der Fertigung

Optimiere die Fertigung mit Ultralytics YOLO-Modellen. Vision AI treibt Qualitätskontrolle, Fehlererkennung, PSA-Einhaltung und die Automatisierung von Montagelinien voran.
Erfahre mehr
Real-time AI that works with your operation

KI in der Automobilbranche

Nutze Computer Vision in der Automobilindustrie mit Ultralytics YOLO Modellen. Vision AI steigert die Verkehrssicherheit, Fahrerassistenz und Fahrzeugautomatisierung für intelligentere Straßen.
Erfahre mehr
Real-time AI tailored to your operation

KI in der Landwirtschaft

Bringe Vision AI mit Ultralytics YOLO Modellen in die smarte Landwirtschaft. Optimiere die Ernteüberwachung, Viehverfolgung und Präzisionslandwirtschaft für höhere, intelligentere Erträge.
Erfahre mehr
Real-time AI that works with your team

KI in der Robotik

Stärke intelligentere Maschinen mit Ultralytics YOLO Modellen. Vision AI in der Robotik treibt autonome Navigation, Wahrnehmung, Objektverfolgung und Echtzeitsteuerung voran.
Erfahre mehr
Real-time AI that works with your team

KI in der Logistik

Optimiere die Logistik mit Ultralytics YOLO-Modellen. Vision AI ermöglicht Paketkontrolle, Sortierung, Fahrzeugverfolgung und Echtzeit-Überwachung der Lagersicherheit.
Erfahre mehr
Real-time AI that works with your team

KI im Einzelhandel

Erfinde den Einzelhandel neu mit Ultralytics YOLO-Modellen. Vision AI fördert Bestandsverfolgung, Regalüberwachung, Warteschlangenmanagement und intelligentere Kundeneinblicke.
Erfahre mehr
Real-time AI that works with your team

KI im Gesundheitswesen

Baue Gesundheitslösungen mit Ultralytics YOLO Modellen. Vision AI im Gesundheitswesen ermöglicht schnellere medizinische Bildgebung, intelligentere Diagnostik und Patientenüberwachung.
Erfahre mehr
Real-time AI that works with your team

KI in der Fertigung

Optimiere die Fertigung mit Ultralytics YOLO-Modellen. Vision AI treibt Qualitätskontrolle, Fehlererkennung, PSA-Einhaltung und die Automatisierung von Montagelinien voran.
Erfahre mehr
Real-time AI that works with your operation

KI in der Automobilbranche

Nutze Computer Vision in der Automobilindustrie mit Ultralytics YOLO Modellen. Vision AI steigert die Verkehrssicherheit, Fahrerassistenz und Fahrzeugautomatisierung für intelligentere Straßen.
Erfahre mehr
Real-time AI tailored to your operation

KI in der Landwirtschaft

Bringe Vision AI mit Ultralytics YOLO Modellen in die smarte Landwirtschaft. Optimiere die Ernteüberwachung, Viehverfolgung und Präzisionslandwirtschaft für höhere, intelligentere Erträge.
Erfahre mehr

Lass uns gemeinsam die Zukunft der KI bauen!

Beginne deine Reise mit der Zukunft des maschinellen Lernens