Triff YOLO26: Vision-KI der nächsten Generation.
Ultralytics
Zurück zum Ultralytics Glossar

Self-Attention

Erforsche die Grundlagen von Self-Attention im Deep Learning. Lerne, wie Query-, Key- und Value-Vektoren Transformer und Ultralytics YOLO26 für überlegene KI antreiben.

Self-Attention ist ein grundlegender Mechanismus im Deep Learning, der es Modellen ermöglicht, die Bedeutung verschiedener Elemente innerhalb einer Eingabesequenz relativ zueinander zu gewichten. Im Gegensatz zu traditionellen Architekturen, die Daten sequenziell verarbeiten oder sich nur auf lokale Umgebungen konzentrieren, erlaubt Self-Attention einem neuronalen Netzwerk, den gesamten Kontext gleichzeitig zu untersuchen. Diese Fähigkeit hilft Systemen dabei, komplexe Beziehungen zwischen weit entfernten Datenteilen zu identifizieren, wie etwa Wörter in einem Satz oder unterschiedliche Bereiche in einem Bild. Sie dient als grundlegender Baustein für die Transformer-Architektur, die massive Fortschritte bei generativer KI und modernen Wahrnehmungssystemen vorangetrieben hat.

Link to this sectionWie Self-Attention funktioniert#

Der Mechanismus ahmt die kognitive Fokussierung nach, indem er jedem Eingabe-Feature ein Gewicht zuweist, das oft als „Attention Score“ bezeichnet wird. Um diese Scores zu berechnen, transformiert das Modell Eingabedaten – typischerweise dargestellt als Embeddings – in drei verschiedene Vektoren: die Query (Abfrage), den Key (Schlüssel) und den Value (Wert).

  • Query (Q): Repräsentiert das aktuelle Element, das relevanten Kontext aus dem Rest der Sequenz sucht.
  • Key (K): Fungiert als Label oder Identifikator für jedes Element in der Sequenz, gegen das die Query abgeglichen wird.
  • Value (V): Enthält den tatsächlichen Informationsgehalt des Elements, das aggregiert werden soll.

Das Modell vergleicht die Query eines Elements mit den Keys aller anderen Elemente, um die Kompatibilität zu bestimmen. Diese Kompatibilitätswerte werden mithilfe einer Softmax-Funktion normalisiert, um wahrscheinlichkeitsähnliche Gewichte zu erzeugen. Diese Gewichte werden dann auf die Values angewendet, wodurch eine kontextreiche Repräsentation entsteht. Dieser Prozess ermöglicht es Large Language Models (LLMs) und Bildverarbeitungssystemen, wichtige Informationen zu priorisieren und gleichzeitig Rauschen herauszufiltern.

Link to this sectionPraxisanwendungen#

Die Vielseitigkeit von Self-Attention hat zu ihrer weiten Verbreitung in verschiedenen Bereichen der Künstlichen Intelligenz (KI) geführt.

  • Natural Language Processing (NLP): Bei Aufgaben wie der maschinellen Übersetzung löst Self-Attention Mehrdeutigkeiten auf, indem Pronomen mit ihren Referenten verknüpft werden. Zum Beispiel verwendet das Modell im Satz „Das Tier überquerte die Straße nicht, weil es zu müde war“ Self-Attention, um „es“ stark mit „Tier“ statt mit „Straße“ zu assoziieren. Dieses Kontextverständnis treibt Tools wie Google Translate an.
  • Globaler Bildkontext: In der Computer Vision (CV) unterteilen Architekturen wie der Vision Transformer (ViT) Bilder in Patches und wenden Self-Attention an, um die Szene global zu verstehen. Dies ist entscheidend für die Objekterkennung in komplexen Umgebungen, in denen die Identifizierung eines Objekts davon abhängt, seine Umgebung zu verstehen.

Link to this sectionUnterscheidung verwandter Begriffe#

Obwohl sie oft neben ähnlichen Konzepten diskutiert werden, haben diese Begriffe unterschiedliche technische Definitionen:

  • Attention-Mechanismus: Die breite Kategorie von Techniken, die es Modellen ermöglichen, sich auf spezifische Datenteile zu konzentrieren. Sie umfasst Cross-Attention, bei der ein Modell eine Sequenz (wie einen Decoder-Output) verwendet, um eine andere Sequenz (wie einen Encoder-Input) abzufragen.
  • Self-Attention: Eine spezifische Art von Attention, bei der Query, Key und Value alle aus derselben Eingabesequenz stammen. Sie wurde entwickelt, um interne Abhängigkeiten innerhalb eines einzelnen Datensatzes zu lernen.
  • Flash Attention: Ein Optimierungsalgorithmus, der von Forschern der Stanford University entwickelt wurde und die Berechnung von Self-Attention auf GPUs wesentlich schneller und speichereffizienter macht, ohne das mathematische Ergebnis zu verändern.

Link to this sectionCode-Beispiel#

Der folgende Python-Ausschnitt zeigt, wie du RTDETR verwendest, einen Transformer-basierten Objektdetektor, der im ultralytics-Paket enthalten ist. Im Gegensatz zu standardmäßigen Convolutional Networks verlässt sich dieses Modell stark auf Self-Attention, um visuelle Merkmale zu verarbeiten.

from ultralytics import RTDETR

# Load the RT-DETR model which utilizes self-attention for detection
model = RTDETR("rtdetr-l.pt")

# Perform inference on an image to detect objects with global context
# Self-attention helps the model understand relationships between distant objects
results = model("https://ultralytics.com/images/bus.jpg")

# Print the number of objects detected
print(f"Detected {len(results[0].boxes)} objects using Transformer attention.")

Link to this sectionEvolution und zukünftige Auswirkungen#

Self-Attention hat das Problem des verschwindenden Gradienten, das frühere Recurrent Neural Networks (RNNs) behinderte, effektiv gelöst und das Training massiver Foundation Models ermöglicht. Obwohl sehr effektiv, wachsen die Rechenkosten der Standard-Self-Attention quadratisch mit der Sequenzlänge. Um dies anzugehen, konzentriert sich die aktuelle Forschung auf effiziente lineare Attention-Mechanismen.

Ultralytics integriert diese Fortschritte in hochmoderne Modelle wie YOLO26, die die Geschwindigkeit von CNNs mit der kontextuellen Kraft von Attention für eine überlegene Echtzeit-Inferenz kombinieren. Diese optimierten Modelle können einfach über die Ultralytics Platform trainiert und bereitgestellt werden, was den Workflow für Entwickler rationalisiert, die die nächste Generation intelligenter Anwendungen aufbauen.

Explore solutions

Real-time AI that works with your team

KI in der Robotik

Stärke intelligentere Maschinen mit Ultralytics YOLO Modellen. Vision AI in der Robotik treibt autonome Navigation, Wahrnehmung, Objektverfolgung und Echtzeitsteuerung voran.
Erfahre mehr
Real-time AI that works with your team

KI in der Logistik

Optimiere die Logistik mit Ultralytics YOLO-Modellen. Vision AI ermöglicht Paketkontrolle, Sortierung, Fahrzeugverfolgung und Echtzeit-Überwachung der Lagersicherheit.
Erfahre mehr
Real-time AI that works with your team

KI im Einzelhandel

Erfinde den Einzelhandel neu mit Ultralytics YOLO-Modellen. Vision AI fördert Bestandsverfolgung, Regalüberwachung, Warteschlangenmanagement und intelligentere Kundeneinblicke.
Erfahre mehr
Real-time AI that works with your team

KI im Gesundheitswesen

Baue Gesundheitslösungen mit Ultralytics YOLO Modellen. Vision AI im Gesundheitswesen ermöglicht schnellere medizinische Bildgebung, intelligentere Diagnostik und Patientenüberwachung.
Erfahre mehr
Real-time AI that works with your team

KI in der Fertigung

Optimiere die Fertigung mit Ultralytics YOLO-Modellen. Vision AI treibt Qualitätskontrolle, Fehlererkennung, PSA-Einhaltung und die Automatisierung von Montagelinien voran.
Erfahre mehr
Real-time AI that works with your operation

KI in der Automobilbranche

Nutze Computer Vision in der Automobilindustrie mit Ultralytics YOLO Modellen. Vision AI steigert die Verkehrssicherheit, Fahrerassistenz und Fahrzeugautomatisierung für intelligentere Straßen.
Erfahre mehr
Real-time AI tailored to your operation

KI in der Landwirtschaft

Bringe Vision AI mit Ultralytics YOLO Modellen in die smarte Landwirtschaft. Optimiere die Ernteüberwachung, Viehverfolgung und Präzisionslandwirtschaft für höhere, intelligentere Erträge.
Erfahre mehr
Real-time AI that works with your team

KI in der Robotik

Stärke intelligentere Maschinen mit Ultralytics YOLO Modellen. Vision AI in der Robotik treibt autonome Navigation, Wahrnehmung, Objektverfolgung und Echtzeitsteuerung voran.
Erfahre mehr
Real-time AI that works with your team

KI in der Logistik

Optimiere die Logistik mit Ultralytics YOLO-Modellen. Vision AI ermöglicht Paketkontrolle, Sortierung, Fahrzeugverfolgung und Echtzeit-Überwachung der Lagersicherheit.
Erfahre mehr
Real-time AI that works with your team

KI im Einzelhandel

Erfinde den Einzelhandel neu mit Ultralytics YOLO-Modellen. Vision AI fördert Bestandsverfolgung, Regalüberwachung, Warteschlangenmanagement und intelligentere Kundeneinblicke.
Erfahre mehr
Real-time AI that works with your team

KI im Gesundheitswesen

Baue Gesundheitslösungen mit Ultralytics YOLO Modellen. Vision AI im Gesundheitswesen ermöglicht schnellere medizinische Bildgebung, intelligentere Diagnostik und Patientenüberwachung.
Erfahre mehr
Real-time AI that works with your team

KI in der Fertigung

Optimiere die Fertigung mit Ultralytics YOLO-Modellen. Vision AI treibt Qualitätskontrolle, Fehlererkennung, PSA-Einhaltung und die Automatisierung von Montagelinien voran.
Erfahre mehr
Real-time AI that works with your operation

KI in der Automobilbranche

Nutze Computer Vision in der Automobilindustrie mit Ultralytics YOLO Modellen. Vision AI steigert die Verkehrssicherheit, Fahrerassistenz und Fahrzeugautomatisierung für intelligentere Straßen.
Erfahre mehr
Real-time AI tailored to your operation

KI in der Landwirtschaft

Bringe Vision AI mit Ultralytics YOLO Modellen in die smarte Landwirtschaft. Optimiere die Ernteüberwachung, Viehverfolgung und Präzisionslandwirtschaft für höhere, intelligentere Erträge.
Erfahre mehr
Real-time AI that works with your team

KI in der Robotik

Stärke intelligentere Maschinen mit Ultralytics YOLO Modellen. Vision AI in der Robotik treibt autonome Navigation, Wahrnehmung, Objektverfolgung und Echtzeitsteuerung voran.
Erfahre mehr
Real-time AI that works with your team

KI in der Logistik

Optimiere die Logistik mit Ultralytics YOLO-Modellen. Vision AI ermöglicht Paketkontrolle, Sortierung, Fahrzeugverfolgung und Echtzeit-Überwachung der Lagersicherheit.
Erfahre mehr
Real-time AI that works with your team

KI im Einzelhandel

Erfinde den Einzelhandel neu mit Ultralytics YOLO-Modellen. Vision AI fördert Bestandsverfolgung, Regalüberwachung, Warteschlangenmanagement und intelligentere Kundeneinblicke.
Erfahre mehr
Real-time AI that works with your team

KI im Gesundheitswesen

Baue Gesundheitslösungen mit Ultralytics YOLO Modellen. Vision AI im Gesundheitswesen ermöglicht schnellere medizinische Bildgebung, intelligentere Diagnostik und Patientenüberwachung.
Erfahre mehr
Real-time AI that works with your team

KI in der Fertigung

Optimiere die Fertigung mit Ultralytics YOLO-Modellen. Vision AI treibt Qualitätskontrolle, Fehlererkennung, PSA-Einhaltung und die Automatisierung von Montagelinien voran.
Erfahre mehr
Real-time AI that works with your operation

KI in der Automobilbranche

Nutze Computer Vision in der Automobilindustrie mit Ultralytics YOLO Modellen. Vision AI steigert die Verkehrssicherheit, Fahrerassistenz und Fahrzeugautomatisierung für intelligentere Straßen.
Erfahre mehr
Real-time AI tailored to your operation

KI in der Landwirtschaft

Bringe Vision AI mit Ultralytics YOLO Modellen in die smarte Landwirtschaft. Optimiere die Ernteüberwachung, Viehverfolgung und Präzisionslandwirtschaft für höhere, intelligentere Erträge.
Erfahre mehr

Lass uns gemeinsam die Zukunft der KI bauen!

Beginne deine Reise mit der Zukunft des maschinellen Lernens