Triff YOLO26: Vision-KI der nächsten Generation.
Ultralytics
Zurück zum Ultralytics Glossar

Attention Mechanism

Erkunde, wie Aufmerksamkeitsmechanismen die KI revolutionieren, indem sie den menschlichen Fokus nachahmen. Lerne, wie Query, Key und Value-Komponenten die Genauigkeit bei Ultralytics YOLO26 steigern.

Ein Aufmerksamkeitsmechanismus ist eine grundlegende Technik in der künstlichen Intelligenz (KI), die die menschliche kognitive Fähigkeit nachahmt, sich auf bestimmte Details zu konzentrieren und irrelevante Informationen auszublenden. Im Kontext von Deep Learning (DL) ermöglicht dieser Mechanismus einem neuronalen Netz (NN), verschiedenen Teilen der Eingabedaten dynamisch unterschiedliche Wichtigkeitsgrade oder „Gewichte“ zuzuweisen. Anstatt ein ganzes Bild oder einen Satz mit gleicher Gewichtung zu verarbeiten, lernt das Modell, sich auf die signifikantesten Merkmale zu konzentrieren – etwa auf ein bestimmtes Wort in einem Satz, um den Kontext zu verstehen, oder auf ein markantes Objekt in einer komplexen visuellen Szene. Dieser Durchbruch ist die treibende Kraft hinter der Transformer-Architektur, die Bereiche von der natürlichen Sprachverarbeitung (NLP) bis hin zur modernen Computer Vision (CV) revolutioniert hat.

Link to this sectionWie Aufmerksamkeit funktioniert#

Ursprünglich entwickelt, um Speicherbeschränkungen in rekurrenten neuronalen Netzen (RNNs) zu lösen, adressieren Aufmerksamkeitsmechanismen das Problem des verschwindenden Gradienten, indem sie direkte Verbindungen zwischen weit entfernten Teilen einer Datensequenz schaffen. Der Prozess wird oft mithilfe einer Retrieval-Analogie mit drei Komponenten beschrieben: Queries (Abfragen), Keys (Schlüssel) und Values (Werte).

  • Query (Q): Repräsentiert das, wonach das Modell aktuell sucht (z. B. das Subjekt eines Satzes).
  • Key (K): Fungiert als Identifikator für die in der Eingabe verfügbaren Informationen.
  • Value (V): Enthält den eigentlichen Informationsgehalt.

Durch den Vergleich der Query mit verschiedenen Keys berechnet das Modell einen Aufmerksamkeits-Score. Dieser Score bestimmt, wie viel des Value abgerufen und zur Bildung der Ausgabe verwendet wird. Dies ermöglicht es Modellen, langfristige Abhängigkeiten effektiv zu handhaben und Beziehungen zwischen Datenpunkten unabhängig von ihrer Entfernung zueinander zu verstehen.

Link to this sectionPraxisanwendungen#

Aufmerksamkeitsmechanismen haben einige der sichtbarsten Fortschritte in der modernen Technologie ermöglicht.

  • Maschinelle Übersetzung: Systeme wie Google Übersetzer verlassen sich auf Aufmerksamkeit, um Wörter zwischen Sprachen abzugleichen. Bei der Übersetzung von „The black cat“ (Englisch) zu „Le chat noir“ (Französisch) muss das Modell die Adjektiv-Nomen-Reihenfolge umkehren. Aufmerksamkeit erlaubt es dem Decoder, sich auf „black“ zu konzentrieren, wenn „noir“ generiert wird, und auf „cat“, wenn „chat“ generiert wird, was die grammatikalische Genauigkeit sicherstellt.
  • Medizinische Bildanalyse: Im Gesundheitswesen unterstützen Aufmerksamkeitskarten Radiologen, indem sie verdächtige Regionen in Röntgen- oder MRT-Aufnahmen hervorheben. Wenn beispielsweise Anomalien in Hirntumor-Datensätzen diagnostiziert werden, konzentriert das Modell seine Rechenleistung auf das Tumorgewebe, während gesundes Gehirngewebe herausgefiltert wird, was die diagnostische Präzision verbessert.
  • Autonome Fahrzeuge: Selbstfahrende Autos nutzen visuelle Aufmerksamkeit, um kritische Straßenelemente zu priorisieren. Inmitten einer belebten Straße konzentriert sich das System stark auf Fußgänger und Ampeln – sie werden als Signale mit hoher Priorität behandelt –, während statischen Hintergrundelementen wie dem Himmel oder Gebäuden weniger Aufmerksamkeit geschenkt wird.

Link to this sectionAufmerksamkeit vs. Faltung#

Es ist wichtig, Aufmerksamkeit von Convolutional Neural Networks (CNNs) zu unterscheiden. Während CNNs Daten lokal mithilfe eines festen Fensters (Kernel) verarbeiten, um Kanten und Texturen zu erkennen, verarbeitet Aufmerksamkeit Daten global und setzt jeden Teil der Eingabe in Bezug zu jedem anderen Teil.

  • Self-Attention: Eine spezielle Art der Aufmerksamkeit, bei der das Modell sich selbst betrachtet, um den Kontext innerhalb einer einzelnen Sequenz zu verstehen.
  • Effizienz: Reine Aufmerksamkeitsmodelle können rechenintensiv sein (quadratische Komplexität). Moderne Optimierungstechniken wie Flash Attention nutzen GPU-Hardware effektiver, um das Training zu beschleunigen.

Während modernste Modelle wie Ultralytics YOLO26 für Echtzeit-Inferenz unter Verwendung fortschrittlicher CNN-Strukturen optimiert sind, nutzen hybride Architekturen wie RT-DETR (Real-Time Detection Transformer) explizit Aufmerksamkeit, um eine hohe Genauigkeit zu erreichen. Beide Modelltypen können einfach mithilfe der Ultralytics Platform trainiert und bereitgestellt werden.

Link to this sectionCode-Beispiel#

Das folgende Python-Beispiel demonstriert, wie man eine Inferenz mit RT-DETR durchführt, einer Modellarchitektur, die grundlegend auf Aufmerksamkeitsmechanismen für die Objekterkennung basiert.

from ultralytics import RTDETR

# Load a pre-trained RT-DETR model which uses attention mechanisms
# This model captures global context effectively compared to pure CNNs
model = RTDETR("rtdetr-l.pt")

# Perform inference on an image URL
results = model("https://ultralytics.com/images/bus.jpg")

# Print the number of detections found via transformer attention
print(f"Detected {len(results[0].boxes)} objects using attention-based detection.")

Explore solutions

Real-time AI that works with your team

KI in der Robotik

Stärke intelligentere Maschinen mit Ultralytics YOLO Modellen. Vision AI in der Robotik treibt autonome Navigation, Wahrnehmung, Objektverfolgung und Echtzeitsteuerung voran.

Erfahre mehr
Real-time AI that works with your team

KI in der Logistik

Optimiere die Logistik mit Ultralytics YOLO-Modellen. Vision AI ermöglicht Paketkontrolle, Sortierung, Fahrzeugverfolgung und Echtzeit-Überwachung der Lagersicherheit.

Erfahre mehr
Real-time AI that works with your team

KI im Einzelhandel

Erfinde den Einzelhandel neu mit Ultralytics YOLO-Modellen. Vision AI fördert Bestandsverfolgung, Regalüberwachung, Warteschlangenmanagement und intelligentere Kundeneinblicke.

Erfahre mehr
Real-time AI that works with your team

KI im Gesundheitswesen

Baue Gesundheitslösungen mit Ultralytics YOLO Modellen. Vision AI im Gesundheitswesen ermöglicht schnellere medizinische Bildgebung, intelligentere Diagnostik und Patientenüberwachung.

Erfahre mehr
Real-time AI that works with your team

KI in der Fertigung

Optimiere die Fertigung mit Ultralytics YOLO-Modellen. Vision AI treibt Qualitätskontrolle, Fehlererkennung, PSA-Einhaltung und die Automatisierung von Montagelinien voran.

Erfahre mehr
Real-time AI that works with your operation

KI in der Automobilbranche

Nutze Computer Vision in der Automobilindustrie mit Ultralytics YOLO Modellen. Vision AI steigert die Verkehrssicherheit, Fahrerassistenz und Fahrzeugautomatisierung für intelligentere Straßen.

Erfahre mehr
Real-time AI tailored to your operation

KI in der Landwirtschaft

Bringe Vision AI mit Ultralytics YOLO Modellen in die smarte Landwirtschaft. Optimiere die Ernteüberwachung, Viehverfolgung und Präzisionslandwirtschaft für höhere, intelligentere Erträge.

Erfahre mehr
Real-time AI that works with your team

KI in der Robotik

Stärke intelligentere Maschinen mit Ultralytics YOLO Modellen. Vision AI in der Robotik treibt autonome Navigation, Wahrnehmung, Objektverfolgung und Echtzeitsteuerung voran.

Erfahre mehr
Real-time AI that works with your team

KI in der Logistik

Optimiere die Logistik mit Ultralytics YOLO-Modellen. Vision AI ermöglicht Paketkontrolle, Sortierung, Fahrzeugverfolgung und Echtzeit-Überwachung der Lagersicherheit.

Erfahre mehr
Real-time AI that works with your team

KI im Einzelhandel

Erfinde den Einzelhandel neu mit Ultralytics YOLO-Modellen. Vision AI fördert Bestandsverfolgung, Regalüberwachung, Warteschlangenmanagement und intelligentere Kundeneinblicke.

Erfahre mehr
Real-time AI that works with your team

KI im Gesundheitswesen

Baue Gesundheitslösungen mit Ultralytics YOLO Modellen. Vision AI im Gesundheitswesen ermöglicht schnellere medizinische Bildgebung, intelligentere Diagnostik und Patientenüberwachung.

Erfahre mehr
Real-time AI that works with your team

KI in der Fertigung

Optimiere die Fertigung mit Ultralytics YOLO-Modellen. Vision AI treibt Qualitätskontrolle, Fehlererkennung, PSA-Einhaltung und die Automatisierung von Montagelinien voran.

Erfahre mehr
Real-time AI that works with your operation

KI in der Automobilbranche

Nutze Computer Vision in der Automobilindustrie mit Ultralytics YOLO Modellen. Vision AI steigert die Verkehrssicherheit, Fahrerassistenz und Fahrzeugautomatisierung für intelligentere Straßen.

Erfahre mehr
Real-time AI tailored to your operation

KI in der Landwirtschaft

Bringe Vision AI mit Ultralytics YOLO Modellen in die smarte Landwirtschaft. Optimiere die Ernteüberwachung, Viehverfolgung und Präzisionslandwirtschaft für höhere, intelligentere Erträge.

Erfahre mehr
Real-time AI that works with your team

KI in der Robotik

Stärke intelligentere Maschinen mit Ultralytics YOLO Modellen. Vision AI in der Robotik treibt autonome Navigation, Wahrnehmung, Objektverfolgung und Echtzeitsteuerung voran.

Erfahre mehr
Real-time AI that works with your team

KI in der Logistik

Optimiere die Logistik mit Ultralytics YOLO-Modellen. Vision AI ermöglicht Paketkontrolle, Sortierung, Fahrzeugverfolgung und Echtzeit-Überwachung der Lagersicherheit.

Erfahre mehr
Real-time AI that works with your team

KI im Einzelhandel

Erfinde den Einzelhandel neu mit Ultralytics YOLO-Modellen. Vision AI fördert Bestandsverfolgung, Regalüberwachung, Warteschlangenmanagement und intelligentere Kundeneinblicke.

Erfahre mehr
Real-time AI that works with your team

KI im Gesundheitswesen

Baue Gesundheitslösungen mit Ultralytics YOLO Modellen. Vision AI im Gesundheitswesen ermöglicht schnellere medizinische Bildgebung, intelligentere Diagnostik und Patientenüberwachung.

Erfahre mehr
Real-time AI that works with your team

KI in der Fertigung

Optimiere die Fertigung mit Ultralytics YOLO-Modellen. Vision AI treibt Qualitätskontrolle, Fehlererkennung, PSA-Einhaltung und die Automatisierung von Montagelinien voran.

Erfahre mehr
Real-time AI that works with your operation

KI in der Automobilbranche

Nutze Computer Vision in der Automobilindustrie mit Ultralytics YOLO Modellen. Vision AI steigert die Verkehrssicherheit, Fahrerassistenz und Fahrzeugautomatisierung für intelligentere Straßen.

Erfahre mehr
Real-time AI tailored to your operation

KI in der Landwirtschaft

Bringe Vision AI mit Ultralytics YOLO Modellen in die smarte Landwirtschaft. Optimiere die Ernteüberwachung, Viehverfolgung und Präzisionslandwirtschaft für höhere, intelligentere Erträge.

Erfahre mehr

Lass uns gemeinsam die Zukunft der KI bauen!

Beginne deine Reise mit der Zukunft des maschinellen Lernens