Triff YOLO26: Vision-KI der nächsten Generation.
Ultralytics
Zurück zum Ultralytics Glossar

Vanishing Gradient

Erfahre, wie sich das Problem verschwindender Gradienten auf Deep Learning auswirkt, und entdecke effektive Lösungen wie ReLU und Residual Connections, die in Ultralytics YOLO26 verwendet werden.

Das Problem des verschwindenden Gradienten ist eine große Herausforderung beim Training tiefer künstlicher neuronaler Netze. Es tritt auf, wenn die Gradienten – die Werte, die bestimmen, wie stark die Parameter des Netzwerks angepasst werden sollten – beim Rückwärtstransport von der Ausgabeschicht zu den Eingabeschichten extrem klein werden. Da diese Gradienten für die Aktualisierung der Modellgewichte entscheidend sind, führt ihr Verschwinden dazu, dass die früheren Schichten des Netzwerks aufhören zu lernen. Dieses Phänomen hindert das Modell effektiv daran, komplexe Muster in den Daten zu erfassen, was die Tiefe und Leistungsfähigkeit von Deep-Learning-Architekturen einschränkt.

Link to this sectionDie Mechanik der verschwindenden Signale#

Um zu verstehen, warum dies geschieht, ist es hilfreich, den Prozess der Backpropagation zu betrachten. Während des Trainings berechnet das Netzwerk den Fehler zwischen seiner Vorhersage und dem tatsächlichen Zielwert mithilfe einer Verlustfunktion. Dieser Fehler wird dann rückwärts durch die Schichten geleitet, um die Gewichte anzupassen. Diese Anpassung basiert auf der Kettenregel der Analysis, bei der die Ableitungen der Aktivierungsfunktionen Schicht für Schicht multipliziert werden.

Wenn ein Netzwerk Aktivierungsfunktionen wie die Sigmoid-Funktion oder den Tangens hyperbolicus (tanh) verwendet, sind die Ableitungen oft kleiner als 1. Wenn viele dieser kleinen Zahlen in einem tiefen Netzwerk mit Dutzenden oder Hunderten von Schichten miteinander multipliziert werden, nähert sich das Ergebnis der Null an. Du kannst dir das wie beim „Stille-Post“-Spiel vorstellen, bei dem eine Nachricht durch eine lange Reihe von Personen geflüstert wird; bis sie den Anfang der Reihe erreicht, ist die Nachricht unhörbar geworden und die erste Person weiß nicht, was sie sagen soll.

Link to this sectionLösungen und moderne Architekturen#

Der Bereich der KI hat mehrere robuste Strategien entwickelt, um verschwindende Gradienten abzumildern und die Erstellung leistungsstarker Modelle wie Ultralytics YOLO26 zu ermöglichen.

  • ReLU und Varianten: Die Rectified Linear Unit (ReLU) und ihre Nachfolger, wie Leaky ReLU und SiLU, sättigen bei positiven Werten nicht. Ihre Ableitungen sind entweder 1 oder eine kleine Konstante, wodurch die Größe des Gradienten über tiefe Schichten hinweg erhalten bleibt.
  • Residual Connections: Eingeführt in Residual Networks (ResNets), sind dies „Skip-Connections“, die es dem Gradienten ermöglichen, eine oder mehrere Schichten zu überspringen. Dies schafft eine „Datenautobahn“, auf der der Gradient ungehindert zu früheren Schichten fließen kann – ein Konzept, das für die moderne Objekterkennung unerlässlich ist.
  • Batch Normalization: Durch die Normalisierung der Eingaben jeder Schicht stellt die Batch Normalization sicher, dass das Netzwerk in einem stabilen Bereich arbeitet, in dem die Ableitungen nicht zu klein sind, was die Abhängigkeit von einer sorgfältigen Initialisierung verringert.
  • Gated Architectures: Bei sequenziellen Daten verwenden Long Short-Term Memory (LSTM)-Netzwerke und GRUs spezialisierte Gatter, um zu entscheiden, wie viele Informationen behalten oder vergessen werden sollen, wodurch der Gradient effektiv davor geschützt wird, über lange Sequenzen hinweg zu verschwinden.

Link to this sectionVerschwindende vs. explodierende Gradienten#

Obwohl sie auf demselben zugrunde liegenden Mechanismus beruhen (wiederholte Multiplikation), unterscheiden sich verschwindende Gradienten von explodierenden Gradienten.

  • Verschwindender Gradient: Gradienten nähern sich der Null an, wodurch das Lernen stoppt. Dies ist in tiefen Netzwerken mit Sigmoid-Aktivierungen üblich.
  • Explodierender Gradient: Gradienten summieren sich zu exzessiv großen Werten, was dazu führt, dass Modellgewichte stark schwanken oder NaN (Not a Number) erreichen. Dies wird oft durch Gradient Clipping behoben.

Link to this sectionPraxisanwendungen#

Die Überwindung verschwindender Gradienten war eine Grundvoraussetzung für den Erfolg moderner KI-Anwendungen.

  1. Deep Object Detection: Modelle, die für autonome Fahrzeuge verwendet werden, wie die YOLO-Serie, erfordern Hunderte von Schichten, um zwischen Fußgängern, Schildern und Fahrzeugen zu unterscheiden. Ohne Lösungen wie Residual Blocks und Batch Normalization wäre das Training dieser tiefen Netzwerke auf riesigen Datasets wie COCO unmöglich. Tools wie die Ultralytics Platform helfen dabei, diesen Trainingsprozess zu optimieren und sicherzustellen, dass diese komplexen Architekturen korrekt konvergieren.

  2. Maschinelle Übersetzung: Im Bereich Natural Language Processing (NLP) erfordert die Übersetzung eines langen Satzes das Verständnis der Beziehung zwischen dem ersten und dem letzten Wort. Die Lösung des Problems der verschwindenden Gradienten in RNNs (mittels LSTMs) und später Transformern ermöglichte es Modellen, den Kontext über lange Absätze hinweg beizubehalten, was maschinelle Übersetzungsdienste wie Google Translate revolutionierte.

Link to this sectionPython-Beispiel#

Moderne Frameworks und Modelle abstrahieren viele dieser Komplexitäten. Wenn du ein Modell wie YOLO26 trainierst, enthält die Architektur automatisch Komponenten wie SiLU-Aktivierung und Batch Normalization, um zu verhindern, dass Gradienten verschwinden.

from ultralytics import YOLO

# Load the YOLO26 model (latest generation, Jan 2026)
# This architecture includes residual connections and modern activations
# that inherently prevent vanishing gradients.
model = YOLO("yolo26n.pt")

# Train the model on a dataset
# The optimization process remains stable due to the robust architecture
results = model.train(data="coco8.yaml", epochs=10)

Explore solutions

Real-time AI that works with your team

KI in der Robotik

Stärke intelligentere Maschinen mit Ultralytics YOLO Modellen. Vision AI in der Robotik treibt autonome Navigation, Wahrnehmung, Objektverfolgung und Echtzeitsteuerung voran.

Erfahre mehr
Real-time AI that works with your team

KI in der Logistik

Optimiere die Logistik mit Ultralytics YOLO-Modellen. Vision AI ermöglicht Paketkontrolle, Sortierung, Fahrzeugverfolgung und Echtzeit-Überwachung der Lagersicherheit.

Erfahre mehr
Real-time AI that works with your team

KI im Einzelhandel

Erfinde den Einzelhandel neu mit Ultralytics YOLO-Modellen. Vision AI fördert Bestandsverfolgung, Regalüberwachung, Warteschlangenmanagement und intelligentere Kundeneinblicke.

Erfahre mehr
Real-time AI that works with your team

KI im Gesundheitswesen

Baue Gesundheitslösungen mit Ultralytics YOLO Modellen. Vision AI im Gesundheitswesen ermöglicht schnellere medizinische Bildgebung, intelligentere Diagnostik und Patientenüberwachung.

Erfahre mehr
Real-time AI that works with your team

KI in der Fertigung

Optimiere die Fertigung mit Ultralytics YOLO-Modellen. Vision AI treibt Qualitätskontrolle, Fehlererkennung, PSA-Einhaltung und die Automatisierung von Montagelinien voran.

Erfahre mehr
Real-time AI that works with your operation

KI in der Automobilbranche

Nutze Computer Vision in der Automobilindustrie mit Ultralytics YOLO Modellen. Vision AI steigert die Verkehrssicherheit, Fahrerassistenz und Fahrzeugautomatisierung für intelligentere Straßen.

Erfahre mehr
Real-time AI tailored to your operation

KI in der Landwirtschaft

Bringe Vision AI mit Ultralytics YOLO Modellen in die smarte Landwirtschaft. Optimiere die Ernteüberwachung, Viehverfolgung und Präzisionslandwirtschaft für höhere, intelligentere Erträge.

Erfahre mehr
Real-time AI that works with your team

KI in der Robotik

Stärke intelligentere Maschinen mit Ultralytics YOLO Modellen. Vision AI in der Robotik treibt autonome Navigation, Wahrnehmung, Objektverfolgung und Echtzeitsteuerung voran.

Erfahre mehr
Real-time AI that works with your team

KI in der Logistik

Optimiere die Logistik mit Ultralytics YOLO-Modellen. Vision AI ermöglicht Paketkontrolle, Sortierung, Fahrzeugverfolgung und Echtzeit-Überwachung der Lagersicherheit.

Erfahre mehr
Real-time AI that works with your team

KI im Einzelhandel

Erfinde den Einzelhandel neu mit Ultralytics YOLO-Modellen. Vision AI fördert Bestandsverfolgung, Regalüberwachung, Warteschlangenmanagement und intelligentere Kundeneinblicke.

Erfahre mehr
Real-time AI that works with your team

KI im Gesundheitswesen

Baue Gesundheitslösungen mit Ultralytics YOLO Modellen. Vision AI im Gesundheitswesen ermöglicht schnellere medizinische Bildgebung, intelligentere Diagnostik und Patientenüberwachung.

Erfahre mehr
Real-time AI that works with your team

KI in der Fertigung

Optimiere die Fertigung mit Ultralytics YOLO-Modellen. Vision AI treibt Qualitätskontrolle, Fehlererkennung, PSA-Einhaltung und die Automatisierung von Montagelinien voran.

Erfahre mehr
Real-time AI that works with your operation

KI in der Automobilbranche

Nutze Computer Vision in der Automobilindustrie mit Ultralytics YOLO Modellen. Vision AI steigert die Verkehrssicherheit, Fahrerassistenz und Fahrzeugautomatisierung für intelligentere Straßen.

Erfahre mehr
Real-time AI tailored to your operation

KI in der Landwirtschaft

Bringe Vision AI mit Ultralytics YOLO Modellen in die smarte Landwirtschaft. Optimiere die Ernteüberwachung, Viehverfolgung und Präzisionslandwirtschaft für höhere, intelligentere Erträge.

Erfahre mehr
Real-time AI that works with your team

KI in der Robotik

Stärke intelligentere Maschinen mit Ultralytics YOLO Modellen. Vision AI in der Robotik treibt autonome Navigation, Wahrnehmung, Objektverfolgung und Echtzeitsteuerung voran.

Erfahre mehr
Real-time AI that works with your team

KI in der Logistik

Optimiere die Logistik mit Ultralytics YOLO-Modellen. Vision AI ermöglicht Paketkontrolle, Sortierung, Fahrzeugverfolgung und Echtzeit-Überwachung der Lagersicherheit.

Erfahre mehr
Real-time AI that works with your team

KI im Einzelhandel

Erfinde den Einzelhandel neu mit Ultralytics YOLO-Modellen. Vision AI fördert Bestandsverfolgung, Regalüberwachung, Warteschlangenmanagement und intelligentere Kundeneinblicke.

Erfahre mehr
Real-time AI that works with your team

KI im Gesundheitswesen

Baue Gesundheitslösungen mit Ultralytics YOLO Modellen. Vision AI im Gesundheitswesen ermöglicht schnellere medizinische Bildgebung, intelligentere Diagnostik und Patientenüberwachung.

Erfahre mehr
Real-time AI that works with your team

KI in der Fertigung

Optimiere die Fertigung mit Ultralytics YOLO-Modellen. Vision AI treibt Qualitätskontrolle, Fehlererkennung, PSA-Einhaltung und die Automatisierung von Montagelinien voran.

Erfahre mehr
Real-time AI that works with your operation

KI in der Automobilbranche

Nutze Computer Vision in der Automobilindustrie mit Ultralytics YOLO Modellen. Vision AI steigert die Verkehrssicherheit, Fahrerassistenz und Fahrzeugautomatisierung für intelligentere Straßen.

Erfahre mehr
Real-time AI tailored to your operation

KI in der Landwirtschaft

Bringe Vision AI mit Ultralytics YOLO Modellen in die smarte Landwirtschaft. Optimiere die Ernteüberwachung, Viehverfolgung und Präzisionslandwirtschaft für höhere, intelligentere Erträge.

Erfahre mehr

Lass uns gemeinsam die Zukunft der KI bauen!

Beginne deine Reise mit der Zukunft des maschinellen Lernens