Triff YOLO26: Vision-KI der nächsten Generation.
Ultralytics
Zurück zum Ultralytics Glossar

Recurrent Neural Network (RNN)

Erforsche, wie rekurrente neuronale Netze (RNN) sequentielle Daten mithilfe von Speicher verarbeiten. Lerne mehr über RNN-Architekturen, NLP-Anwendungen und PyTorch-Implementierungen.

Ein Recurrent Neural Network (RNN) ist eine Art von künstlichem neuronalen Netz, das speziell darauf ausgelegt ist, Muster in Datensequenzen zu erkennen, wie etwa in Texten, Genomen, Handschriften oder gesprochener Sprache. Im Gegensatz zu herkömmlichen Feedforward-Netzwerken, bei denen alle Eingaben (und Ausgaben) als unabhängig voneinander betrachtet werden, verfügen RNNs über eine Form von Gedächtnis. Dieser interne Speicher ermöglicht es ihnen, Eingaben mit einem Verständnis für vorangegangene Informationen zu verarbeiten, was sie besonders geeignet für Aufgaben macht, bei denen Kontext und zeitliche Abfolge entscheidend sind. Diese Architektur ahmt nach, wie Menschen Informationen verarbeiten – das Lesen eines Satzes erfordert beispielsweise, sich an vorherige Wörter zu erinnern, um das aktuelle zu verstehen.

Link to this sectionWie RNNs funktionieren#

Die Kerninnovation eines RNN ist seine Schleifenstruktur. In einem Standard-Feedforward-Netzwerk fließen Informationen nur in eine Richtung: von der Eingabe zur Ausgabe. Im Gegensatz dazu besitzt ein RNN eine Rückkopplungsschleife, die es Informationen ermöglicht, bestehen zu bleiben. Während das Netzwerk eine Sequenz verarbeitet, unterhält es einen "verborgenen Zustand" (Hidden State) – einen Vektor, der als Kurzzeitgedächtnis des Netzwerks dient. Bei jedem Zeitschritt nimmt das RNN die aktuelle Eingabe und den vorherigen verborgenen Zustand, um eine Ausgabe zu erzeugen und den verborgenen Zustand für den nächsten Schritt zu aktualisieren.

Diese Fähigkeit zur sequenziellen Verarbeitung ist essenziell für Natural Language Processing (NLP) und Zeitreihenanalyse. Standard-RNNs haben jedoch oft Probleme mit langen Sequenzen aufgrund des Vanishing Gradient-Problems, bei dem das Netzwerk frühere Eingaben vergisst, wenn die Sequenz länger wird. Diese Einschränkung führte zur Entwicklung fortschrittlicherer Varianten wie Long Short-Term Memory (LSTM)-Netzwerken und Gated Recurrent Units (GRUs), die Mechanismen einführen, um den Informationsfluss über längere Zeiträume besser zu regulieren.

Link to this sectionPraxisanwendungen#

Recurrent Neural Networks haben viele Branchen verändert, indem sie es Maschinen ermöglichen, sequenzielle Daten zu verstehen. Hier sind zwei prominente Beispiele:

  1. Maschinelle Übersetzung: Dienste wie Google Translate verließen sich ursprünglich stark auf RNN-basierte Architekturen (speziell Sequence-to-Sequence-Modelle), um Text von einer Sprache in eine andere zu konvertieren. Das Netzwerk liest den gesamten Eingabesatz (z. B. auf Englisch) und erstellt einen Kontextvektor, den es dann verwendet, um die übersetzte Ausgabe (z. B. auf Französisch) Wort für Wort zu generieren und dabei die grammatikalische Konsistenz zu gewährleisten.

  2. Vorhersagendes Tippen und Autokorrektur: Wenn du auf einem Smartphone tippst, schlägt die Tastatur das nächste wahrscheinliche Wort vor. Dies wird oft durch ein Sprachmodell ermöglicht, das mit RNNs trainiert wurde. Das Modell analysiert die Sequenz der Wörter, die du bereits getippt hast, um das wahrscheinlichste nächste Wort vorherzusagen, was die Geschwindigkeit und Genauigkeit des Benutzers verbessert. Ähnliche Logik gilt für Spracherkennungs-Systeme, die gesprochenes Audio in Text transkribieren.

Link to this sectionRNNs vs. CNNs und Transformer#

Es ist hilfreich, RNNs von anderen wichtigen Architekturen zu unterscheiden. Ein Convolutional Neural Network (CNN) ist primär für räumliche Daten wie Bilder konzipiert und verarbeitet Pixelgitter, um Formen und Objekte zu identifizieren. Zum Beispiel verwendet Ultralytics YOLO26 ein leistungsstarkes CNN-Backbone für Objekterkennung in Echtzeit. Während ein CNN hervorragend darin ist, zu bestimmen, "was ist auf diesem Bild?", ist ein RNN exzellent darin, zu bestimmen, "was passiert als Nächstes in diesem Video?".

In jüngerer Zeit hat die Transformer-Architektur RNNs für viele komplexe NLP-Aufgaben weitgehend abgelöst. Transformer verwenden einen Aufmerksamkeitsmechanismus, um ganze Sequenzen parallel statt sequenziell zu verarbeiten. RNNs bleiben jedoch für bestimmte Streaming-Anwendungen mit geringer Latenz und begrenzten Ressourcen sehr effizient und sind einfacher auf Edge-Geräten für einfache Zeitreihenprognosen einzusetzen.

Link to this sectionPyTorch Implementierungsbeispiel#

Während moderne Computer-Vision-Aufgaben oft auf CNNs setzen, können hybride Modelle RNNs verwenden, um zeitliche Merkmale zu analysieren, die aus Videoframes extrahiert wurden. Unten findest du ein einfaches, ausführbares Beispiel, das PyTorch verwendet, um eine grundlegende RNN-Schicht zu erstellen, die eine Datensequenz verarbeitet.

import torch
import torch.nn as nn

# Define a basic RNN layer
# input_size: number of features in the input (e.g., 10 features per time step)
# hidden_size: number of features in the hidden state (memory)
# batch_first: input shape will be (batch, seq, feature)
rnn = nn.RNN(input_size=10, hidden_size=20, num_layers=1, batch_first=True)

# Create a dummy input: Batch size 1, Sequence length 5, Features 10
input_seq = torch.randn(1, 5, 10)

# Forward pass through the RNN
# output contains the hidden state for every time step
# hn contains the final hidden state
output, hn = rnn(input_seq)

print(f"Output shape: {output.shape}")  # Expected: torch.Size([1, 5, 20])
print(f"Final hidden state shape: {hn.shape}")  # Expected: torch.Size([1, 1, 20])

Link to this sectionHerausforderungen und Zukunftsaussichten#

Trotz ihres Nutzens stehen RNNs vor rechnerischen Hürden. Die sequenzielle Verarbeitung verhindert die Parallelisierung, was das Training im Vergleich zu Transformern auf GPUs langsamer macht. Zudem erfordert die Bewältigung des Exploding Gradient-Problems sorgfältiges Hyperparameter-Tuning und Techniken wie Gradient Clipping.

Nichtsdestotrotz bleiben RNNs ein grundlegendes Konzept im Deep Learning (DL). Sie sind integraler Bestandteil des Verständnisses der Entwicklung von Künstlicher Intelligenz (AI) und werden immer noch häufig in einfachen Systemen zur Anomalieerkennung für IoT-Sensoren eingesetzt. Für Entwickler, die komplexe Pipelines aufbauen – wie etwa die Kombination von Vision-Modellen mit Sequenz-Prädiktoren – ist die Verwaltung von Datensätzen und Trainings-Workflows entscheidend. Die Ultralytics Platform vereinfacht diesen Prozess und bietet Tools, um Daten zu verwalten und Modelle effizient in verschiedenen Umgebungen bereitzustellen.

Explore solutions

Real-time AI that works with your team

KI in der Robotik

Stärke intelligentere Maschinen mit Ultralytics YOLO Modellen. Vision AI in der Robotik treibt autonome Navigation, Wahrnehmung, Objektverfolgung und Echtzeitsteuerung voran.

Erfahre mehr
Real-time AI that works with your team

KI in der Logistik

Optimiere die Logistik mit Ultralytics YOLO-Modellen. Vision AI ermöglicht Paketkontrolle, Sortierung, Fahrzeugverfolgung und Echtzeit-Überwachung der Lagersicherheit.

Erfahre mehr
Real-time AI that works with your team

KI im Einzelhandel

Erfinde den Einzelhandel neu mit Ultralytics YOLO-Modellen. Vision AI fördert Bestandsverfolgung, Regalüberwachung, Warteschlangenmanagement und intelligentere Kundeneinblicke.

Erfahre mehr
Real-time AI that works with your team

KI im Gesundheitswesen

Baue Gesundheitslösungen mit Ultralytics YOLO Modellen. Vision AI im Gesundheitswesen ermöglicht schnellere medizinische Bildgebung, intelligentere Diagnostik und Patientenüberwachung.

Erfahre mehr
Real-time AI that works with your team

KI in der Fertigung

Optimiere die Fertigung mit Ultralytics YOLO-Modellen. Vision AI treibt Qualitätskontrolle, Fehlererkennung, PSA-Einhaltung und die Automatisierung von Montagelinien voran.

Erfahre mehr
Real-time AI that works with your operation

KI in der Automobilbranche

Nutze Computer Vision in der Automobilindustrie mit Ultralytics YOLO Modellen. Vision AI steigert die Verkehrssicherheit, Fahrerassistenz und Fahrzeugautomatisierung für intelligentere Straßen.

Erfahre mehr
Real-time AI tailored to your operation

KI in der Landwirtschaft

Bringe Vision AI mit Ultralytics YOLO Modellen in die smarte Landwirtschaft. Optimiere die Ernteüberwachung, Viehverfolgung und Präzisionslandwirtschaft für höhere, intelligentere Erträge.

Erfahre mehr
Real-time AI that works with your team

KI in der Robotik

Stärke intelligentere Maschinen mit Ultralytics YOLO Modellen. Vision AI in der Robotik treibt autonome Navigation, Wahrnehmung, Objektverfolgung und Echtzeitsteuerung voran.

Erfahre mehr
Real-time AI that works with your team

KI in der Logistik

Optimiere die Logistik mit Ultralytics YOLO-Modellen. Vision AI ermöglicht Paketkontrolle, Sortierung, Fahrzeugverfolgung und Echtzeit-Überwachung der Lagersicherheit.

Erfahre mehr
Real-time AI that works with your team

KI im Einzelhandel

Erfinde den Einzelhandel neu mit Ultralytics YOLO-Modellen. Vision AI fördert Bestandsverfolgung, Regalüberwachung, Warteschlangenmanagement und intelligentere Kundeneinblicke.

Erfahre mehr
Real-time AI that works with your team

KI im Gesundheitswesen

Baue Gesundheitslösungen mit Ultralytics YOLO Modellen. Vision AI im Gesundheitswesen ermöglicht schnellere medizinische Bildgebung, intelligentere Diagnostik und Patientenüberwachung.

Erfahre mehr
Real-time AI that works with your team

KI in der Fertigung

Optimiere die Fertigung mit Ultralytics YOLO-Modellen. Vision AI treibt Qualitätskontrolle, Fehlererkennung, PSA-Einhaltung und die Automatisierung von Montagelinien voran.

Erfahre mehr
Real-time AI that works with your operation

KI in der Automobilbranche

Nutze Computer Vision in der Automobilindustrie mit Ultralytics YOLO Modellen. Vision AI steigert die Verkehrssicherheit, Fahrerassistenz und Fahrzeugautomatisierung für intelligentere Straßen.

Erfahre mehr
Real-time AI tailored to your operation

KI in der Landwirtschaft

Bringe Vision AI mit Ultralytics YOLO Modellen in die smarte Landwirtschaft. Optimiere die Ernteüberwachung, Viehverfolgung und Präzisionslandwirtschaft für höhere, intelligentere Erträge.

Erfahre mehr
Real-time AI that works with your team

KI in der Robotik

Stärke intelligentere Maschinen mit Ultralytics YOLO Modellen. Vision AI in der Robotik treibt autonome Navigation, Wahrnehmung, Objektverfolgung und Echtzeitsteuerung voran.

Erfahre mehr
Real-time AI that works with your team

KI in der Logistik

Optimiere die Logistik mit Ultralytics YOLO-Modellen. Vision AI ermöglicht Paketkontrolle, Sortierung, Fahrzeugverfolgung und Echtzeit-Überwachung der Lagersicherheit.

Erfahre mehr
Real-time AI that works with your team

KI im Einzelhandel

Erfinde den Einzelhandel neu mit Ultralytics YOLO-Modellen. Vision AI fördert Bestandsverfolgung, Regalüberwachung, Warteschlangenmanagement und intelligentere Kundeneinblicke.

Erfahre mehr
Real-time AI that works with your team

KI im Gesundheitswesen

Baue Gesundheitslösungen mit Ultralytics YOLO Modellen. Vision AI im Gesundheitswesen ermöglicht schnellere medizinische Bildgebung, intelligentere Diagnostik und Patientenüberwachung.

Erfahre mehr
Real-time AI that works with your team

KI in der Fertigung

Optimiere die Fertigung mit Ultralytics YOLO-Modellen. Vision AI treibt Qualitätskontrolle, Fehlererkennung, PSA-Einhaltung und die Automatisierung von Montagelinien voran.

Erfahre mehr
Real-time AI that works with your operation

KI in der Automobilbranche

Nutze Computer Vision in der Automobilindustrie mit Ultralytics YOLO Modellen. Vision AI steigert die Verkehrssicherheit, Fahrerassistenz und Fahrzeugautomatisierung für intelligentere Straßen.

Erfahre mehr
Real-time AI tailored to your operation

KI in der Landwirtschaft

Bringe Vision AI mit Ultralytics YOLO Modellen in die smarte Landwirtschaft. Optimiere die Ernteüberwachung, Viehverfolgung und Präzisionslandwirtschaft für höhere, intelligentere Erträge.

Erfahre mehr

Lass uns gemeinsam die Zukunft der KI bauen!

Beginne deine Reise mit der Zukunft des maschinellen Lernens