Triff YOLO26: Vision-KI der nächsten Generation.
Ultralytics
Zurück zum Ultralytics Glossar

Deep Reinforcement Learning

Erkunde Deep Reinforcement Learning (DRL) und wie es KI-Entscheidungsfindung mit Deep Learning kombiniert. Lerne heute, Ultralytics YOLO26 als Wahrnehmungsebene zu nutzen.

Deep Reinforcement Learning (DRL) ist ein fortgeschrittener Teilbereich der künstlichen Intelligenz (KI), der die Entscheidungsfähigkeiten von Reinforcement Learning mit der Wahrnehmungskraft von Deep Learning (DL) kombiniert. Während traditionelles Reinforcement Learning auf tabellarischen Methoden basiert, um Situationen auf Aktionen abzubilden, stoßen diese Methoden bei komplexen oder visuellen Umgebungen an ihre Grenzen. DRL überwindet dies durch den Einsatz von neuronalen Netzen, um hochdimensionale Eingabedaten wie Videoframes oder Sensordaten zu interpretieren. Dies ermöglicht es Maschinen, effektive Strategien direkt aus rohen Erfahrungen zu lernen, ohne explizite menschliche Anweisungen.

Link to this sectionDer Kernmechanismus von DRL#

In einem DRL-System interagiert ein KI-Agent in diskreten Zeitschritten mit einer Umgebung. Bei jedem Schritt beobachtet der Agent den aktuellen „Zustand“, wählt basierend auf einer Richtlinie eine Aktion aus und erhält ein Belohnungssignal, das den Erfolg oder Misserfolg dieser Aktion anzeigt. Das Hauptziel besteht darin, die kumulative Belohnung über die Zeit zu maximieren.

Die „Deep“-Komponente bezieht sich auf die Verwendung tiefer neuronaler Netze zur Annäherung an die Richtlinie (die Strategie für das Handeln) oder die Wertfunktion (die geschätzte zukünftige Belohnung). Dies ermöglicht es dem Agenten, unstrukturierte Daten zu verarbeiten und Computer Vision (CV) zu nutzen, um die Umgebung ähnlich wie ein Mensch zu „sehen“. Diese Fähigkeit wird durch Frameworks wie PyTorch oder TensorFlow unterstützt, die das Training dieser komplexen Netzwerke erleichtern.

Link to this sectionPraxisanwendungen#

DRL hat sich über die theoretische Forschung hinaus zu praktischen, wirkungsvollen Anwendungen in verschiedenen Branchen entwickelt:

  • Fortgeschrittene Robotik: Im Bereich KI in der Robotik ermöglicht DRL Maschinen, komplexe motorische Fähigkeiten zu beherrschen, die schwer fest zu programmieren sind. Roboter können lernen, unregelmäßige Objekte zu greifen oder unebenes Gelände zu durchqueren, indem sie ihre Bewegungen in Physik-Engines wie NVIDIA Isaac Sim verfeinern. Dies beinhaltet oft das Training mit synthetischen Daten, bevor die Richtlinie auf physische Hardware übertragen wird.
  • Autonomes Fahren: Autonome Fahrzeuge nutzen DRL, um Echtzeitentscheidungen in unvorhersehbaren Verkehrsszenarien zu treffen. Während Objekterkennungsmodelle Fußgänger und Schilder identifizieren, nutzen DRL-Algorithmen diese Informationen, um sichere Fahrrichtlinien für das Einfädeln, das Navigieren an Kreuzungen und die Geschwindigkeitsregelung festzulegen, wobei die für die Sicherheit erforderliche Inferenzlatenz effektiv verwaltet wird.

Link to this sectionVision als Zustandsbeobachter#

Für viele DRL-Anwendungen ist der „Zustand“ visuell. Hochgeschwindigkeitsmodelle fungieren als Augen des Agenten und wandeln rohe Bilder in strukturierte Daten um, auf die das Richtliniennetzwerk reagieren kann. Das folgende Beispiel veranschaulicht, wie das YOLO26 Modell als Wahrnehmungsschicht für einen Agenten dient und Beobachtungen (z. B. Hinderniszählungen) aus der Umgebung extrahiert.

from ultralytics import YOLO

# Load YOLO26n to serve as the perception layer for a DRL agent
model = YOLO("yolo26n.pt")

# Simulate an observation from the environment (e.g., a robot's camera feed)
observation_frame = "https://ultralytics.com/images/bus.jpg"

# Perform inference to extract the state (detected objects)
results = model(observation_frame)

# The detection count serves as a simplified state feature for the agent's policy
print(f"State Observation: {len(results[0].boxes)} objects detected.")

Link to this sectionUnterscheidung von DRL und verwandten Konzepten#

Es ist hilfreich, Deep Reinforcement Learning von ähnlichen Begriffen zu unterscheiden, um seine einzigartige Position in der KI-Landschaft zu verstehen:

  • Reinforcement Learning (RL): Standard-RL ist das grundlegende Konzept, stützt sich jedoch typischerweise auf Nachschlagetabellen (wie Q-Tabellen), die für große Zustandsräume unpraktisch werden. DRL löst dies durch den Einsatz von Deep Learning zur Funktionsapproximation, was es ermöglicht, komplexe Eingaben wie Bilder zu verarbeiten.
  • Reinforcement Learning from Human Feedback (RLHF): Während DRL typischerweise auf eine mathematisch definierte Belohnungsfunktion optimiert (z. B. Punkte in einem Spiel), verfeinert RLHF Modelle – insbesondere Large Language Models (LLMs) – unter Verwendung subjektiver menschlicher Präferenzen, um das KI-Verhalten mit menschlichen Werten in Einklang zu bringen, eine Technik, die von Forschungsgruppen wie OpenAI populär gemacht wurde.
  • Unsupervised Learning: Unüberwachte Methoden suchen nach verborgenen Mustern in Daten ohne explizites Feedback. Im Gegensatz dazu ist DRL zielorientiert und wird von einem Belohnungssignal gesteuert, das den Agenten aktiv auf ein bestimmtes Ziel hin lenkt, wie in den grundlegenden Texten von Sutton und Barto erörtert.

Entwickler, die die Datensätze verwalten möchten, die für die Wahrnehmungsschichten von DRL-Systemen erforderlich sind, können die Ultralytics Platform nutzen, die Annotations- und Cloud-Trainingsworkflows vereinfacht. Zusätzlich verwenden Forscher häufig standardisierte Umgebungen wie Gymnasium, um ihre DRL-Algorithmen anhand etablierter Benchmarks zu messen.

Explore solutions

Real-time AI that works with your team

KI in der Robotik

Stärke intelligentere Maschinen mit Ultralytics YOLO Modellen. Vision AI in der Robotik treibt autonome Navigation, Wahrnehmung, Objektverfolgung und Echtzeitsteuerung voran.

Erfahre mehr
Real-time AI that works with your team

KI in der Logistik

Optimiere die Logistik mit Ultralytics YOLO-Modellen. Vision AI ermöglicht Paketkontrolle, Sortierung, Fahrzeugverfolgung und Echtzeit-Überwachung der Lagersicherheit.

Erfahre mehr
Real-time AI that works with your team

KI im Einzelhandel

Erfinde den Einzelhandel neu mit Ultralytics YOLO-Modellen. Vision AI fördert Bestandsverfolgung, Regalüberwachung, Warteschlangenmanagement und intelligentere Kundeneinblicke.

Erfahre mehr
Real-time AI that works with your team

KI im Gesundheitswesen

Baue Gesundheitslösungen mit Ultralytics YOLO Modellen. Vision AI im Gesundheitswesen ermöglicht schnellere medizinische Bildgebung, intelligentere Diagnostik und Patientenüberwachung.

Erfahre mehr
Real-time AI that works with your team

KI in der Fertigung

Optimiere die Fertigung mit Ultralytics YOLO-Modellen. Vision AI treibt Qualitätskontrolle, Fehlererkennung, PSA-Einhaltung und die Automatisierung von Montagelinien voran.

Erfahre mehr
Real-time AI that works with your operation

KI in der Automobilbranche

Nutze Computer Vision in der Automobilindustrie mit Ultralytics YOLO Modellen. Vision AI steigert die Verkehrssicherheit, Fahrerassistenz und Fahrzeugautomatisierung für intelligentere Straßen.

Erfahre mehr
Real-time AI tailored to your operation

KI in der Landwirtschaft

Bringe Vision AI mit Ultralytics YOLO Modellen in die smarte Landwirtschaft. Optimiere die Ernteüberwachung, Viehverfolgung und Präzisionslandwirtschaft für höhere, intelligentere Erträge.

Erfahre mehr
Real-time AI that works with your team

KI in der Robotik

Stärke intelligentere Maschinen mit Ultralytics YOLO Modellen. Vision AI in der Robotik treibt autonome Navigation, Wahrnehmung, Objektverfolgung und Echtzeitsteuerung voran.

Erfahre mehr
Real-time AI that works with your team

KI in der Logistik

Optimiere die Logistik mit Ultralytics YOLO-Modellen. Vision AI ermöglicht Paketkontrolle, Sortierung, Fahrzeugverfolgung und Echtzeit-Überwachung der Lagersicherheit.

Erfahre mehr
Real-time AI that works with your team

KI im Einzelhandel

Erfinde den Einzelhandel neu mit Ultralytics YOLO-Modellen. Vision AI fördert Bestandsverfolgung, Regalüberwachung, Warteschlangenmanagement und intelligentere Kundeneinblicke.

Erfahre mehr
Real-time AI that works with your team

KI im Gesundheitswesen

Baue Gesundheitslösungen mit Ultralytics YOLO Modellen. Vision AI im Gesundheitswesen ermöglicht schnellere medizinische Bildgebung, intelligentere Diagnostik und Patientenüberwachung.

Erfahre mehr
Real-time AI that works with your team

KI in der Fertigung

Optimiere die Fertigung mit Ultralytics YOLO-Modellen. Vision AI treibt Qualitätskontrolle, Fehlererkennung, PSA-Einhaltung und die Automatisierung von Montagelinien voran.

Erfahre mehr
Real-time AI that works with your operation

KI in der Automobilbranche

Nutze Computer Vision in der Automobilindustrie mit Ultralytics YOLO Modellen. Vision AI steigert die Verkehrssicherheit, Fahrerassistenz und Fahrzeugautomatisierung für intelligentere Straßen.

Erfahre mehr
Real-time AI tailored to your operation

KI in der Landwirtschaft

Bringe Vision AI mit Ultralytics YOLO Modellen in die smarte Landwirtschaft. Optimiere die Ernteüberwachung, Viehverfolgung und Präzisionslandwirtschaft für höhere, intelligentere Erträge.

Erfahre mehr
Real-time AI that works with your team

KI in der Robotik

Stärke intelligentere Maschinen mit Ultralytics YOLO Modellen. Vision AI in der Robotik treibt autonome Navigation, Wahrnehmung, Objektverfolgung und Echtzeitsteuerung voran.

Erfahre mehr
Real-time AI that works with your team

KI in der Logistik

Optimiere die Logistik mit Ultralytics YOLO-Modellen. Vision AI ermöglicht Paketkontrolle, Sortierung, Fahrzeugverfolgung und Echtzeit-Überwachung der Lagersicherheit.

Erfahre mehr
Real-time AI that works with your team

KI im Einzelhandel

Erfinde den Einzelhandel neu mit Ultralytics YOLO-Modellen. Vision AI fördert Bestandsverfolgung, Regalüberwachung, Warteschlangenmanagement und intelligentere Kundeneinblicke.

Erfahre mehr
Real-time AI that works with your team

KI im Gesundheitswesen

Baue Gesundheitslösungen mit Ultralytics YOLO Modellen. Vision AI im Gesundheitswesen ermöglicht schnellere medizinische Bildgebung, intelligentere Diagnostik und Patientenüberwachung.

Erfahre mehr
Real-time AI that works with your team

KI in der Fertigung

Optimiere die Fertigung mit Ultralytics YOLO-Modellen. Vision AI treibt Qualitätskontrolle, Fehlererkennung, PSA-Einhaltung und die Automatisierung von Montagelinien voran.

Erfahre mehr
Real-time AI that works with your operation

KI in der Automobilbranche

Nutze Computer Vision in der Automobilindustrie mit Ultralytics YOLO Modellen. Vision AI steigert die Verkehrssicherheit, Fahrerassistenz und Fahrzeugautomatisierung für intelligentere Straßen.

Erfahre mehr
Real-time AI tailored to your operation

KI in der Landwirtschaft

Bringe Vision AI mit Ultralytics YOLO Modellen in die smarte Landwirtschaft. Optimiere die Ernteüberwachung, Viehverfolgung und Präzisionslandwirtschaft für höhere, intelligentere Erträge.

Erfahre mehr

Lass uns gemeinsam die Zukunft der KI bauen!

Beginne deine Reise mit der Zukunft des maschinellen Lernens