ReAct Prompting
Entdecke ReAct-Prompting, um autonome KI-Agenten zu entwickeln. Lerne, wie Reasoning und Acting mit LLMs und Vision-Tools wie Ultralytics YOLO26 synergetisch zusammenwirken.
ReAct (Reasoning and Acting) Prompting ist ein fortschrittliches Prompt Engineering-Paradigma, das es Large Language Models (LLMs) ermöglicht, schrittweise Schlussfolgerungen dynamisch mit aufgabenspezifischen Aktionen zu verknüpfen. Diese Technik, die in der einflussreichen akademischen Arbeit aus dem Jahr 2022 "ReAct: Synergizing Reasoning and Acting in Language Models" vorgestellt wurde, verwandelt ein statisches Sprachmodell in einen interaktiven AI Agent. Durch das explizite Generieren von Gedanken zu einem Problem und das Ausführen von Aktionen zum Abrufen externer Informationen verbessert das ReAct-Framework die faktische Genauigkeit und die Entscheidungsfähigkeit in komplexen künstlichen Intelligenz-Workflows erheblich.
Link to this sectionDie Mechanik von Reasoning and Acting#
Bei herkömmlichen Interaktionen generiert ein Modell eine Antwort, die vollständig auf seinem internen Wissen basiert, was oft zu Halluzinationen in LLMs führt. Die ReAct-Architektur löst dies, indem sie die KI in externen Umgebungen verankert, und zwar durch eine kontinuierliche Schleife aus Gedanken, Aktionen und Beobachtungen.
Wenn das Modell mit einer Anfrage konfrontiert wird, generiert es zuerst einen "Gedanken", um seine Strategie zu skizzieren. Dann löst es eine "Aktion" aus, wie etwa das Abfragen einer Suchmaschine, die Interaktion mit einer Datenbank oder den Aufruf einer Vision-API durch ein Konzept, das als Function Calling bekannt ist. Die Umgebung liefert eine "Beobachtung", die faktenbasierte Daten bereitstellt. Das Modell bewertet diese neuen Informationen, aktualisiert seine Schlussfolgerungen und wiederholt den Zyklus, bis es zur endgültigen Antwort gelangt. Diese Methodik, die im Prompt Engineering Guide on ReAct weiter erläutert wird, spiegelt menschliche Problemlösung wider und etabliert äußerst transparente und kontrollierbare Agentenverhaltensweisen.
Link to this sectionPraxisanwendungen#
ReAct Prompting zeichnet sich in Szenarien aus, die iterative Problemlösung und den Einsatz von Tools in mehreren Schritten erfordern, was es zu einer grundlegenden Komponente moderner agentischer KI-Systeme macht.
- Automatisierte Kundensupport-Agenten: In Unternehmensumgebungen nutzen IT-Helpdesk-Agenten ReAct, um Benutzeranfragen zu lösen. Wenn ein Benutzer einen Netzwerkausfall meldet, schließt der Agent, dass er den Serverstatus prüfen muss. Er handelt, indem er eine Diagnose-API anpingt, das Ergebnis beobachtet und dann entweder das Ticket eskaliert oder eine Anleitung zur Fehlerbehebung basierend auf den abgerufenen Fakten bereitstellt, was herkömmliche Retrieval-Augmented Generation (RAG)-Pipelines optimiert.
- Dynamische visuelle Analyse: Computer Vision-Systeme nutzen ReAct für die komplexe visuelle Beantwortung von Fragen. Ein Roboter-Agent, der mit der Bestandsverwaltung betraut ist, könnte ein Regal beobachten, schlussfolgern, dass er bestimmte Artikel zählen muss, durch den Aufruf eines Object Detection-Modells handeln und die zurückgegebenen BBox-Daten verwenden, um seine Zählung abzuschließen. Diese Synergie überbrückt die Lücke zwischen textbasierter Schlussfolgerung und räumlichem Verständnis.
Link to this sectionImplementierung von ReAct mit Computer Vision#
Für Entwickler, die Python verwenden, orchestrieren ReAct-Agenten oft Wahrnehmungsmodelle, um mit der physischen Welt zu interagieren. Der folgende konzeptionelle Code zeigt, wie eine ReAct-Schlussfolgerungsschleife nahtlos ein Ultralytics YOLO26-Modell als externes Tool einsetzen könnte, um eine Umgebung zu beobachten und darüber zu berichten.
from ultralytics import YOLO
def vision_tool(image_path: str) -> str:
"""Action tool for a ReAct agent to detect objects in an image."""
model = YOLO("yolo26n.pt") # Load highly efficient YOLO26 nano model
results = model(image_path)
# Format the observation for the LLM's reasoning loop
detected_classes = [model.names[int(c)] for c in results[0].boxes.cls]
return f"Observation: Found {len(detected_classes)} objects: {', '.join(detected_classes)}"
# Simulated ReAct agent executing an action
agent_observation = vision_tool("https://ultralytics.com/images/bus.jpg")
print(agent_observation)Die Verwaltung von Datensätzen und die Nachverfolgung von Experimenten für diese Vision-Tools können vollständig mit der Ultralytics Platform optimiert werden, die umfassende Lösungen für die moderne KI-Bereitstellung bietet. Diejenigen, die daran interessiert sind, diese Agenten von Grund auf neu zu erstellen, können auch die zugrunde liegende Logik im offiziellen ReAct-Repository studieren.
Link to this sectionUnterscheidung verwandter Konzepte#
Um robuste multimodale Architekturen zu entwerfen, wie sie in der jüngsten akademischen Ausrichtungsforschung untersucht wurden, ist es entscheidend, ReAct von verwandten Engineering-Mustern zu unterscheiden:
- Vs. Chain-of-Thought Prompting: Chain-of-Thought (CoT) ermutigt ein Modell dazu, Schritt für Schritt zu denken, stützt sich jedoch vollständig auf statisches, internes Wissen. ReAct erweitert CoT durch das Einfügen dynamischer "Aktionen", die während des Schlussfolgerungsprozesses frische, externe Beobachtungen sammeln.
- Vs. Prompt Chaining: Prompt Chaining beinhaltet das Hardcodieren einer Sequenz separater LLM-Aufrufe, bei der die Ausgabe eines Schrittes automatisch in den nächsten eingespeist wird. ReAct ist ein autonomeres Paradigma, bei dem ein einzelner Agent basierend auf laufenden Beobachtungen dynamisch entscheidet, welche Tools oder sequenziellen Aktionen er ergreift, anstatt einem starr verketteten Skript zu folgen.
Durch die Vereinheitlichung logischer Schlussfolgerungen mit der Ausführung spezialisierter externer Tools wie Multi-Modal Models ermöglicht ReAct Prompting die Entwicklung hochleistungsfähiger, verallgemeinerter KI-Systeme.






