Entdecken Sie Agentic RAG, um KI mit autonomem Denken zu verbessern. Erfahren Sie, wie Ultralytics und die Ultralytics intelligentes Retrieval und Vision ermöglichen.
Agentic Retrieval-Augmented Generation (Agentic RAG) ist eine fortschrittliche Künstliche Intelligenz (KI) Architektur, die traditionelle Abrufsysteme durch die Integration autonomer KI-Agenten verbessert. Während Standard-RAG-Pipelines in einer linearen „Abruf-und-Generierung”-Sequenz arbeiten, ermöglicht Agentic RAG einem Large Language Model (LLM) als intelligenter Orchestrator zu agieren. Dieser Agent kann die Eingabe eines Benutzers unabhängig analysieren, feststellen, ob externe Informationen benötigt werden, mehrere Suchanfragen formulieren, die abgerufenen Daten auswerten und seine Recherche iterativ verfeinern, bis er eine umfassende und genaue Antwort zusammengestellt hat. Durch die Nutzung von Funktionsaufruf- und Tool-Nutzungsfunktionen leiten diese Systeme Anfragen dynamisch an verschiedene Datenbanken, APIs und Analysetools weiter, wodurch Halluzinationen in LLMs bei der Bearbeitung komplexer, mehrstufiger Probleme erheblich reduziert werden.
Die zentrale Innovation von Agentic RAG liegt in seiner Fähigkeit zum Schleifen und Schlussfolgern. Führende agente KI-Frameworks strukturieren diesen Prozess in dynamische, autonome Arbeitsabläufe:
Um robuste generative Pipelines zu implementieren, ist es entscheidend, Agentic RAG von seinen grundlegenden Konzepten zu unterscheiden:
Agentic RAG verändert Branchen, indem es tiefgreifende Forschungs- und komplexe Fehlerbehebungsaufgaben automatisiert, die das menschliche analytische Denken nachahmen.
Vision-Modelle dienen als leistungsstarke sensorische Werkzeuge für Agentic RAG-Systeme, die mit der physischen Welt interagieren. Beispielsweise kann ein Agent Ultralytics verwenden, um dynamisch visuellen Kontext aus einem Bild- oder Videostream abzurufen und so Benutzeranfragen zu beantworten. Entwickler können die Datenannotation und das Training dieser benutzerdefinierten Vision-Tools mithilfe Ultralytics verwalten.
Das folgende Python zeigt, wie ein KI-Agent YOLO26 programmgesteuert aufrufen könnte, um strukturierte Beobachtungen aus einem Bild zu extrahieren und so den faktischen Kontext für seinen nächsten Schlussfolgerungsschritt zu sammeln.
from ultralytics import YOLO
# Initialize YOLO26 for the agent's visual retrieval tool
model = YOLO("yolo26n.pt")
# The agent invokes the model on an image to gather visual facts
results = model("https://ultralytics.com/images/bus.jpg")
# The agent parses the detected objects to formulate its next query or action
visual_context = [model.names[int(c)] for c in results[0].boxes.cls]
print(f"Agent Observation: I currently see {', '.join(visual_context)}.")
Durch die Verbindung hochleistungsfähiger Bildverarbeitungsmodelle mit Schlussfolgerungsmaschinen schließt Agentic RAG die Lücke zwischen statischer Wissensgewinnung und dynamischer, realer räumlicher Intelligenz. Für einen tieferen Einblick in die sich entwickelnde Landschaft autonomer Systeme bietet der Stanford AI Index Report eine umfassende Nachverfolgung der agentenbasierten Fähigkeiten.