Découvrez Agentic RAG pour améliorer l'IA grâce au raisonnement autonome. Découvrez comment Ultralytics et la Ultralytics optimisent la recherche et la vision intelligentes.
La génération augmentée par la récupération agentique (Agentic RAG) est une architecture avancée d' intelligence artificielle (IA) qui améliore les systèmes de récupération traditionnels en intégrant des agents IA autonomes . Alors que les pipelines RAG standard fonctionnent selon une séquence linéaire « récupération-génération », Agentic RAG permet à un grand modèle linguistique (LLM) d'agir comme un orchestrateur intelligent. Cet agent peut analyser de manière indépendante la requête d'un utilisateur, déterminer si des informations externes sont nécessaires, formuler plusieurs requêtes de recherche, évaluer les données récupérées et affiner de manière itérative ses recherches jusqu'à ce qu'il compile une réponse complète et précise. En tirant parti des capacités d'appel de fonctions et d'utilisation d'outils, ces systèmes acheminent de manière dynamique les requêtes vers diverses bases de données, API et outils analytiques, réduisant ainsi considérablement les hallucinations dans les LLM lorsqu'ils traitent des problèmes complexes en plusieurs étapes.
L'innovation principale de l'Agentic RAG réside dans sa capacité à boucler et à raisonner. Les principaux cadres d'IA agentique structurent ce processus en flux de travail dynamiques et autonomes :
Pour mettre en œuvre des pipelines génératifs robustes, il est essentiel de différencier l'Agentic RAG de ses concepts fondamentaux :
Agentic RAG transforme les industries en automatisant les tâches de recherche approfondie et de dépannage complexe qui imitent le raisonnement analytique humain.
Les modèles de vision constituent de puissants outils sensoriels pour les systèmes RAG agents qui interagissent avec le monde physique. Par exemple, un agent peut utiliser Ultralytics pour extraire de manière dynamique le contexte visuel d'une image ou d'un flux vidéo afin de répondre aux requêtes des utilisateurs. Les développeurs peuvent gérer l'annotation des données et la formation de ces outils de vision personnalisés à l'aide de Ultralytics .
Python suivant montre comment un agent IA pourrait invoquer YOLO26 par programmation pour extraire des observations structurées d'une image, recueillant ainsi un contexte factuel pour sa prochaine étape de raisonnement.
from ultralytics import YOLO
# Initialize YOLO26 for the agent's visual retrieval tool
model = YOLO("yolo26n.pt")
# The agent invokes the model on an image to gather visual facts
results = model("https://ultralytics.com/images/bus.jpg")
# The agent parses the detected objects to formulate its next query or action
visual_context = [model.names[int(c)] for c in results[0].boxes.cls]
print(f"Agent Observation: I currently see {', '.join(visual_context)}.")
En connectant des modèles de vision hautement performants à des moteurs de raisonnement, Agentic RAG comble le fossé entre la recherche de connaissances statiques et l'intelligence spatiale dynamique et réelle . Pour approfondir la question de l' évolution des systèmes autonomes, le rapport Stanford AI Index fournit un suivi complet des capacités agentives .