Agentic RAG

Explore l'Agentic RAG pour améliorer l'IA avec un raisonnement autonome. Apprends comment Ultralytics YOLO26 et la plateforme Ultralytics propulsent la récupération intelligente et la vision.

L'Agentic Retrieval-Augmented Generation (Agentic RAG) est une architecture d'intelligence artificielle (IA) avancée qui améliore les systèmes de récupération traditionnels en intégrant des agents IA autonomes. Alors que les pipelines RAG standards fonctionnent selon une séquence linéaire de « récupération-puis-génération », l'Agentic RAG permet à un Large Language Model (LLM) d'agir comme un orchestrateur intelligent. Cet agent peut analyser indépendamment l'invite de l'utilisateur, déterminer si des informations externes sont nécessaires, formuler plusieurs requêtes de recherche, évaluer les données récupérées et affiner ses recherches de manière itérative jusqu'à ce qu'il compile une réponse complète et précise. En tirant parti des capacités de function calling and tool use, ces systèmes acheminent dynamiquement les requêtes à travers diverses bases de données, API et outils d'analyse, réduisant ainsi considérablement les hallucinations in LLMs lors du traitement de problèmes complexes en plusieurs étapes.

Link to this sectionComment fonctionnent les systèmes Agentic RAG#

L'innovation fondamentale de l'Agentic RAG réside dans sa capacité à boucler et à raisonner. Les principaux frameworks d'IA agentique structurent ce processus en flux de travail dynamiques et autonomes :

Planification et routage des requêtes : L'agent décompose les questions complexes en sous-tâches plus petites et gérables, et achemine chacune vers l'outil ou la base de données vectorielle la plus appropriée.
Récupération itérative : Contrairement à la récupération statique, l'agent examine les documents récupérés. Si le contexte est insuffisant, il reformule sa stratégie de recherche et interroge à nouveau.
Intégration d'outils : L'agent peut écrire et exécuter du code, effectuer des calculs mathématiques ou déclencher des modèles de machine learning (ML) pour synthétiser de nouvelles données à la volée.

Link to this sectionAgentic RAG vs. RAG Standard#

Pour implémenter des pipelines génératifs robustes, il est crucial de différencier l'Agentic RAG de ses concepts fondamentaux :

Standard Retrieval-Augmented Generation (RAG) : Fonctionne en un seul passage. Il récupère des documents basés sur la similarité sémantique et génère une réponse. Il peine avec une logique complexe qui nécessite de synthétiser des sources de données disparates sur plusieurs étapes.
Agentic RAG : Introduit la prise de décision et des boucles. L'agent évalue la qualité de la récupération et peut déclencher des recherches ultérieures ou utiliser différents outils avant de finaliser sa génération.
Multimodal RAG : Se concentre sur la récupération de divers types de données (images, texte, vidéo). L'Agentic RAG peut contrôler un pipeline Multimodal RAG, en décidant quand rechercher dans une base de données visuelle plutôt que dans un document texte.

Link to this sectionApplications concrètes#

L'Agentic RAG transforme les industries en automatisant la recherche approfondie et les tâches complexes de dépannage qui imitent le raisonnement analytique humain.

Synthèse des connaissances en entreprise : Dans les environnements d'entreprise, un agent peut recevoir une demande pour « résumer notre performance du T3 et la comparer aux derniers résultats de notre principal concurrent ». L'agent interroge de manière autonome les bases de données financières internes, effectue des recherches web en temps réel pour les dépôts des concurrents, analyse les chiffres à l'aide d'un outil de calcul et rédige une synthèse complète.
Autonomous Quality Inspection : Dans le secteur manufacturier, un agent peut être chargé d'identifier la cause profonde d'une défaillance d'assemblage. Il peut déclencher un modèle de computer vision (CV) pour inspecter un flux de caméra en direct, interroger les journaux de maintenance historiques et synthétiser un rapport de diagnostic basé sur des preuves visuelles et textuelles.

Link to this sectionIntégrer l'IA visuelle dans les flux de travail agentiques#

Les modèles de vision servent d'outils sensoriels puissants pour les systèmes Agentic RAG interagissant avec le monde physique. Par exemple, un agent peut utiliser Ultralytics YOLO26 pour récupérer dynamiquement un contexte visuel à partir d'une image ou d'un flux vidéo afin de répondre aux requêtes des utilisateurs. Les développeurs peuvent gérer l'annotation des données et l'entraînement de ces outils de vision personnalisés en utilisant la Ultralytics Platform.

L'exemple Python suivant démontre comment un agent IA pourrait appeler par programme YOLO26 pour extraire des observations structurées d'une image, rassemblant un contexte factuel pour sa prochaine étape de raisonnement.

from ultralytics import YOLO

# Initialize YOLO26 for the agent's visual retrieval tool
model = YOLO("yolo26n.pt")

# The agent invokes the model on an image to gather visual facts
results = model("https://ultralytics.com/images/bus.jpg")

# The agent parses the detected objects to formulate its next query or action
visual_context = [model.names[int(c)] for c in results[0].boxes.cls]
print(f"Agent Observation: I currently see {', '.join(visual_context)}.")

En connectant des modèles de vision hautement performants à des moteurs de raisonnement, l'Agentic RAG comble le fossé entre la récupération statique de connaissances et l' intelligence spatiale dynamique du monde réel. Pour un examen plus approfondi du paysage en évolution des systèmes autonomes, le Stanford AI Index Report fournit un suivi complet des capacités agentiques.

Agentic RAG

Link to this sectionComment fonctionnent les systèmes Agentic RAG#

Link to this sectionAgentic RAG vs. RAG Standard#

Link to this sectionApplications concrètes#

Link to this sectionIntégrer l'IA visuelle dans les flux de travail agentiques#

Explore solutions

IA dans la robotique

IA dans la logistique

IA dans le commerce de détail

IA dans la santé

IA dans la fabrication

IA dans l'automobile

IA en agriculture

IA dans la robotique

IA dans la logistique

IA dans le commerce de détail

IA dans la santé

IA dans la fabrication

IA dans l'automobile

IA en agriculture

IA dans la robotique

IA dans la logistique

IA dans le commerce de détail

IA dans la santé

IA dans la fabrication

IA dans l'automobile

IA en agriculture

Construisons ensemble le futur de l'IA !