Yolo Vision Shenzhen
Shenzhen
Rejoindre maintenant
Glossaire

RAG agentique

Découvrez Agentic RAG pour améliorer l'IA grâce au raisonnement autonome. Découvrez comment Ultralytics et la Ultralytics optimisent la recherche et la vision intelligentes.

La génération augmentée par la récupération agentique (Agentic RAG) est une architecture avancée d' intelligence artificielle (IA) qui améliore les systèmes de récupération traditionnels en intégrant des agents IA autonomes . Alors que les pipelines RAG standard fonctionnent selon une séquence linéaire « récupération-génération », Agentic RAG permet à un grand modèle linguistique (LLM) d'agir comme un orchestrateur intelligent. Cet agent peut analyser de manière indépendante la requête d'un utilisateur, déterminer si des informations externes sont nécessaires, formuler plusieurs requêtes de recherche, évaluer les données récupérées et affiner de manière itérative ses recherches jusqu'à ce qu'il compile une réponse complète et précise. En tirant parti des capacités d'appel de fonctions et d'utilisation d'outils, ces systèmes acheminent de manière dynamique les requêtes vers diverses bases de données, API et outils analytiques, réduisant ainsi considérablement les hallucinations dans les LLM lorsqu'ils traitent des problèmes complexes en plusieurs étapes.

Comment fonctionnent les systèmes RAG agentiels

L'innovation principale de l'Agentic RAG réside dans sa capacité à boucler et à raisonner. Les principaux cadres d'IA agentique structurent ce processus en flux de travail dynamiques et autonomes :

RAG agentique vs RAG standard

Pour mettre en œuvre des pipelines génératifs robustes, il est essentiel de différencier l'Agentic RAG de ses concepts fondamentaux :

  • Génération augmentée par récupération (RAG) standard: fonctionne en un seul passage. Elle récupère les documents en fonction de leur similarité sémantique et génère une réponse. Elle a du mal avec la logique complexe qui nécessite la synthèse de sources de données disparates en plusieurs étapes
  • RAG agentique: introduit la prise de décision et les boucles. L'agent évalue la qualité de la récupération et peut déclencher des recherches supplémentaires ou différents outils avant de finaliser sa génération.
  • RAG multimodal: se concentre sur la récupération de divers types de données (images, texte, vidéo). Le RAG agentique peut contrôler un pipeline RAG multimodal , en décidant quand effectuer une recherche dans une base de données visuelle plutôt que dans un document texte.

Applications concrètes

Agentic RAG transforme les industries en automatisant les tâches de recherche approfondie et de dépannage complexe qui imitent le raisonnement analytique humain.

  • Synthèse des connaissances d'entreprise: Dans un environnement d'entreprise, un agent peut recevoir une invite lui demandant de « résumer nos performances du troisième trimestre et de les comparer aux derniers résultats de notre principal concurrent ». L'agent interroge de manière autonome les bases de données financières internes, effectue des recherches en temps réel sur le Web pour trouver les documents déposés par les concurrents, analyse les chiffres à l'aide d'un outil de calcul et rédige un rapport complet.
  • Inspection autonome de la qualité: Dans le domaine de la fabrication, un agent peut être chargé d'identifier la cause première d'une défaillance d'assemblage. Il peut déclencher un modèle de vision par ordinateur (CV) pour inspecter un flux de caméra en direct, interroger les journaux de maintenance historiques et synthétiser un rapport de diagnostic basé sur des preuves visuelles et textuelles .

Intégration de l'IA visuelle dans les flux de travail agentiques

Les modèles de vision constituent de puissants outils sensoriels pour les systèmes RAG agents qui interagissent avec le monde physique. Par exemple, un agent peut utiliser Ultralytics pour extraire de manière dynamique le contexte visuel d'une image ou d'un flux vidéo afin de répondre aux requêtes des utilisateurs. Les développeurs peuvent gérer l'annotation des données et la formation de ces outils de vision personnalisés à l'aide de Ultralytics .

Python suivant montre comment un agent IA pourrait invoquer YOLO26 par programmation pour extraire des observations structurées d'une image, recueillant ainsi un contexte factuel pour sa prochaine étape de raisonnement.

from ultralytics import YOLO

# Initialize YOLO26 for the agent's visual retrieval tool
model = YOLO("yolo26n.pt")

# The agent invokes the model on an image to gather visual facts
results = model("https://ultralytics.com/images/bus.jpg")

# The agent parses the detected objects to formulate its next query or action
visual_context = [model.names[int(c)] for c in results[0].boxes.cls]
print(f"Agent Observation: I currently see {', '.join(visual_context)}.")

En connectant des modèles de vision hautement performants à des moteurs de raisonnement, Agentic RAG comble le fossé entre la recherche de connaissances statiques et l'intelligence spatiale dynamique et réelle . Pour approfondir la question de l' évolution des systèmes autonomes, le rapport Stanford AI Index fournit un suivi complet des capacités agentives .

Boostez votre énergie avec Ultralytics YOLO

Bénéficiez d'une vision IA avancée pour vos projets. Trouvez la licence adaptée à vos objectifs dès aujourd'hui.

Explorer les options de licence