Découvrez comment GraphRAG combine les graphes de connaissances avec RAG pour améliorer le raisonnement LLM. Apprenez à créer des pipelines multimodaux à l'aide Ultralytics et de la plateforme.
Graph Retrieval-Augmented Generation (GraphRAG) est un cadre avancé qui intègre des graphes de connaissances structurés à la génération augmentée par la recherche (RAG) afin d'améliorer considérablement les capacités de raisonnement et de contextualisation des grands modèles linguistiques (LLM). En organisant les données en nœuds et arêtes explicitement interconnectés, GraphRAG permet aux systèmes d'IA de comprendre des relations complexes que la recherche traditionnelle de textes non structurés pourrait manquer. Cette base structurelle réduit considérablement les hallucinations dans les LLM et fournit des réponses plus précises pour les applications d'entreprise complexes, telles que celles construites avec les modèles de génération de texte d'OpenAI. Cette approche a récemment suscité un vif intérêt, des études fondamentales menées par Microsoft mettant en évidence la capacité de GraphRAGà répondre à des questions complexes à plusieurs niveaux sur des ensembles de données privés et hautement connectés.
Les systèmes RAG standard s'appuient principalement sur des bases de données vectorielles et la recherche sémantique pour trouver des documents en fonction de leur similarité mathématique à l'aide d'intégrations. Bien que cette méthode soit très efficace pour les requêtes factuelles directes, elle peine à traiter le raisonnement « multi-sauts », c'est-à-dire répondre à des questions qui nécessitent de rassembler des faits distincts dispersés dans plusieurs documents.
GraphRAG comble cette lacune en cartographiant explicitement les relations entre les entités. Au lieu de se contenter de récupérer des morceaux de texte similaires, il navigue dans une topologie graphique structurée. Cela le rend bien supérieur pour l'exploration approfondie des données et la déduction logique complexe. Pour les ingénieurs et les chercheurs qui construisent ces pipelines de raisonnement, les outils d'orchestration open source tels que LangChain fournissent des cadres d'intégration graphique robustes pour simplifier le déploiement.
GraphRAG transforme la manière dont les industries traitent les informations denses et interconnectées :
L'intégration de la vision par ordinateur dans les systèmes GraphRAG introduit l'apprentissage multimodal, permettant à l'IA de « voir » et de cartographier dynamiquement le monde physique en données structurelles. En utilisant des modèles de vision de pointe tels que Ultralytics , les développeurs peuvent extraire automatiquement des objets physiques à partir d'images ou de flux vidéo afin qu'ils servent de nœuds contextuels au sein d'une architecture GraphRAG plus large.
import torch
from ultralytics import YOLO
# Load the recommended Ultralytics YOLO26 model
model = YOLO("yolo26n.pt")
# Run inference to extract visual objects for a GraphRAG pipeline
results = model("https://ultralytics.com/images/bus.jpg")
# Extract detected object classes to act as graph nodes
detected_classes = [model.names[int(c)] for c in results[0].boxes.cls]
nodes = torch.tensor([[i] for i in range(len(detected_classes))], dtype=torch.float)
print(f"Graph Nodes Extracted: {set(detected_classes)}")
# These visual entity nodes can now be linked in a graph database
Pour les équipes qui développent ces applications multimodales complexes, la gestion des ensembles de données de vision personnalisés requis est considérablement simplifiée grâce à la Ultralytics , qui offre une formation cloud et un déploiement de modèles puissants et sans code. Pour explorer les mathématiques fondamentales et les tenseurs qui sous-tendent la création de graphes, consultez la documentationPyTorch sur les tenseurs et plongez-vous dans les articles récents d'arXiv sur les implémentations de GraphRAG pour obtenir des informations techniques approfondies sur l'avenir de l' intelligence artificielle.