Descubra cómo GraphRAG combina los grafos de conocimiento con RAG para mejorar el razonamiento de los modelos de lenguaje grande (LLM). Aprenda a crear canalizaciones multimodales utilizando Ultralytics y la plataforma.
La generación aumentada por recuperación de grafos (GraphRAG) es un marco avanzado que integra grafos de conocimiento estructurados con la generación aumentada por recuperación (RAG) para mejorar significativamente las capacidades contextuales y de razonamiento de los modelos de lenguaje grandes (LLM). Al organizar los datos en nodos y aristas explícitamente interconectados, GraphRAG permite a los sistemas de IA comprender relaciones complejas que la recuperación tradicional de texto no estructurado podría pasar por alto. Esta base estructural reduce drásticamente las alucinaciones en los LLM y proporciona respuestas más precisas para aplicaciones empresariales complejas, como las creadas con los modelos de generación de texto de OpenAI. Este enfoque ha ganado un gran impulso recientemente, con estudios fundamentales de Microsoft que destacan la capacidad de GraphRAG para responder a preguntas complejas de múltiples saltos sobre conjuntos de datos privados y altamente conectados.
Los sistemas RAG estándar se basan principalmente en bases de datos vectoriales y búsquedas semánticas para encontrar documentos basándose en similitudes matemáticas mediante incrustaciones. Aunque esto es muy eficaz para consultas directas sobre hechos, tiene dificultades con el razonamiento «multisalto», es decir, responder a preguntas que requieren reunir hechos distintos dispersos en varios documentos.
GraphRAG salva esta brecha al mapear explícitamente cómo se relacionan las entidades entre sí. En lugar de limitarse a recuperar fragmentos de texto similares , navega por una topología gráfica estructurada. Esto lo hace muy superior para la minería de datos profunda y la deducción lógica compleja. Para los ingenieros e investigadores que construyen estas canalizaciones de razonamiento, las herramientas de orquestación de código abierto como LangChain proporcionan robustos marcos de integración gráfica para simplificar la implementación.
GraphRAG está transformando la forma en que las industrias procesan información densa e interconectada:
La incorporación de la visión artificial en los sistemas GraphRAG introduce el aprendizaje multimodal, lo que permite a la IA «ver» y mapear dinámicamente el mundo físico en datos estructurales. Mediante el uso de modelos de visión de última generación, como Ultralytics , los desarrolladores pueden extraer automáticamente objetos físicos de imágenes o fuentes de vídeo para que sirvan como nodos contextuales dentro de una arquitectura GraphRAG más amplia.
import torch
from ultralytics import YOLO
# Load the recommended Ultralytics YOLO26 model
model = YOLO("yolo26n.pt")
# Run inference to extract visual objects for a GraphRAG pipeline
results = model("https://ultralytics.com/images/bus.jpg")
# Extract detected object classes to act as graph nodes
detected_classes = [model.names[int(c)] for c in results[0].boxes.cls]
nodes = torch.tensor([[i] for i in range(len(detected_classes))], dtype=torch.float)
print(f"Graph Nodes Extracted: {set(detected_classes)}")
# These visual entity nodes can now be linked in a graph database
Para los equipos que desarrollan estas complejas aplicaciones multimodales, la gestión de los conjuntos de datos de visión personalizados necesarios se simplifica enormemente gracias a la Ultralytics , que ofrece potentes funciones de formación en la nube y despliegue de modelos sin necesidad de código. Para explorar las matemáticas fundamentales y los tensores que hay detrás de la creación de grafos, revisar la documentaciónPyTorch sobre tensores y profundizar en los últimos artículos de arXiv sobre implementaciones de GraphRAG proporcionará una visión técnica profunda sobre el futuro de la inteligencia artificial.