Descubra como o GraphRAG combina gráficos de conhecimento com RAG para aprimorar o raciocínio LLM. Aprenda a construir pipelines multimodais usando Ultralytics e a plataforma.
A Geração Aumentada por Recuperação de Gráficos (GraphRAG) é uma estrutura avançada que integra Gráficos de Conhecimento estruturados com Geração Aumentada por Recuperação (RAG) para melhorar significativamente as capacidades de raciocínio e contextuais de Grandes Modelos de Linguagem (LLMs). Ao organizar os dados em nós e arestas explicitamente interligados, o GraphRAG permite que os sistemas de IA compreendam relações complexas que a recuperação tradicional de texto não estruturado pode deixar passar. Essa base estrutural reduz drasticamente as alucinações nos LLMs e fornece respostas mais precisas para aplicações empresariais complexas, como aquelas criadas com os modelos de geração de texto da OpenAI. A abordagem ganhou grande popularidade recentemente, com estudos fundamentais da Microsoft destacando a capacidade do GraphRAG de responder a perguntas complexas de múltiplos saltos em conjuntos de dados privados e altamente conectados.
Os sistemas RAG padrão dependem principalmente de bases de dados vetoriais e pesquisa semântica para encontrar documentos com base na semelhança matemática usando embeddings. Embora isso seja altamente eficaz para consultas factuais diretas, tem dificuldade com o raciocínio "multi-hop" — responder a perguntas que exigem reunir fatos distintos espalhados por vários documentos.
O GraphRAG preenche essa lacuna mapeando explicitamente como as entidades se relacionam entre si. Em vez de simplesmente buscar trechos de texto semelhantes, ele navega por uma topologia gráfica estruturada. Isso o torna muito superior para mineração profunda de dados e dedução lógica complexa. Para engenheiros e pesquisadores que constroem esses pipelines de raciocínio, ferramentas de orquestração de código aberto como o LangChain fornecem estruturas robustas de integração gráfica para simplificar a implementação.
O GraphRAG está a transformar a forma como as indústrias processam informações densas e interligadas:
A incorporação da visão computacional nos sistemas GraphRAG introduz a aprendizagem multimodal, permitindo que a IA «veja» e mapeie dinamicamente o mundo físico em dados estruturais. Ao utilizar modelos de visão de última geração, como Ultralytics , os programadores podem extrair automaticamente objetos físicos de imagens ou feeds de vídeo para servir como nós contextuais dentro de uma arquitetura GraphRAG mais ampla.
import torch
from ultralytics import YOLO
# Load the recommended Ultralytics YOLO26 model
model = YOLO("yolo26n.pt")
# Run inference to extract visual objects for a GraphRAG pipeline
results = model("https://ultralytics.com/images/bus.jpg")
# Extract detected object classes to act as graph nodes
detected_classes = [model.names[int(c)] for c in results[0].boxes.cls]
nodes = torch.tensor([[i] for i in range(len(detected_classes))], dtype=torch.float)
print(f"Graph Nodes Extracted: {set(detected_classes)}")
# These visual entity nodes can now be linked in a graph database
Para as equipas que desenvolvem estas aplicações multimodais complexas, a gestão dos conjuntos de dados de visão personalizados necessários é bastante simplificada com a utilização da Ultralytics , que oferece treinamento em nuvem e implementação de modelos poderosos e sem código. Para explorar a matemática fundamental e os tensores por trás da criação de gráficos, revisar a documentaçãoPyTorch sobre tensores e mergulhar nos artigos recentes do arXiv sobre implementações do GraphRAG fornecerá insights técnicos profundos sobre o futuro da inteligência artificial.