GraphRAG

Khám phá cách GraphRAG kết hợp Knowledge Graph với RAG để nâng cao khả năng suy luận của LLM. Tìm hiểu cách xây dựng các pipeline đa phương thức sử dụng Ultralytics YOLO26 và Ultralytics Platform.

Graph Retrieval-Augmented Generation (GraphRAG) là một framework tiên tiến tích hợp Knowledge Graphs có cấu trúc với Retrieval Augmented Generation (RAG) để nâng cao đáng kể khả năng lập luận và hiểu ngữ cảnh của các Large Language Models (LLMs). Bằng cách tổ chức dữ liệu thành các node và edge được kết nối rõ ràng, GraphRAG cho phép các hệ thống AI hiểu được những mối quan hệ phức tạp mà việc truy xuất văn bản phi cấu trúc truyền thống có thể bỏ lỡ. Nền tảng cấu trúc này giúp giảm đáng kể hallucinations in LLMs và cung cấp các phản hồi chính xác hơn cho các ứng dụng doanh nghiệp phức tạp, chẳng hạn như những ứng dụng được xây dựng bằng OpenAI's text generation models. Phương pháp này gần đây đã đạt được sức hút lớn, với các nghiên cứu nền tảng từ Microsoft Research nêu bật khả năng của GraphRAG trong việc trả lời các câu hỏi đa chặng phức tạp trên các tập dữ liệu riêng tư và có tính kết nối cao.

Link to this sectionGraphRAG so với RAG truyền thống#

Các hệ thống RAG tiêu chuẩn chủ yếu dựa vào vector databases và semantic search để tìm kiếm tài liệu dựa trên sự tương đồng toán học bằng cách sử dụng embeddings. Mặc dù phương pháp này rất hiệu quả cho các truy vấn thực tế trực tiếp, nhưng nó lại gặp khó khăn với lập luận "đa chặng"—tức là trả lời các câu hỏi đòi hỏi phải chắp ghép các dữ kiện riêng biệt nằm rải rác trên nhiều tài liệu khác nhau.

GraphRAG khắc phục khoảng cách này bằng cách ánh xạ rõ ràng cách các thực thể liên quan với nhau. Thay vì chỉ tìm nạp các đoạn văn bản tương tự, nó điều hướng theo cấu trúc topology của đồ thị. Điều này làm cho nó vượt trội hơn hẳn trong việc data mining chuyên sâu và suy luận logic phức tạp. Đối với các kỹ sư và nhà nghiên cứu đang xây dựng các pipeline lập luận này, các công cụ điều phối mã nguồn mở như LangChain cung cấp các framework tích hợp đồ thị mạnh mẽ để đơn giản hóa quá trình triển khai.

Link to this sectionCác ứng dụng trong thực tế#

GraphRAG đang thay đổi cách các ngành công nghiệp xử lý thông tin dày đặc và có tính kết nối cao:

Nghiên cứu lâm sàng và khám phá thuốc: Trong AI trong chăm sóc sức khỏe, GraphRAG đẩy nhanh quá trình nghiên cứu bằng cách liên kết các triệu chứng, bệnh lý, protein và hợp chất hóa học. Các AI agent y tế có thể duyệt qua những kết nối này trên các cơ sở dữ liệu khổng lồ như kho lưu trữ tài liệu y sinh của PubMed để dự đoán các đích nhắm thuốc mới hoặc tóm tắt các chuỗi con đường bệnh lý phức tạp.
Phát hiện gian lận tài chính: Các hoạt động gian lận thường ẩn náu trong các mạng lưới phức tạp của các công ty ma và các giao dịch tần suất cao. GraphRAG cho phép các nhà phân tích truy vấn dữ liệu tài chính một cách tự nhiên, truy vết các mối quan hệ ẩn giấu để tóm tắt các mạng lưới nghi vấn mà các mô hình anomaly detection tiêu chuẩn có thể dễ dàng bỏ qua. Các nền tảng hạ tầng đồ thị được quản lý như Amazon Neptune và các giải pháp doanh nghiệp từ Neo4j thường được triển khai để phát hiện gian lận nhằm hỗ trợ các cuộc điều tra bằng AI này.

Link to this sectionXây dựng các pipeline Multimodal GraphRAG#

Việc kết hợp computer vision vào các hệ thống GraphRAG giới thiệu multi-modal learning, cho phép AI "nhìn thấy" và ánh xạ thế giới vật lý thành dữ liệu cấu trúc một cách linh hoạt. Bằng cách sử dụng các mô hình thị giác hiện đại như Ultralytics YOLO26, các nhà phát triển có thể tự động trích xuất các đối tượng vật lý từ hình ảnh hoặc luồng video để làm các node ngữ cảnh trong kiến trúc GraphRAG rộng lớn hơn.

import torch
from ultralytics import YOLO

# Load the recommended Ultralytics YOLO26 model
model = YOLO("yolo26n.pt")

# Run inference to extract visual objects for a GraphRAG pipeline
results = model("https://ultralytics.com/images/bus.jpg")

# Extract detected object classes to act as graph nodes
detected_classes = [model.names[int(c)] for c in results[0].boxes.cls]
nodes = torch.tensor([[i] for i in range(len(detected_classes))], dtype=torch.float)

print(f"Graph Nodes Extracted: {set(detected_classes)}")
# These visual entity nodes can now be linked in a graph database

Đối với các đội ngũ xây dựng những ứng dụng đa phương thức (multimodal) phức tạp này, việc quản lý các tập dữ liệu thị giác tùy chỉnh được đơn giản hóa đáng kể khi sử dụng Ultralytics Platform, nền tảng cung cấp khả năng huấn luyện trên đám mây không cần mã (no-code) và triển khai mô hình mạnh mẽ. Để khám phá toán học nền tảng và các tensor đằng sau việc tạo đồ thị, việc xem xét tài liệu chính thức của PyTorch về tensors và đi sâu vào các bài báo trên arXiv về các triển khai GraphRAG gần đây sẽ cung cấp những hiểu biết kỹ thuật sâu sắc về tương lai của artificial intelligence.

GraphRAG

Link to this sectionGraphRAG so với RAG truyền thống#

Link to this sectionCác ứng dụng trong thực tế#

Link to this sectionXây dựng các pipeline Multimodal GraphRAG#

Explore solutions

AI trong ngành Robot

AI trong Logistics

AI trong ngành Bán lẻ

AI trong chăm sóc sức khỏe

AI trong sản xuất

AI trong Ô tô

AI trong Nông nghiệp

AI trong ngành Robot

AI trong Logistics

AI trong ngành Bán lẻ

AI trong chăm sóc sức khỏe

AI trong sản xuất

AI trong Ô tô

AI trong Nông nghiệp

AI trong ngành Robot

AI trong Logistics

AI trong ngành Bán lẻ

AI trong chăm sóc sức khỏe

AI trong sản xuất

AI trong Ô tô

AI trong Nông nghiệp

Hãy cùng nhau xây dựng tương lai của AI!