Yolo Tầm nhìn Thâm Quyến
Thâm Quyến
Tham gia ngay
Bảng chú giải thuật ngữ

GraphRAG

Khám phá cách GraphRAG kết hợp Đồ thị Tri thức với RAG để nâng cao khả năng suy luận LLM. Tìm hiểu cách xây dựng các quy trình đa phương thức bằng cách sử dụng Ultralytics YOLO26 và Nền tảng.

Graph Retrieval-Augmented Generation (GraphRAG) là một khung công tác tiên tiến tích hợp Đồ thị Tri thức có cấu trúc với Retrieval Augmented Generation (RAG) để tăng cường đáng kể khả năng suy luận và ngữ cảnh của các Mô hình Ngôn ngữ Lớn (LLM) . Bằng cách tổ chức dữ liệu thành các nút và cạnh được kết nối rõ ràng, GraphRAG cho phép các hệ thống AI hiểu được các mối quan hệ phức tạp mà việc truy xuất văn bản phi cấu trúc truyền thống có thể bỏ sót. Nền tảng cấu trúc này giúp giảm đáng kể hiện tượng "ảo ảnh" trong LLM và cung cấp phản hồi chính xác hơn cho các ứng dụng doanh nghiệp phức tạp, chẳng hạn như những ứng dụng được xây dựng bằng các mô hình tạo văn bản của OpenAI . Phương pháp này đã thu hút được sự chú ý lớn gần đây, với các nghiên cứu nền tảng từ Microsoft Research nhấn mạnh khả năng của GraphRAG trong việc trả lời các câu hỏi đa bước phức tạp trên các tập dữ liệu riêng tư, có tính kết nối cao.

GraphRAG so với RAG truyền thống

Các hệ thống RAG tiêu chuẩn chủ yếu dựa vào cơ sở dữ liệu vectortìm kiếm ngữ nghĩa để tìm tài liệu dựa trên sự tương đồng toán học bằng cách sử dụng các phép nhúng . Mặc dù phương pháp này rất hiệu quả đối với các truy vấn thực tế trực tiếp, nhưng nó lại gặp khó khăn với suy luận "đa bước" - trả lời các câu hỏi yêu cầu ghép nối các sự kiện riêng biệt nằm rải rác trong nhiều tài liệu.

GraphRAG khắc phục hạn chế này bằng cách lập bản đồ rõ ràng mối quan hệ giữa các thực thể. Thay vì chỉ đơn thuần lấy các đoạn văn bản tương tự, nó điều hướng một cấu trúc đồ thị phức tạp. Điều này làm cho nó vượt trội hơn hẳn trong việc khai thác dữ liệu chuyên sâu và suy luận logic phức tạp. Đối với các kỹ sư và nhà nghiên cứu xây dựng các quy trình suy luận này, các công cụ điều phối mã nguồn mở như LangChain cung cấp các khung tích hợp đồ thị mạnh mẽ để đơn giản hóa việc triển khai.

Các Ứng dụng Thực tế

GraphRAG đang thay đổi cách các ngành công nghiệp xử lý thông tin dày đặc và liên kết chặt chẽ:

  • Nghiên cứu lâm sàng và phát hiện thuốc: Trong lĩnh vực trí tuệ nhân tạo ứng dụng trong chăm sóc sức khỏe , GraphRAG thúc đẩy nghiên cứu bằng cách liên kết các triệu chứng, bệnh tật, protein và hợp chất hóa học. Các tác nhân trí tuệ nhân tạo y tế có thể duyệt qua các mối liên hệ này trên các cơ sở dữ liệu khổng lồ như kho lưu trữ tài liệu y sinh học của PubMed để dự đoán các mục tiêu thuốc mới hoặc tóm tắt các chuỗi bệnh lý phức tạp.
  • Phát hiện gian lận tài chính: Các hoạt động gian lận thường ẩn mình trong các mạng lưới phức tạp gồm các công ty ma và các giao dịch tần suất cao. GraphRAG cho phép các nhà phân tích truy vấn dữ liệu tài chính một cách tự nhiên, theo dõi các mối quan hệ ẩn để tóm tắt các mạng lưới đáng ngờ mà các mô hình phát hiện bất thường tiêu chuẩn khó có thể phát hiện được. Các nền tảng cơ sở hạ tầng đồ thị được quản lý như Amazon Neptune và các giải pháp doanh nghiệp từ Neo4j thường được triển khai để phát hiện gian lận , hỗ trợ các cuộc điều tra bằng trí tuệ nhân tạo này.

Xây dựng các đường dẫn GraphRAG đa phương thức

Việc tích hợp thị giác máy tính vào hệ thống GraphRAG mang đến khả năng học đa phương thức , cho phép AI "nhìn" và lập bản đồ động thế giới vật lý thành dữ liệu cấu trúc. Bằng cách sử dụng các mô hình thị giác tiên tiến như Ultralytics YOLO26 , các nhà phát triển có thể tự động trích xuất các đối tượng vật lý từ hình ảnh hoặc nguồn cấp dữ liệu video để đóng vai trò là các nút ngữ cảnh trong kiến ​​trúc GraphRAG rộng hơn.

import torch
from ultralytics import YOLO

# Load the recommended Ultralytics YOLO26 model
model = YOLO("yolo26n.pt")

# Run inference to extract visual objects for a GraphRAG pipeline
results = model("https://ultralytics.com/images/bus.jpg")

# Extract detected object classes to act as graph nodes
detected_classes = [model.names[int(c)] for c in results[0].boxes.cls]
nodes = torch.tensor([[i] for i in range(len(detected_classes))], dtype=torch.float)

print(f"Graph Nodes Extracted: {set(detected_classes)}")
# These visual entity nodes can now be linked in a graph database

Đối với các nhóm xây dựng các ứng dụng đa phương thức phức tạp này, việc quản lý các tập dữ liệu hình ảnh tùy chỉnh cần thiết được đơn giản hóa đáng kể bằng cách sử dụng Nền tảng Ultralytics , cung cấp khả năng huấn luyện trên đám mây mạnh mẽ, không cần lập trình và triển khai mô hình. Để khám phá toán học cơ bản và tensor đằng sau việc tạo đồ thị, việc xem lại tài liệu chính thức PyTorch về tensor và nghiên cứu các bài báo gần đây trên arXiv về triển khai GraphRAG sẽ cung cấp những hiểu biết kỹ thuật sâu sắc về tương lai của trí tuệ nhân tạo .

Tham gia Ultralytics cộng đồng

Tham gia vào tương lai của AI. Kết nối, hợp tác và phát triển cùng với những nhà đổi mới toàn cầu

Tham gia ngay