Yolo Tầm nhìn Thâm Quyến
Thâm Quyến
Tham gia ngay
Bảng chú giải thuật ngữ

Biểu Đồ Tri Thức (Knowledge Graph)

Khám phá cách knowledge graph (biểu đồ tri thức) tạo ra cuộc cách mạng trong AI bằng cách mô hình hóa các mối quan hệ phức tạp, cho phép tìm kiếm ngữ nghĩa, đề xuất cá nhân hóa, v.v.

Biểu đồ tri thức là một mô hình dữ liệu toàn diện, giúp tổ chức và tích hợp thông tin vào một mạng lưới các thực thể trong thế giới thực—chẳng hạn như đối tượng, sự kiện, tình huống hoặc khái niệm trừu tượng—và các mối quan hệ rõ ràng giữa chúng. Không giống như cơ sở dữ liệu quan hệ tiêu chuẩn lưu trữ dữ liệu theo hàng và cột cứng nhắc, biểu đồ tri thức cấu trúc dữ liệu như một mạng lưới linh hoạt gồm các nút và cạnh được kết nối với nhau. Kiến trúc này phản ánh cách con người liên kết các sự kiện trong nhận thức, cho phép các hệ thống Trí tuệ Nhân tạo (AI) suy luận, suy ra bối cảnh và khám phá các mẫu ẩn trong các tập dữ liệu khổng lồ. Cấu trúc ngữ nghĩa này là một yếu tố nền tảng của Web Ngữ nghĩa , tạo ra một khuôn khổ mà dữ liệu có thể đọc được bằng máy và được liên kết nội tại.

Cấu trúc của đồ thị tri thức bao gồm hai thành phần chính: các nút , đại diện cho các thực thể (ví dụ: "Albert Einstein" hoặc "Thuyết Tương đối"), và các cạnh , xác định mối quan hệ giữa chúng (ví dụ: "được đề xuất bởi"). Bằng cách tuân thủ các tiêu chuẩn như Khung Mô tả Tài nguyên (RDF) , các đồ thị này cho phép hợp nhất các nguồn dữ liệu khác nhau. Các triển khai nổi bật bao gồm Đồ thị Tri thức của Google , giúp cải thiện kết quả của công cụ tìm kiếm, và các dự án do cộng đồng điều hành như Wikidata .

Các ứng dụng trong AI và học máy

Biểu đồ kiến thức đóng vai trò quan trọng trong việc thúc đẩy nhiều khả năng của Máy học (ML) bằng cách cung cấp bối cảnh có cấu trúc mà các mô hình thống kê có thể bỏ lỡ.

  • Tìm kiếm ngữ nghĩa : Các công cụ tìm kiếm truyền thống thường dựa vào việc khớp từ khóa. Biểu đồ tri thức cho phép các công cụ hiểu được "ý định" đằng sau một truy vấn. Ví dụ: tìm kiếm "Jaguar" có thể ám chỉ loài động vật hoặc thương hiệu xe hơi; biểu đồ tri thức sử dụng ngữ cảnh để phân biệt thuật ngữ, mang lại kết quả chính xác hơn.
  • Hệ thống Đề xuất : Trong AI bán lẻ , các biểu đồ này lập bản đồ mối quan hệ phức tạp giữa người dùng, sản phẩm và hành vi mua hàng. Nếu người dùng mua máy ảnh, biểu đồ sẽ hiểu mối liên hệ với "Thẻ SD" hoặc "Chân máy" không chỉ vì người khác đã mua chúng, mà còn vì chúng là những phụ kiện có chức năng tương tự.
  • Thế hệ Tăng cường Truy xuất (RAG): Mô hình Ngôn ngữ Lớn (LLM) đôi khi có thể tạo ra thông tin hợp lý nhưng không chính xác. Bằng cách tích hợp biểu đồ tri thức thông qua Thế hệ Tăng cường Truy xuất (RAG) , các tác nhân AI có thể truy vấn nguồn thông tin xác thực đã được xác minh trước khi tạo ra phản hồi, giảm đáng kể ảo giác trong LLM và cải thiện độ chính xác của thông tin.
  • Thị giác máy tính (CV) Bối cảnh: Mô hình thị giác detect các đối tượng, nhưng đồ thị kiến thức hiểu được bối cảnh. Một đồ thị có thể liên kết "mũ bảo hiểm" và "áo vest" được phát hiện với khái niệm "tuân thủ an toàn", cho phép lập luận cấp cao phục vụ giám sát công nghiệp.

Ví dụ về mã: Trích xuất các thực thể cho một đồ thị

Sau đây là Python đoạn trích minh họa cách sử dụng mô hình Ultralytics YOLO11 để detect các đối tượng trong hình ảnh. Những phát hiện này có thể đóng vai trò là các nút thực thể để điền vào biểu đồ kiến thức, liên kết hình ảnh với các đối tượng mà nó chứa.

from ultralytics import YOLO

# Load the official YOLO11 model
model = YOLO("yolo11n.pt")

# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")

# Extract entities to populate a knowledge graph node
graph_entities = []
for box in results[0].boxes:
    class_id = int(box.cls)
    entity_label = results[0].names[class_id]
    confidence = float(box.conf)
    # Create a simplified node representation
    graph_entities.append({"entity": entity_label, "type": "Object", "confidence": confidence})

print(graph_entities)

Các ví dụ thực tế

  1. Khám phá thuốc trong chăm sóc sức khỏe: Trong lĩnh vực AI trong chăm sóc sức khỏe , các nhà nghiên cứu sử dụng đồ thị tri thức để mô hình hóa các tương tác sinh học phức tạp. Bằng cách liên kết các thực thể như gen, protein, bệnh tật và thuốc từ các cơ sở dữ liệu như PubMedUniProt , các thuật toán có thể dự đoán các mục tiêu thuốc tiềm năng và tác dụng phụ. Điều này giúp đẩy nhanh quá trình khám phá thuốc bằng cách xác định các kết nối không rõ ràng có thể bị bỏ qua trong phân tích hình ảnh y tế thủ công hoặc tổng quan tài liệu.
  2. Tối ưu hóa chuỗi cung ứng: Các công ty logistics sử dụng biểu đồ tri thức để tạo ra bản sao số của chuỗi cung ứng. Các nút đại diện cho nhà cung cấp, kho bãi, phụ tùng và sản phẩm, trong khi các cạnh đại diện cho các tuyến đường vận chuyển hoặc các mối quan hệ lắp ráp. Cấu trúc này hỗ trợ phân tích Dữ liệu lớn , cho phép các công ty truy vấn biểu đồ để dự đoán sự chậm trễ, tối ưu hóa tuyến đường và quản lý rủi ro hàng tồn kho hiệu quả hơn so với bảng tính truyền thống.

So sánh Knowledge Graph với các Khái niệm Liên quan

Để hiểu được giá trị độc đáo của biểu đồ kiến thức, cần phân biệt nó với các công nghệ quản lý dữ liệu và tìm kiếm liên quan.

  • Cơ sở dữ liệu Vector : Cơ sở dữ liệu vector lưu trữ dữ liệu dưới dạng nhúng đa chiều để cho phép tìm kiếm tương đồng (ví dụ: tìm kiếm hình ảnh trông giống nhau). Mặc dù mạnh mẽ cho Tìm kiếm Vector , nó dựa trên phép tính gần đúng toán học ngầm định. Ngược lại, đồ thị tri thức dựa trên các kết nối ngữ nghĩa rõ ràng (ví dụ: "A ngụ ý B").
  • Cơ sở dữ liệu quan hệ (RDBMS): Cơ sở dữ liệu truyền thống (như SQL) lưu trữ dữ liệu trong các bảng với lược đồ cố định. Chúng vượt trội trong các giao dịch có cấu trúc nhưng lại gặp khó khăn với dữ liệu có tính liên kết cao. Việc truy vấn các mối quan hệ phức tạp (ví dụ: bạn của bạn của bạn) tốn kém về mặt tính toán trong SQL nhưng lại dễ dàng trong đồ thị bằng các ngôn ngữ truy vấn như SPARQL hoặc Cypher trong Cơ sở dữ liệu đồ thị như Neo4j .
  • Xử lý Ngôn ngữ Tự nhiên (NLP) : NLP tập trung vào việc hiểu và tạo ra ngôn ngữ của con người. Biểu đồ tri thức thường đóng vai trò là "bộ nhớ" có cấu trúc cho các hệ thống NLP, cho phép chúng xây dựng năng lực ngôn ngữ dựa trên dữ liệu thực tế thu được từ các nỗ lực Khai thác Dữ liệu .

Tham gia Ultralytics cộng đồng

Tham gia vào tương lai của AI. Kết nối, hợp tác và phát triển cùng với những nhà đổi mới toàn cầu

Tham gia ngay