Yolo Tầm nhìn Thâm Quyến
Thâm Quyến
Tham gia ngay
Bảng chú giải thuật ngữ

Mạng Nơ-ron Đồ Thị (GNN)

Khám phá cách Mạng Nơ-ron Đồ Thị (GNN) cách mạng hóa AI với dữ liệu có cấu trúc đồ thị cho việc khám phá thuốc, mạng xã hội, dự đoán giao thông và hơn thế nữa!

Mạng Nơ-ron Đồ thị (GNN) là một kiến trúc chuyên biệt trong lĩnh vực học sâu (DL) được thiết kế để xử lý và phân tích dữ liệu được biểu diễn dưới dạng đồ thị. Trong khi các mô hình học máy (ML) tiêu chuẩn thường yêu cầu dữ liệu được cấu trúc theo dạng lưới thông thường (như hình ảnh) hoặc mảng tuần tự (như văn bản), GNN lại vượt trội trong việc diễn giải dữ liệu được xác định bởi các nút và các cạnh kết nối chúng. Khả năng độc đáo này cho phép chúng nắm bắt các mối quan hệ phức tạp và sự phụ thuộc lẫn nhau giữa các thực thể, khiến chúng trở nên không thể thiếu đối với các tác vụ mà cấu trúc kết nối cũng quan trọng như chính các điểm dữ liệu.

Mạng nơ-ron đồ thị hoạt động như thế nào

Cơ chế cốt lõi đằng sau GNN là một quá trình được gọi là truyền thông điệp hoặc tổng hợp lân cận. Trong khuôn khổ này, mỗi nút trong đồ thị cập nhật biểu diễn của riêng nó bằng cách thu thập thông tin từ các nút lân cận. Trong quá trình huấn luyện, mạng học các phép nhúng — biểu diễn vectơ dày đặc — mã hóa cả các đặc điểm của chính nút đó và thông tin cấu trúc của mạng xung quanh.

Thông qua nhiều lớp xử lý, một nút cuối cùng có thể kết hợp thông tin từ các phần xa của đồ thị, từ đó "nhìn thấy" được bối cảnh rộng hơn. Điều này trái ngược với hồi quy tuyến tính truyền thống hoặc các mô hình phân loại đơn giản, vốn thường coi các điểm dữ liệu là các thực thể độc lập. Các nền tảng như PyTorch Geometric hỗ trợ tính toán phức tạp này, cho phép các nhà phát triển xây dựng các ứng dụng tinh vi dựa trên đồ thị.

Phân biệt GNN với các kiến trúc khác

Để hiểu được tiện ích của GNN, cần phân biệt chúng với các loại mạng nơ-ron (NN) phổ biến khác có trong AI hiện đại:

  • Mạng nơ-ron tích chập (CNN) : CNN được tối ưu hóa cho dữ liệu có cấu trúc dạng lưới như hình ảnh. Chúng sử dụng các hạt nhân có kích thước cố định để detect các mẫu. Mặc dù các mô hình như Ultralytics YOLO11 đại diện cho công nghệ tiên tiến nhất trong phát hiện đối tượng trực quan, nhưng chúng không được thiết kế để xử lý cấu trúc bất thường, phi Euclid của dữ liệu đồ thị.
  • Mạng nơ-ron hồi quy (RNN) : RNN được xây dựng cho dữ liệu tuần tự, xử lý dữ liệu đầu vào theo thứ tự cụ thể để phân tích chuỗi thời gian hoặc xử lý các tác vụ ngôn ngữ. Ngược lại, GNN xử lý dữ liệu có mối quan hệ không gian hoặc quan hệ thay vì thời gian.
  • Đồ thị tri thức : Đồ thị tri thức là một cơ sở dữ liệu có cấu trúc về các sự kiện (thực thể và mối quan hệ), trong khi GNN là mô hình tính toán được sử dụng để học từ các cấu trúc đó. GNN thường được sử dụng để thực hiện suy luận hoặc dự đoán liên kết trên đồ thị tri thức.

Các Ứng dụng Thực tế

Khả năng mô hình hóa các mối quan hệ khiến GNN trở nên mạnh mẽ trong nhiều ngành công nghiệp có tác động lớn:

  1. Khám phá thuốc và Hóa học: Trong ngành dược phẩm, các phân tử có thể được biểu diễn tự nhiên dưới dạng đồ thị, trong đó nguyên tử là các nút và liên kết hóa học là các cạnh. Mạng nơ-ron nhân tạo (GNN) hỗ trợ AI trong lĩnh vực chăm sóc sức khỏe bằng cách dự đoán các đặc tính phân tử, mô phỏng tương tác protein và xác định các ứng cử viên thuốc tiềm năng nhanh hơn so với mô phỏng truyền thống. Các sáng kiến nghiên cứu lớn, chẳng hạn như của DeepMind , phụ thuộc rất nhiều vào các khái niệm học sâu hình học.
  2. Phân tích Mạng Xã hội: Các nền tảng sử dụng GNN để phân tích mạng lưới tương tác rộng lớn của người dùng. Bằng cách mô hình hóa người dùng thành các nút và tương tác thành các cạnh, các mạng này hỗ trợ Hệ thống Đề xuất (Recommendation System) gợi ý bạn bè, nội dung hoặc sản phẩm. Chúng cũng rất quan trọng trong việc phát hiện gian lận, xác định các nhóm hoạt động đáng ngờ mà các phương pháp phát hiện bất thường truyền thống có thể bỏ sót.

Triển khai các khái niệm đồ thị

Trong khi các thư viện chuyên biệt xử lý phần việc nặng nề trong việc truyền tải thông điệp, việc hiểu cách cấu trúc dữ liệu đồ thị là bước đầu tiên. Dưới đây là một ví dụ đơn giản sử dụng PyTorch để xác định các kết nối cạnh (topo) của đồ thị, đóng vai trò là đầu vào cho mạng GNN.

import torch

# Define a simple graph with 3 nodes and 2 edges
# 'edge_index' represents connections: Node 0->1 and Node 1->2
edge_index = torch.tensor([[0, 1], [1, 2]], dtype=torch.long)

# Define features for each node (e.g., x, y coordinates or attributes)
# 3 nodes, each with 2 feature values
x = torch.tensor([[-1, 0], [0, 0], [1, 0]], dtype=torch.float)

print(f"Graph defined with {x.size(0)} nodes and {edge_index.size(1)} edges.")

Mạng lưới GNN (GNN) đang ngày càng được tích hợp vào các quy trình lớn hơn. Ví dụ, một hệ thống có thể sử dụng phân đoạn hình ảnh để nhận dạng các đối tượng trong một cảnh, sau đó sử dụng GNN để suy luận về mối quan hệ không gian giữa các đối tượng đó, thu hẹp khoảng cách giữa nhận thức thị giác và suy luận logic. Khi các công cụ như TensorFlow GNNThư viện Đồ thị Sâu (DGL) ngày càng hoàn thiện, rào cản gia nhập để triển khai các mô hình phức tạp này tiếp tục giảm xuống, mở rộng phạm vi tiếp cận của chúng vào các thành phố thông minh và hơn thế nữa.

Tham gia Ultralytics cộng đồng

Tham gia vào tương lai của AI. Kết nối, hợp tác và phát triển cùng với những nhà đổi mới toàn cầu

Tham gia ngay