Gặp gỡ YOLO26: AI tầm nhìn thế hệ tiếp theo.
Ultralytics
Quay lại Bảng thuật ngữ Ultralytics

Graph Neural Network (GNN)

Khám phá Mạng thần kinh đồ thị (GNN) để xử lý dữ liệu phi Euclid. Tìm hiểu cách GNN tăng cường suy luận quan hệ cùng với Ultralytics YOLO26 cho Thị giác AI nâng cao.

Mạng thần kinh đồ thị (GNN) là một lớp kiến trúc deep learning chuyên biệt được thiết kế để xử lý dữ liệu biểu diễn dưới dạng đồ thị. Trong khi các model truyền thống như Convolutional Neural Networks (CNNs) được tối ưu hóa cho các cấu trúc dạng lưới như hình ảnh, và Recurrent Neural Networks (RNNs) vượt trội trong việc xử lý dữ liệu tuần tự như văn bản hoặc Time Series Analysis, thì các GNN lại có khả năng xử lý dữ liệu phi Euclid một cách độc đáo. Điều này có nghĩa là chúng hoạt động trên các tập dữ liệu được định nghĩa bởi các nút (thực thể) và cạnh (mối quan hệ), cho phép chúng học hỏi từ các sự phụ thuộc lẫn nhau phức tạp đặc trưng cho các mạng lưới trong thế giới thực. Bằng cách nắm bắt cả các thuộc tính của từng điểm dữ liệu riêng lẻ và các kết nối cấu trúc giữa chúng, GNN mở ra những thông tin chi tiết mạnh mẽ trong các lĩnh vực mà ở đó các mối quan hệ cũng quan trọng không kém gì bản thân các thực thể.

Link to this sectionCách thức hoạt động của Mạng thần kinh đồ thị#

Cơ chế nền tảng đằng sau một GNN là một quá trình thường được gọi là "truyền thông điệp" (message passing) hoặc tổng hợp lân cận. Trong khung làm việc này, mỗi nút trong đồ thị sẽ cập nhật biểu diễn của chính nó bằng cách thu thập thông tin từ các nút lân cận trực tiếp. Trong quá trình model training, mạng lưới sẽ học cách tạo ra các embeddings hiệu quả—các biểu diễn vector dày đặc—để mã hóa các đặc trưng của một nút cùng với cấu trúc liên kết của vùng lân cận cục bộ của nó.

Thông qua nhiều lớp xử lý, một nút cuối cùng có thể kết hợp thông tin từ khoảng cách xa hơn trong đồ thị, qua đó mở rộng hiệu quả "trường tiếp nhận" (receptive field) của nó. Điều này cho phép model hiểu được ngữ cảnh của một nút trong cấu trúc lớn hơn. Các khung làm việc hiện đại như PyTorch GeometricDeep Graph Library (DGL) hỗ trợ việc triển khai các lược đồ truyền thông điệp phức tạp này, giúp các lập trình viên xây dựng các ứng dụng dựa trên đồ thị tinh vi mà không cần phải bắt đầu từ con số không.

Link to this sectionGNN so với các kiến trúc thần kinh khác#

Để hiểu rõ vai trò riêng biệt của GNN, việc phân biệt chúng với các loại neural network (NN) phổ biến khác trong lĩnh vực AI là rất hữu ích:

  • Convolutional Neural Networks (CNNs): Đây là tiêu chuẩn vàng cho các tác vụ thị giác, chẳng hạn như image classification hoặc object detection. Các model như Ultralytics YOLO26 dựa vào CNN để xử lý dữ liệu pixel dạng lưới cố định. Tuy nhiên, CNN gặp khó khăn với các cấu trúc không đều, nơi số lượng nút lân cận thay đổi đối với mỗi nút.
  • Recurrent Neural Networks (RNNs): RNN xử lý dữ liệu đầu vào theo một trình tự cụ thể, khiến chúng trở nên lý tưởng cho các tác vụ ngôn ngữ hoặc Natural Language Processing (NLP). Ngược lại, GNN xử lý dữ liệu mà tại đó các mối quan hệ mang tính không gian hoặc quan hệ thay vì thuần túy là thời gian hoặc tuần tự.
  • Knowledge Graph: Một Knowledge Graph là cơ sở dữ liệu có cấu trúc về các sự kiện (thực thể và mối quan hệ), trong khi GNN là mô hình tính toán được sử dụng để học hỏi từ các cấu trúc đó. GNN thường được triển khai trên nền tảng của các Knowledge Graph để thực hiện các tác vụ như dự đoán liên kết, thường giúp tăng cường các quy trình Retrieval-Augmented Generation (RAG).

Link to this sectionCác ứng dụng trong thực tế#

Khả năng mô hình hóa các mối quan hệ tùy ý khiến GNN trở nên không thể thiếu trên nhiều ngành công nghiệp có tác động lớn:

  1. Khám phá thuốc và Chăm sóc sức khỏe: Trong ngành dược phẩm, các phân tử hóa học được biểu diễn tự nhiên dưới dạng đồ thị, trong đó nguyên tử là các nút và liên kết là các cạnh. GNN đang chuyển đổi AI in healthcare bằng cách dự đoán các đặc tính phân tử và mô phỏng tương tác protein. Các cải tiến như AlphaFold by Google DeepMind làm nổi bật sức mạnh của deep learning hình học trong việc hiểu các cấu trúc sinh học.

  2. Phân tích mạng xã hội và Hệ thống gợi ý: Các nền tảng sử dụng GNN để phân tích mạng lưới tương tác người dùng khổng lồ. Bằng cách mô hình hóa người dùng như các nút và tình bạn hoặc lượt thích như các cạnh, các mạng lưới này hỗ trợ Recommendation Systems để đề xuất nội dung, sản phẩm hoặc kết nối. Phương pháp này, tương tự như các phương pháp được sử dụng trong Pinterest's GraphSage, có thể mở rộng hiệu quả lên tới hàng tỷ tương tác.

  3. Logistics và Dự đoán giao thông: Trong AI in logistics, mạng lưới đường bộ được coi là các đồ thị nơi các giao lộ là các nút và đường đi là các cạnh. GNN có thể dự đoán lưu lượng giao thông và tối ưu hóa các tuyến đường giao hàng bằng cách phân tích sự phụ thuộc không gian giữa các đoạn đường khác nhau, vượt trội hơn nhiều so với các phương pháp thống kê cơ bản đơn giản.

Link to this sectionTích hợp khái niệm đồ thị với Vision AI#

Mạng thần kinh đồ thị đang ngày càng được tích hợp vào các quy trình đa phương thức (multi-modal). Ví dụ, một hệ thống toàn diện có thể sử dụng image segmentation để xác định các đối tượng riêng biệt trong một cảnh, sau đó sử dụng GNN để lập luận về các mối quan hệ không gian giữa các đối tượng đó—thường được gọi là "Scene Graph" (Đồ thị cảnh). Điều này giúp thu hẹp khoảng cách giữa nhận thức thị giác và lập luận logic.

Ví dụ Python sau đây minh họa cách kết nối Vision AI với các cấu trúc đồ thị. Nó sử dụng model Ultralytics YOLO26 để phát hiện các đối tượng, đóng vai trò như các nút, và chuẩn bị một cấu trúc đồ thị cơ bản bằng torch.

import torch
from ultralytics import YOLO

# Load the latest YOLO26 model
model = YOLO("yolo26n.pt")

# Run inference on an image to find entities (nodes)
results = model("https://ultralytics.com/images/bus.jpg")

# Extract box centers to serve as node features
# Format: [center_x, center_y] derived from xywh
boxes = results[0].boxes.xywh[:, :2].cpu()
x = torch.tensor(boxes.numpy(), dtype=torch.float)

# Create a hypothetical edge index connecting the first two objects
# In a real GNN, edges might be defined by distance or interaction
edge_index = torch.tensor([[0, 1], [1, 0]], dtype=torch.long)

print(f"Graph constructed: {x.size(0)} nodes (objects) and {edge_index.size(1)} edges.")

Các lập trình viên đang tìm cách quản lý các tập dữ liệu cần thiết cho các quy trình phức tạp này có thể sử dụng Ultralytics Platform, vốn giúp đơn giản hóa quy trình gán nhãn và huấn luyện cho các thành phần thị giác của hệ thống. Bằng cách kết hợp các model thị giác mạnh mẽ với khả năng lập luận dựa trên quan hệ của GNN, các kỹ sư có thể xây dựng các hệ thống tự hành nhận biết ngữ cảnh, giúp chúng hiểu rõ hơn về thế giới xung quanh.

Explore solutions

Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.
Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.
Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.
Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.
Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.
Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.
Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.
Tìm hiểu thêm

Hãy cùng nhau xây dựng tương lai của AI!

Bắt đầu hành trình của bạn với tương lai của machine learning