Khám phá Học sâu hình học (GDL) để xử lý dữ liệu phi Euclid như đồ thị và lưới 3D. Tìm hiểu cách tích hợp Ultralytics với GDL để phát triển trí tuệ nhân tạo thị giác nâng cao.
Học sâu hình học (GDL) là một lĩnh vực tiên tiến trong học sâu, mở rộng khả năng của mạng nơ-ron truyền thống để xử lý dữ liệu được cấu trúc theo hình học phi Euclid. Trong khi một mạng nơ-ron tích chập tiêu chuẩn được tối ưu hóa cao cho các biểu diễn dạng lưới như hình ảnh 2D, GDL cung cấp khung toán học cần thiết để phân tích các cấu trúc dữ liệu phức tạp, không đều như đồ thị, lưới 3D và các đa tạp liên tục.
Người ta thường nhầm lẫn giữa Học sâu hình học (Geometric Deep Learning) với Mạng nơ-ron đồ thị (GNNs). Mặc dù hai khái niệm này có mối liên hệ chặt chẽ, nhưng chúng không hoàn toàn giống nhau. GDL đóng vai trò là khung lý thuyết tổng quát dựa trên các thiên hướng suy diễn quan hệ, trong khi GNNs là một tập con cụ thể của các kiến trúc được thiết kế riêng để xử lý các cấu trúc thuộc lý thuyết đồ thị.
Bằng cách cho phép các mô hình trực tiếp phân tích các mối quan hệ và hình dạng, GDL đã góp phần tạo ra một số bước đột phá quan trọng nhất trong lĩnh vực trí tuệ nhân tạo hiện đại.
Trong lĩnh vực thị giác máy tính ứng dụng, việc trích xuất nhận thức không gian thường đòi hỏi phải kết nối nhận thức thị giác 2D với kh ả năng suy luận không gian-thời gian của các mạng lưới hình học. Các nhà phát triển thường sử dụng các công cụ như PyTorch để xây dựng các hệ thống này. Bạn có thể tận dụng mô hình Ultralytics để nhanh chóng xác định các yếu tố hình ảnh, đồng thời sử dụng tọa độ không gian của chúng làm các nút cơ sở trong một đồ thị hình học lớn hơn.
Python sau đây minh họa cách trích xuất các kết quả phát hiện đối tượng tiêu chuẩn và định dạng chúng thành tensor sẵn sàng cho quy trình xử lý hình học :
import torch
from ultralytics import YOLO
# Load an Ultralytics YOLO26 nano model
model = YOLO("yolo26n.pt")
# Run inference to extract bounding box coordinates
results = model("https://ultralytics.com/images/bus.jpg")
boxes = results[0].boxes.xywh[:, :2].cpu() # Extract x, y centers
# Format coordinates as feature nodes for a geometric graph
node_features = torch.tensor(boxes.numpy(), dtype=torch.float)
print(f"Extracted {node_features.shape[0]} object nodes for graph construction.")
Để mở rộng quy mô hiệu quả các quy trình xử lý kết hợp kiến trúc thị giác và dữ liệu hình học, các nhóm có thể quản lý bộ dữ liệu phân đoạn hình ảnh của mình thông qua Ultralytics . Giải pháp đám mây toàn diện này giúp đơn giản hóa chu trình phát triển từ giai đoạn ghi chú dữ liệu ban đầu đến giai đoạn triển khai mô hình cuối cùng, cho phép các kỹ sư tập trung vào việc tích hợp các chiến lược học manifold tiên tiến vào các môi trường sản xuất ổn định.
Bắt đầu hành trình của bạn với tương lai của học máy