深圳Yolo 视觉
深圳
立即加入
词汇表

几何深度学习(GDL)

探索几何深度学习(GDL),用于处理图和3D网格等非欧几里得数据。了解如何Ultralytics 与GDL集成,以实现高级视觉AI。

几何深度学习(GDL)是深度学习领域中的一个前沿分支, 它将传统神经网络的能力扩展到处理 具有非欧几里得几何结构的数据。 虽然标准的 卷积神经网络 针对网格状表示(如二维图像)进行了高度优化,但GDL提供了分析 图、三维网格和连续流形等复杂、不规则数据结构所需的数学框架。

人们常将几何深度学习与 图神经网络(GNNs)混为一谈。虽然这两个 术语密切相关,但它们并非完全相同。几何深度学习(GDL)是一个基于 关系归纳偏置的总体理论框架,而图神经网络(GNNs)则代表了一类 专门针对图论结构进行操作的 特定架构子集。

实际应用

通过让模型能够直接理解关系和形状,GDL推动了现代人工智能领域中一些最为关键的突破。

将视觉人工智能与几何模型相结合

在应用计算机视觉领域,提取空间 感知能力通常需要将二维视觉感知与 几何网络的时空推理 相结合。开发人员常使用 PyTorch 等工具来构建此类系统。您可以 利用Ultralytics 模型快速 识别视觉元素,并将这些元素的空间坐标作为更大几何图中的基础节点。

以下Python 演示了如何提取标准的 物体检测输出,并将其格式化为 tensor ,以便用于几何处理 管道:

import torch
from ultralytics import YOLO

# Load an Ultralytics YOLO26 nano model
model = YOLO("yolo26n.pt")

# Run inference to extract bounding box coordinates
results = model("https://ultralytics.com/images/bus.jpg")
boxes = results[0].boxes.xywh[:, :2].cpu()  # Extract x, y centers

# Format coordinates as feature nodes for a geometric graph
node_features = torch.tensor(boxes.numpy(), dtype=torch.float)
print(f"Extracted {node_features.shape[0]} object nodes for graph construction.")

为了有效扩展结合了视觉架构和几何数据的管道,团队可以利用 Ultralytics 来管理其 图像分割数据集。这一端到端的云解决方案简化了 从初始 数据标注到最终 模型部署的开发生命周期,使工程师能够专注于 将先进的流形学习策略 集成到稳健的生产环境中。

让我们一起共建AI的未来!

开启您的机器学习未来之旅