Yolo Vision Shenzhen
Shenzhen
Junte-se agora
Glossário

Aprendizagem Profunda Geométrica (GDL)

Explore a aprendizagem profunda geométrica para processar dados não euclidianos, como gráficos e malhas 3D. Saiba como integrar Ultralytics com a GDL para uma IA de visão avançada.

A Aprendizagem Profunda Geométrica (GDL) é um campo avançado dentro da aprendizagem profunda que amplia as capacidades tradicionais das redes neurais para processar dados estruturados em geometria não euclidiana. Enquanto uma rede neural convolucional padrão é altamente otimizada para representações em forma de grelha, como imagens 2D, o GDL fornece a estrutura matemática necessária para analisar estruturas de dados complexas e irregulares, como grafos, malhas 3D e variedades contínuas.

É comum ver a Aprendizagem Profunda Geométrica ser confundida com as Redes Neurais de Grafos (GNNs). Embora estes termos estejam intimamente relacionados, não são idênticos. A GDL funciona como o quadro teórico abrangente baseado em viéses indutivos relacionais, enquanto as GNNs representam um subconjunto específico de arquiteturas explicitamente concebidas para operar em estruturas da teoria dos grafos.

Aplicações no Mundo Real

Ao permitir que os modelos interpretem relações e formas diretamente, a GDL está na base de alguns dos avanços mais importantes na inteligência artificial moderna.

Integração da IA de visão com modelos geométricos

Na visão computacional aplicada, a extração da percepção espacial envolve frequentemente a integração da perceção visual 2D com o raciocínio espaço-temporal das redes geométricas. Os programadores utilizam frequentemente ferramentas como PyTorch para construir estes sistemas. É possível aproveitar um modelo Ultralytics para identificar rapidamente elementos visuais, utilizando as suas coordenadas espaciais como nós fundamentais num grafo geométrico mais vasto.

O seguinte Python demonstra como extrair resultados padrão de deteção de objetos e formatá-los como tensor , prontos para um fluxo de processamento geométrico:

import torch
from ultralytics import YOLO

# Load an Ultralytics YOLO26 nano model
model = YOLO("yolo26n.pt")

# Run inference to extract bounding box coordinates
results = model("https://ultralytics.com/images/bus.jpg")
boxes = results[0].boxes.xywh[:, :2].cpu()  # Extract x, y centers

# Format coordinates as feature nodes for a geometric graph
node_features = torch.tensor(boxes.numpy(), dtype=torch.float)
print(f"Extracted {node_features.shape[0]} object nodes for graph construction.")

Para escalar eficazmente pipelines que combinam arquiteturas de visão e dados geométricos, as equipas podem gerir os seus conjuntos de dados de segmentação de imagens utilizando a Ultralytics . Esta solução completa na nuvem simplifica o ciclo de vida do desenvolvimento, desde a anotação inicial dos dados até à implementação final do modelo, permitindo que os engenheiros se concentrem na integração de estratégias avançadas de aprendizagem de variedades em ambientes de produção robustos.

Vamos construir juntos o futuro da IA!

Comece sua jornada com o futuro do aprendizado de máquina