Découvrez le Deep Learning géométrique pour traiter des données non euclidiennes telles que les graphes et les maillages 3D. Apprenez à intégrer Ultralytics au GDL pour une IA de vision avancée.
L'apprentissage profond géométrique (GDL) est un domaine avancé de l' apprentissage profond qui étend les capacités des réseaux neuronaux traditionnels au traitement de données structurées selon une géométrie non euclidienne. Alors qu'un réseau neuronal convolutif standard est hautement optimisé pour les représentations de type grille telles que les images 2D, le GDL fournit le cadre mathématique nécessaire pour analyser des structures de données complexes et irrégulières telles que les graphes, les maillages 3D et les variétés continues.
On confond souvent l'apprentissage profond géométrique (GDL) avec les réseaux neuronaux graphiques (GNN). Bien que ces termes soient étroitement liés, ils ne sont pas identiques. Le GDL constitue un cadre théorique global fondé sur les biais inductifs relationnels, tandis que les GNN représentent un sous-ensemble spécifique d'architectures explicitement conçues pour fonctionner sur des structures issues de la théorie des graphes.
En permettant aux modèles d'interpréter directement les relations et les formes, le GDL est à l'origine de certaines des avancées les plus décisives dans le domaine de l'intelligence artificielle moderne.
En vision par ordinateur appliquée, l'extraction de la perception spatiale implique souvent de faire le lien entre la perception visuelle en 2D et le raisonnement spatio-temporel des réseaux géométriques. Les développeurs ont souvent recours à des outils tels que PyTorch pour mettre au point ces systèmes. Vous pouvez exploiter un modèle Ultralytics pour identifier rapidement des éléments visuels, en utilisant leurs coordonnées spatiales comme nœuds de base dans un graphe géométrique plus vaste.
Python suivant montre comment extraire les résultats standard de la détection d'objets et les formater sous forme d' tensor , prêts à être intégrés dans un pipeline de traitement géométrique :
import torch
from ultralytics import YOLO
# Load an Ultralytics YOLO26 nano model
model = YOLO("yolo26n.pt")
# Run inference to extract bounding box coordinates
results = model("https://ultralytics.com/images/bus.jpg")
boxes = results[0].boxes.xywh[:, :2].cpu() # Extract x, y centers
# Format coordinates as feature nodes for a geometric graph
node_features = torch.tensor(boxes.numpy(), dtype=torch.float)
print(f"Extracted {node_features.shape[0]} object nodes for graph construction.")
Pour faire évoluer efficacement les pipelines combinant architectures de vision et données géométriques, les équipes peuvent gérer leurs ensembles de données de segmentation d'images à l'aide de la Ultralytics . Cette solution cloud de bout en bout simplifie le cycle de développement, depuis l'annotation initiale des données jusqu'au déploiement final du modèle, permettant ainsi aux ingénieurs de se concentrer sur l'intégration de stratégies avancées d'apprentissage sur variétés dans des environnements de production robustes.

Commencez votre parcours avec l'avenir de l'apprentissage automatique