Geometric Deep Learning (GDL)
Explore le Geometric Deep Learning pour traiter des données non-euclidiennes. Apprends comment combiner GDL avec Ultralytics YOLO26 pour les maillages 3D, les graphes et l'IA spatiale avancée.
L'apprentissage profond géométrique (GDL) est un terme générique qui englobe des techniques d'apprentissage automatique avancées spécifiquement conçues pour traiter des données non euclidiennes. Contrairement aux formats standard comme les images 2D ou les séquences de texte, qui reposent sur des grilles planes et prévisibles, les données non euclidiennes incluent des structures complexes comme des variétés et des maillages 3D ainsi que des réseaux relationnels complexes. En établissant des cadres mathématiques qui respectent la géométrie intrinsèque de ces structures, l'apprentissage profond géométrique permet aux systèmes d'IA d'analyser avec précision les formations moléculaires, les cartes topologiques complexes et les systèmes dynamiques interconnectés.
Link to this sectionComment fonctionne l'apprentissage profond géométrique#
Les principes fondamentaux de l'apprentissage profond géométrique reposent sur l'exploitation de la symétrie, de l'invariance et de l'équivariance présentes dans des ensembles de données complexes. Une question courante parmi les praticiens est de savoir si une simple matrice de distance suffit pour l'apprentissage profond géométrique. La réponse est non ; bien que les matrices de distance capturent les distances par paires, elles manquent de la nuance topologique nécessaire pour un véritable raisonnement géométrique. Au lieu de cela, le GDL repose fortement sur des architectures de passage de messages et l'agrégation de voisinage.
Il est utile de différencier l'apprentissage profond géométrique des réseaux de neurones sur graphes (GNN). Alors que le GDL est le domaine théorique global englobant tout l'apprentissage profond non euclidien, les GNN sont un type spécifique d'architecture neuronale opérant exclusivement sur des données sous forme de graphes. Des frameworks comme PyTorch Geometric et TensorFlow GNN sont largement utilisés pour mettre en œuvre ces principes d'apprentissage profond, permettant aux nœuds de mettre à jour leurs représentations en fonction de leurs connexions structurelles.
Link to this sectionApprentissage géométrique vs apprentissage profond traditionnel#
Les modèles d'apprentissage profond traditionnels, tels que les réseaux de neurones convolutifs (CNN), sont hautement optimisés pour les données euclidiennes comme les grilles de pixels dans les tâches de vision par ordinateur. De même, les réseaux de neurones récurrents (RNN) sont conçus pour traiter des séquences linéaires. Cependant, ces réseaux traditionnels peinent lorsque les données manquent d'une structure fixe et régulière.
L'apprentissage géométrique surmonte cette limitation en opérant directement sur des formes irrégulières et des cartes relationnelles. Lors de l'analyse d'un réseau social ou de la navigation dans un environnement 3D, les convolutions standard échouent car le « voisinage » d'un point de données n'est plus un carré fixe de pixels. Les modèles géométriques adaptent dynamiquement leurs champs récepteurs, apprenant les connexions topologiques qui définissent la véritable forme des données.
Link to this sectionApplications concrètes des graphes de géométrie et des modèles#
Parce que les graphes de géométrie définissent explicitement les nœuds et leurs relations structurelles, les modèles géométriques ont permis des percées dans divers domaines scientifiques et commerciaux :
- Découverte de médicaments : Le GDL est essentiel pour prédire les interactions moléculaires. AlphaFold par Google DeepMind utilise de manière célèbre des techniques de raisonnement spatial pour résoudre des problèmes complexes de repliement de protéines en modélisant les acides aminés sous forme de graphes connectés.
- Analyse des réseaux sociaux : Les plateformes utilisent le GDL pour analyser les interactions des utilisateurs, permettant des systèmes de recommandation avancés et la détection de la fraude en cartographiant les topologies de l'analyse des réseaux sociaux.
- Vision par ordinateur 3D : Le GDL est fréquemment appliqué pour traiter les nuages de points LiDAR et les maillages 3D pour les véhicules autonomes et la réalité augmentée.
Link to this sectionIntégration du GDL avec la vision par ordinateur#
Relier la vision par ordinateur 2D traditionnelle aux modèles géométriques crée des systèmes très robustes capables de raisonnement spatial avancé et de détection d'objets 3D. En utilisant un puissant détecteur 2D comme Ultralytics YOLO26, tu peux rapidement localiser des objets dans une scène. Les coordonnées de ces objets détectés peuvent ensuite servir de nœuds fondateurs pour un graphe géométrique, permettant à un GNN en aval d'inférer des relations complexes entre les éléments visuels (par exemple, en générant un « graphe de scène »).
L'extrait Python suivant démontre comment tu peux extraire les coordonnées de détection d'objets en utilisant le package ultralytics pour initier une structure de graphe de géométrie fondamentale :
import torch
from ultralytics import YOLO
# Load the Ultralytics YOLO26 model for high-speed object detection
model = YOLO("yolo26n.pt")
# Perform inference to detect objects
results = model("path/to/image.jpg")
# Extract the center coordinates (x, y) of bounding boxes to act as graph nodes
nodes = results[0].boxes.xywh[:, :2].cpu()
node_tensor = torch.tensor(nodes.numpy(), dtype=torch.float)
print(f"Extracted {node_tensor.size(0)} nodes for Geometric Deep Learning mapping.")Pour les équipes qui construisent des systèmes hybrides à grande échelle combinant la détection d'objets euclidienne avec la cartographie non euclidienne, la gestion d'une annotation de données complexe est cruciale. La plateforme Ultralytics fournit un environnement de bout en bout pour annoter, entraîner et déployer en toute sécurité ces modèles de vision fondamentaux afin de prendre en charge des pipelines spatiaux avancés.






