Geometric Deep Learning (GDL)

Erkunde Geometric Deep Learning zur Verarbeitung nicht-euklidischer Daten. Lerne, wie du GDL mit Ultralytics YOLO26 für 3D-Meshes, Graphen und fortgeschrittene räumliche KI kombinierst.

Geometric Deep Learning (GDL) ist ein weit gefasster Oberbegriff für fortschrittliche Machine Learning-Verfahren, die speziell für die Verarbeitung von nicht-euklidischen Daten entwickelt wurden. Im Gegensatz zu Standardformaten wie 2D-Bildern oder Textsequenzen, die auf flachen, vorhersehbaren Gittern liegen, umfassen nicht-euklidische Daten komplexe Strukturen wie Mannigfaltigkeiten und 3D-Meshes sowie komplizierte relationale Netzwerke. Durch die Etablierung mathematischer Rahmenbedingungen, die die intrinsische Geometrie dieser Strukturen berücksichtigen, ermöglicht Geometric Deep Learning KI-Systemen die präzise Analyse von Molekülformationen, komplexen topologischen Karten und dynamischen, miteinander verbundenen Systemen.

Link to this sectionWie Geometric Deep Learning funktioniert#

Die zugrunde liegenden Prinzipien von Geometric Deep Learning beruhen auf der Nutzung der Symmetrie, Invarianz und Äquivarianz in komplexen Datensätzen. Eine häufige Frage unter Anwendern ist, ob eine einfache Distanzmatrix für Geometric Deep Learning ausreicht. Die Antwort lautet nein; während Distanzmatrizen paarweise Abstände erfassen, fehlt ihnen die topologische Nuance, die für echtes geometrisches Schlussfolgern erforderlich ist. Stattdessen stützt sich GDL stark auf Message-Passing-Architekturen und Neighborhood-Aggregation.

Es ist hilfreich, Geometric Deep Learning von Graph Neural Networks (GNNs) zu unterscheiden. Während GDL das übergeordnete theoretische Feld ist, das alles nicht-euklidische Deep Learning umfasst, sind GNNs eine spezifische Art von neuronaler Architektur, die ausschließlich auf Graphdaten operiert. Frameworks wie PyTorch Geometric und TensorFlow GNN werden häufig verwendet, um diese Deep Learning-Prinzipien zu implementieren, wodurch Knoten ihre Repräsentationen basierend auf ihren strukturellen Verbindungen aktualisieren können.

Link to this sectionGeometric Learning vs. traditionelles Deep Learning#

Traditionelle Deep-Learning-Modelle wie Convolutional Neural Networks (CNNs) sind hochgradig für euklidische Daten optimiert, wie etwa Pixelgitter bei Aufgaben des Computer Vision. Ähnlich sind Recurrent Neural Networks (RNNs) darauf ausgelegt, lineare Sequenzen zu verarbeiten. Diese traditionellen Netzwerke haben jedoch Schwierigkeiten, wenn Daten keine feste, regelmäßige Struktur aufweisen.

Geometric Learning überwindet diese Einschränkung, indem es direkt auf unregelmäßigen Formen und relationalen Karten operiert. Bei der Analyse eines sozialen Netzwerks oder der Navigation in einer 3D-Umgebung versagen Standard-Faltungen, da die "Nachbarschaft" eines Datenpunkts kein festes Quadrat aus Pixeln mehr ist. Geometrische Modelle passen ihre rezeptiven Felder dynamisch an und lernen die topologischen Verbindungen, die die wahre Form der Daten definieren.

Link to this sectionAnwendungen von Geometriegraphen und -modellen in der Praxis#

Da Geometriegraphen Knoten und ihre strukturellen Beziehungen explizit definieren, haben geometrische Modelle Durchbrüche in verschiedenen wissenschaftlichen und kommerziellen Bereichen ermöglicht:

Wirkstoffforschung: GDL ist entscheidend für die Vorhersage molekularer Interaktionen. AlphaFold von Google DeepMind nutzt bekanntermaßen räumliche Schlussfolgerungstechniken, um komplexe Protein-Faltungsprobleme zu lösen, indem Aminosäuren als verbundene Graphen modelliert werden.
Analyse sozialer Netzwerke: Plattformen nutzen GDL zur Analyse von Benutzerinteraktionen, was fortschrittliche Empfehlungssysteme und Betrugserkennung durch die Abbildung von Topologien der Analyse sozialer Netzwerke ermöglicht.
3D Computer Vision: GDL wird häufig zur Verarbeitung von LiDAR-Punktwolken und 3D-Meshes für autonome Fahrzeuge und Augmented Reality eingesetzt.

Link to this sectionIntegration von GDL mit Computer Vision#

Die Verknüpfung von traditionellem 2D Computer Vision mit geometrischen Modellen schafft hochrobuste Systeme, die zu fortgeschrittenem räumlichem Schlussfolgern und 3D-Objekterkennung fähig sind. Durch den Einsatz eines leistungsstarken 2D-Detektors wie Ultralytics YOLO26 können Entwickler Objekte in einer Szene schnell lokalisieren. Die Koordinaten dieser erkannten Objekte können dann als fundamentale Knoten für einen geometrischen Graphen dienen, wodurch ein nachgeschaltetes GNN komplexe Beziehungen zwischen den visuellen Elementen ableiten kann (z. B. Erstellung eines "Scene Graph").

Der folgende Python-Schnipsel zeigt, wie du Objekterkennungs-Koordinaten mithilfe des ultralytics-Pakets extrahieren kannst, um eine fundamentale Geometriegraph-Struktur zu initiieren:

import torch
from ultralytics import YOLO

# Load the Ultralytics YOLO26 model for high-speed object detection
model = YOLO("yolo26n.pt")

# Perform inference to detect objects
results = model("path/to/image.jpg")

# Extract the center coordinates (x, y) of bounding boxes to act as graph nodes
nodes = results[0].boxes.xywh[:, :2].cpu()
node_tensor = torch.tensor(nodes.numpy(), dtype=torch.float)

print(f"Extracted {node_tensor.size(0)} nodes for Geometric Deep Learning mapping.")

Für Teams, die große, hybride Systeme aufbauen, die euklidische Objekterkennung mit nicht-euklidischer Kartierung kombinieren, ist die Verwaltung komplexer Datenannotation entscheidend. Die Ultralytics Platform bietet eine End-to-End-Umgebung, um diese grundlegenden Vision-Modelle sicher zu annotieren, zu trainieren und nahtlos bereitzustellen, um fortschrittliche räumliche Pipelines zu unterstützen.

Geometric Deep Learning (GDL)

Link to this sectionWie Geometric Deep Learning funktioniert#

Link to this sectionGeometric Learning vs. traditionelles Deep Learning#

Link to this sectionAnwendungen von Geometriegraphen und -modellen in der Praxis#

Link to this sectionIntegration von GDL mit Computer Vision#

Explore solutions

KI in der Robotik

KI in der Logistik

KI im Einzelhandel

KI im Gesundheitswesen

KI in der Fertigung

KI in der Automobilbranche

KI in der Landwirtschaft

KI in der Robotik

KI in der Logistik

KI im Einzelhandel

KI im Gesundheitswesen

KI in der Fertigung

KI in der Automobilbranche

KI in der Landwirtschaft

KI in der Robotik

KI in der Logistik

KI im Einzelhandel

KI im Gesundheitswesen

KI in der Fertigung

KI in der Automobilbranche

KI in der Landwirtschaft

Lass uns gemeinsam die Zukunft der KI bauen!