Yolo Vision Shenzhen
Shenzhen
Jetzt beitreten
Glossar

Geometrisches Deep Learning (GDL)

Entdecken Sie Geometric Deep Learning zur Verarbeitung nicht-euklidischer Daten wie Graphen und 3D-Netzmodelle. Erfahren Sie, wie Sie Ultralytics mit GDL für fortschrittliche Bildverarbeitungs-KI integrieren können.

Geometrisches Deep Learning (GDL) ist ein fortgeschrittener Bereich innerhalb des Deep Learning, der die Fähigkeiten herkömmlicher neuronaler Netzwerke erweitert, um Daten zu verarbeiten, die in nicht-euklidischer Geometrie strukturiert sind. Während ein standardmäßiges konvolutionelles neuronales Netzwerk hochgradig für gitterartige Darstellungen wie 2D-Bilder optimiert ist, bietet GDL den mathematischen Rahmen, der erforderlich ist, um komplexe, unregelmäßige Datenstrukturen wie Graphen, 3D-Netze und kontinuierliche Mannigfaltigkeiten zu analysieren.

Häufig wird geometrisches Deep Learning mit Graph-Neural-Netzwerken (GNNs) verwechselt. Diese Begriffe sind zwar eng miteinander verbunden, aber nicht identisch. GDL dient als übergreifender theoretischer Rahmen, der auf relationalen induktiven Vorurteilen basiert, während GNNs eine spezifische Untergruppe von Architekturen darstellen, die ausdrücklich dafür konzipiert sind, auf Strukturen der Graphentheorie anzuwenden.

Anwendungsfälle in der Praxis

Da GDL es Modellen ermöglicht, Beziehungen und Formen direkt zu interpretieren, ist es die Grundlage für einige der wichtigsten Durchbrüche in der modernen künstlichen Intelligenz.

Integration von Bildverarbeitungs-KI in geometrische Modelle

In der angewandten Bildverarbeitung erfordert die Erfassung räumlicher Informationen häufig die Verknüpfung der zweidimensionalen visuellen Wahrnehmung mit dem räumlich-zeitlichen Denken geometrischer Netzwerke. Entwickler nutzen häufig Tools wie PyTorch , um solche Systeme zu erstellen. Sie können ein Ultralytics einsetzen, um visuelle Elemente schnell zu identifizieren und deren räumliche Koordinaten als grundlegende Knoten in einem größeren geometrischen Graphen zu verwenden.

Der folgende Python zeigt, wie man Standard- Objekterkennungsergebnisse extrahiert und sie als tensor formatiert, die für eine geometrische Verarbeitungs- Pipeline bereit sind:

import torch
from ultralytics import YOLO

# Load an Ultralytics YOLO26 nano model
model = YOLO("yolo26n.pt")

# Run inference to extract bounding box coordinates
results = model("https://ultralytics.com/images/bus.jpg")
boxes = results[0].boxes.xywh[:, :2].cpu()  # Extract x, y centers

# Format coordinates as feature nodes for a geometric graph
node_features = torch.tensor(boxes.numpy(), dtype=torch.float)
print(f"Extracted {node_features.shape[0]} object nodes for graph construction.")

Um Pipelines, die Bildverarbeitungsarchitekturen und geometrische Daten kombinieren, effektiv zu skalieren, können Teams ihre Bildsegmentierungsdatensätze mithilfe der Ultralytics verwalten. Diese durchgängige Cloud-Lösung vereinfacht den Entwicklungszyklus von der anfänglichen Datenannotation bis zur endgültigen Modellbereitstellung, sodass sich Ingenieure auf die Integration fortschrittlicher Manifold-Learning-Strategien in robuste Produktionsumgebungen konzentrieren können.

Lassen Sie uns gemeinsam die Zukunft der KI gestalten!

Beginnen Sie Ihre Reise mit der Zukunft des maschinellen Lernens