Yolo Vision Shenzhen
Shenzhen
Iscriviti ora
Glossario

Deep learning geometrico (GDL)

Scopri il Deep Learning geometrico per elaborare dati non euclidei come grafici e mesh 3D. Scopri come integrare Ultralytics con il GDL per un'intelligenza artificiale avanzata nel campo della visione.

Il Deep Learning geometrico (GDL) è un settore avanzato del deep learning che estende le capacità delle reti neurali tradizionali all’elaborazione di dati strutturati secondo una geometria non euclidea. Mentre una rete neurale convoluzionale standard è altamente ottimizzata per rappresentazioni a griglia come le immagini 2D, il GDL fornisce il quadro matematico necessario per analizzare strutture di dati complesse e irregolari come grafi, mesh 3D e varietà continue.

È frequente che il Deep Learning geometrico venga confuso con le reti neurali grafiche (GNN). Sebbene questi termini siano strettamente correlati, non sono identici. Il GDL funge da quadro teorico generale basato su pregiudizi induttivi relazionali, mentre le GNN rappresentano un sottoinsieme specifico di architetture progettate espressamente per operare su strutture della teoria dei grafi.

Applicazioni nel mondo reale

Consentendo ai modelli di interpretare direttamente relazioni e forme, il GDL è alla base di alcune delle scoperte più significative nel campo dell'intelligenza artificiale moderna.

Integrazione dell'intelligenza artificiale visiva con i modelli geometrici

Nella visione artificiale applicata, l'estrazione della percezione spaziale comporta spesso il collegamento tra la percezione visiva bidimensionale e il ragionamento spazio-temporale delle reti geometriche. Gli sviluppatori utilizzano spesso strumenti come PyTorch per realizzare questi sistemi. È possibile sfruttare un modello Ultralytics per identificare rapidamente gli elementi visivi, utilizzando le loro coordinate spaziali come nodi fondamentali in un grafico geometrico più ampio.

Il seguente Python mostra come estrarre i risultati standard del rilevamento di oggetti e formattarli come tensor pronte per una pipeline di elaborazione geometrica:

import torch
from ultralytics import YOLO

# Load an Ultralytics YOLO26 nano model
model = YOLO("yolo26n.pt")

# Run inference to extract bounding box coordinates
results = model("https://ultralytics.com/images/bus.jpg")
boxes = results[0].boxes.xywh[:, :2].cpu()  # Extract x, y centers

# Format coordinates as feature nodes for a geometric graph
node_features = torch.tensor(boxes.numpy(), dtype=torch.float)
print(f"Extracted {node_features.shape[0]} object nodes for graph construction.")

Per scalare in modo efficace le pipeline che combinano architetture di visione artificiale e dati geometrici, i team possono gestire i propri set di dati di segmentazione delle immagini utilizzando la Ultralytics . Questa soluzione cloud end-to-end semplifica il ciclo di vita dello sviluppo, dall'annotazione iniziale dei dati fino alla distribuzione finale del modello, consentendo agli ingegneri di concentrarsi sull' integrazione di strategie avanzate di manifold learning in ambienti di produzione affidabili.

Costruiamo insieme il futuro dell'intelligenza artificiale!

Inizia il tuo viaggio con il futuro del machine learning