Yolo Vision Shenzhen
Shenzhen
Únete ahora
Glosario

Aprendizaje profundo geométrico (GDL)

Explora el aprendizaje profundo geométrico para procesar datos no euclidianos, como gráficos y mallas 3D. Descubre cómo integrar Ultralytics con GDL para lograr una IA de visión avanzada.

El aprendizaje profundo geométrico (GDL) es un campo avanzado dentro del aprendizaje profundo que amplía las capacidades de las redes neuronales tradicionales para procesar datos estructurados en geometría no euclidiana. Mientras que una red neuronal convolucional estándar está altamente optimizada para representaciones en forma de cuadrícula, como las imágenes 2D, el GDL proporciona el marco matemático necesario para analizar estructuras de datos complejas e irregulares, como grafos, mallas 3D y variedades continuas.

Es habitual que se confunda el aprendizaje profundo geométrico con las redes neuronales de grafos (GNN). Aunque estos términos están estrechamente relacionados, no son idénticos. El aprendizaje profundo geométrico constituye el marco teórico general basado en sesgos inductivos relacionales, mientras que las redes neuronales de grafos representan un subconjunto específico de arquitecturas diseñadas explícitamente para operar sobre estructuras de teoría de grafos.

Aplicaciones en el mundo real

Al permitir que los modelos interpreten directamente las relaciones y las formas, GDL está impulsando algunos de los avances más importantes en el campo de la inteligencia artificial moderna.

Integración de la inteligencia artificial visual con modelos geométricos

En la visión artificial aplicada, la extracción de la percepción espacial suele implicar la integración de la percepción visual en 2D con el razonamiento espacio-temporal de las redes geométricas. Los desarrolladores suelen utilizar herramientas como PyTorch para crear estos sistemas. Se puede aprovechar un modelo Ultralytics para identificar rápidamente elementos visuales, utilizando sus coordenadas espaciales como nodos fundamentales en un grafo geométrico más amplio.

El siguiente Python muestra cómo extraer resultados estándar de detección de objetos y formatearlos como tensor listas para un proceso de procesamiento geométrico :

import torch
from ultralytics import YOLO

# Load an Ultralytics YOLO26 nano model
model = YOLO("yolo26n.pt")

# Run inference to extract bounding box coordinates
results = model("https://ultralytics.com/images/bus.jpg")
boxes = results[0].boxes.xywh[:, :2].cpu()  # Extract x, y centers

# Format coordinates as feature nodes for a geometric graph
node_features = torch.tensor(boxes.numpy(), dtype=torch.float)
print(f"Extracted {node_features.shape[0]} object nodes for graph construction.")

Para ampliar de forma eficaz los flujos de trabajo que combinan arquitecturas de visión y datos geométricos, los equipos pueden gestionar sus conjuntos de datos de segmentación de imágenes mediante la Ultralytics . Esta solución integral en la nube simplifica el ciclo de vida del desarrollo, desde la anotación inicial de los datos hasta la implementación final del modelo, lo que permite a los ingenieros centrarse en integrar estrategias avanzadas de aprendizaje de variedades en entornos de producción robustos.

¡Construyamos juntos el futuro de la IA!

Comience su viaje con el futuro del aprendizaje automático