그래프 및 3D 메쉬와 같은 비유클리드 데이터를 처리하기 위한 기하학적 딥러닝(GDL)을 살펴보세요. 고급 비전 AI를 위해 Ultralytics GDL과 통합하는 방법을 알아보세요.
기하학적 딥러닝(GDL)은 딥러닝의 한 분야로, 기존 신경망의 기능을 확장하여 비유클리드 기하학 구조로 구성된 데이터를 처리합니다. 표준 컨볼루션 신경망이 2D 이미지와 같은 격자형 표현에 최적화되어 있는 반면, GDL은 그래프, 3D 메쉬, 연속 매니폴드와 같은 복잡하고 불규칙한 데이터 구조를 분석하는 데 필요한 수학적 프레임워크를 제공합니다.
기하학적 딥러닝( GDL)이 그래프 신경망(GNN)과 혼동되는 경우가 흔합니다. 이 두 용어는 밀접한 관련이 있지만, 완전히 동일한 것은 아닙니다. GDL은 관계적 귀납적 편향을 기반으로 하는 포괄적인 이론적 프레임워크인 반면, GNN은 그래프 이론 구조에서 작동하도록 명시적으로 설계된 아키텍처의 특정 하위 집합을 나타냅니다.
GDL은 모델이 관계와 형태를 직접 해석할 수 있도록 함으로써, 현대 인공지능 분야에서 가장 중요한 혁신의 원동력이 되고 있습니다.
응용 컴퓨터 비전 분야에서 공간적 인식을 추출하는 작업은 대개 2차원 시각적 인지와 기하학적 네트워크의 시공간적 추론을 연결하는 과정을 수반합니다. 개발자들은 이러한 시스템을 구축할 때 PyTorch 같은 도구를 자주 사용합니다. Ultralytics 모델을 활용하면 시각적 요소를 신속하게 식별하고, 이들의 공간 좌표를 더 큰 기하학적 그래프의 기초 노드로 활용할 수 있습니다.
다음 Python 제는 표준 물체 탐지 결과를 추출하여 기하학적 처리 파이프라인에 바로 사용할 수 있는 tensor 형식으로 변환하는 방법을 보여줍니다:
import torch
from ultralytics import YOLO
# Load an Ultralytics YOLO26 nano model
model = YOLO("yolo26n.pt")
# Run inference to extract bounding box coordinates
results = model("https://ultralytics.com/images/bus.jpg")
boxes = results[0].boxes.xywh[:, :2].cpu() # Extract x, y centers
# Format coordinates as feature nodes for a geometric graph
node_features = torch.tensor(boxes.numpy(), dtype=torch.float)
print(f"Extracted {node_features.shape[0]} object nodes for graph construction.")
비전 아키텍처와 기하학적 데이터를 결합한 파이프라인을 효과적으로 확장하기 위해, 팀은 Ultralytics 활용하여 이미지 분할 데이터셋을 관리할 수 있습니다. 이 엔드투엔드 클라우드 솔루션은 초기 데이터 주석 작업부터 최종 모델 배포에 이르는 개발 라이프사이클을 간소화하여, 엔지니어들이 고급 매니폴드 학습 전략을 견고한 운영 환경에 통합하는 데 집중할 수 있도록 지원합니다.

미래의 머신러닝 여정을 시작하세요