Geometric Deep Learning (GDL)

비유클리드 데이터를 처리하기 위한 기하학적 딥러닝(Geometric Deep Learning)을 탐색해 보십시오. Ultralytics YOLO26을 GDL과 결합하여 3D 메시, 그래프 및 고급 공간 AI를 구현하는 방법을 알아보십시오.

Geometric Deep Learning (GDL) is a broad umbrella term for advanced machine learning techniques specifically designed to process non-Euclidean data. Unlike standard formats such as 2D images or text sequences, which sit on flat, predictable grids, non-Euclidean data includes complex structures like manifolds and 3D meshes as well as intricate relational networks. By establishing mathematical frameworks that respect the intrinsic geometry of these structures, Geometric Deep Learning enables AI systems to accurately analyze molecular formations, complex topological maps, and dynamic interconnected systems.

기하학적 딥러닝의 작동 원리#

기하학적 딥러닝의 기본 원리는 복잡한 데이터 세트에 존재하는 대칭성, 불변성 및 등변성을 활용하는 데 있습니다. 실무자들 사이에서 간단한 거리 행렬만으로 기하학적 딥러닝을 수행하기에 충분한지에 대한 의문이 자주 제기됩니다. 답은 아니오입니다. 거리 행렬은 쌍별 거리를 포착하지만, 진정한 기하학적 추론에 필요한 위상적 뉘앙스는 부족합니다. 대신 GDL은 메시지 전달 아키텍처와 이웃 집계에 크게 의존합니다.

기하학적 딥러닝과 그래프 신경망(GNN)을 구분하는 것은 유용합니다. GDL은 모든 비유클리드 딥러닝을 포괄하는 상위 이론 분야인 반면, GNN은 그래프 데이터에서만 독점적으로 작동하는 특정 유형의 신경망 아키텍처입니다. PyTorch Geometric 및 TensorFlow GNN과 같은 프레임워크는 이러한 딥러닝 원리를 구현하는 데 널리 사용되며, 노드가 구조적 연결을 기반으로 자신의 표현을 업데이트할 수 있도록 합니다.

기하학적 학습 vs 전통적인 딥러닝#

합성곱 신경망(CNN)과 같은 전통적인 딥러닝 모델은 컴퓨터 비전 작업의 픽셀 그리드와 같은 유클리드 데이터에 최적화되어 있습니다. 마찬가지로 순환 신경망(RNN)은 선형 시퀀스를 처리하도록 구축되었습니다. 그러나 이러한 전통적인 네트워크는 데이터에 고정된 정형 구조가 부족할 때 어려움을 겪습니다.

기하학적 학습은 불규칙한 모양과 관계형 지도에서 직접 작동함으로써 이러한 한계를 극복합니다. 소셜 네트워크를 분석하거나 3D 환경을 탐색할 때, 데이터 포인트의 "이웃"이 더 이상 고정된 픽셀 사각형이 아니기 때문에 표준 합성곱은 실패합니다. 기하학적 모델은 수용 영역을 동적으로 조정하여 데이터의 진정한 형태를 정의하는 위상적 연결을 학습합니다.

지오메트리 그래프 및 모델의 실제 응용 분야#

지오메트리 그래프는 노드와 그 구조적 관계를 명시적으로 정의하므로, 기하학적 모델은 다양한 과학 및 상업 분야에서 획기적인 발전을 가져왔습니다.

신약 개발: GDL은 분자 상호 작용을 예측하는 데 매우 중요합니다. Google DeepMind의 AlphaFold는 아미노산을 연결된 그래프로 모델링하여 복잡한 단백질 접힘 문제를 해결하기 위해 공간 추론 기술을 사용하는 것으로 유명합니다.
소셜 네트워크 분석: 플랫폼은 GDL을 사용하여 사용자 상호 작용을 분석하며, 소셜 네트워크 분석 토폴로지를 매핑하여 고급 추천 시스템과 사기 탐지 기능을 활성화합니다.
3D 컴퓨터 비전: GDL은 자율 주행 차량 및 증강 현실을 위해 LiDAR 포인트 클라우드와 3D 메쉬를 처리하는 데 자주 적용됩니다.

GDL과 컴퓨터 비전의 통합#

전통적인 2D 컴퓨터 비전과 기하학적 모델을 연결하면 고급 공간 추론 및 3D 객체 탐지가 가능한 매우 강력한 시스템이 구축됩니다. Ultralytics YOLO26과 같은 강력한 2D 탐지기를 사용하여 개발자는 장면 내의 객체를 빠르게 찾을 수 있습니다. 그런 다음 이러한 탐지된 객체의 좌표는 기하학적 그래프의 기초 노드 역할을 할 수 있으며, 이를 통해 하류 GNN이 시각적 요소 간의 복잡한 관계를 추론할 수 있게 됩니다(예: "장면 그래프" 생성).

다음 Python 스니펫은 ultralytics 패키지를 사용하여 객체 탐지 좌표를 추출하고 기초 지오메트리 그래프 구조를 시작하는 방법을 보여줍니다.

import torch
from ultralytics import YOLO

# Load the Ultralytics YOLO26 model for high-speed object detection
model = YOLO("yolo26n.pt")

# Perform inference to detect objects
results = model("path/to/image.jpg")

# Extract the center coordinates (x, y) of bounding boxes to act as graph nodes
nodes = results[0].boxes.xywh[:, :2].cpu()
node_tensor = torch.tensor(nodes.numpy(), dtype=torch.float)

print(f"Extracted {node_tensor.size(0)} nodes for Geometric Deep Learning mapping.")

유클리드 객체 탐지와 비유클리드 매핑을 결합한 대규모 하이브리드 시스템을 구축하는 팀에게는 복잡한 데이터 어노테이션 관리가 매우 중요합니다. Ultralytics Platform은 이러한 기초 비전 모델을 안전하게 어노테이션하고, 학습시키며, 원활하게 배포하여 고급 공간 파이프라인을 지원할 수 있는 엔드 투 엔드 환경을 제공합니다.

Explore solutions

로봇 공학에서의 AI

Ultralytics YOLO 모델로 더 스마트한 기기를 구동하십시오. 로봇 공학의 비전 AI는 자율 주행, 인식, 객체 추적 및 실시간 제어를 촉진합니다.

Geometric Deep Learning (GDL)

기하학적 딥러닝의 작동 원리#

기하학적 학습 vs 전통적인 딥러닝#

지오메트리 그래프 및 모델의 실제 응용 분야#

GDL과 컴퓨터 비전의 통합#

Explore solutions

로봇 공학에서의 AI

물류 분야의 AI

소매업에서의 AI

의료 분야의 AI

제조 분야의 AI

자동차 분야의 AI

농업 분야의 AI

로봇 공학에서의 AI

물류 분야의 AI

소매업에서의 AI

의료 분야의 AI

제조 분야의 AI

자동차 분야의 AI

농업 분야의 AI

로봇 공학에서의 AI

물류 분야의 AI

소매업에서의 AI

의료 분야의 AI

제조 분야의 AI

자동차 분야의 AI

농업 분야의 AI

미래의 AI를 함께 구축합시다!