용어집

벡터 양자화

머신러닝(ML) 분야의 데이터 압축 및 이산화를 위한 벡터 양자화를 살펴보세요. 벡터 양자화가 VQ-VAE, 벡터 검색, 그리고 Ultralytics 배포를 어떻게 최적화하는지 알아보세요.

벡터 양자화는 현대 기계 학습(ML) 및 디지털 신호 처리 분야에서 널리 사용되는 강력한 데이터 압축 및 이산화 기법입니다. 기본적으로 이 기법은 대량의 연속적인 점이나 벡터 집합을 여러 그룹으로 나누고, 각 그룹을 하나의 "프로토타입" 벡터로 표현하여, 이를 종합하여 코드북이라 불리는 구조를 형성하는 방식으로 작동합니다. 연속적인 고차원 벡터를 이러한 이산적인 코드북 항목에 매핑함으로써, 시스템은 메모리 사용량을 대폭 줄이면서도 데이터의 핵심적인 의미적 특성을 보존하여 효과적인 차원 축소를 달성할 수 있습니다.

딥 러닝에서 이산화(Discretization)의 역할

현대 딥러닝(DL) 분야에서 이 개념은 벡터 양자화 변분 오토인코더(VQ-VAE)를 통해 널리 알려지게 되었습니다. 특징 추출을 위해 연속적인 잠재 공간을 학습하는 일반적인 오토인코더와 달리, VQ-VAE는 이산적인 표현을 학습합니다. 이를 통해 생성 모델은 이미지, 오디오 또는 비디오를 이산 토큰의 시퀀스로 처리할 수 있게 되며, 이는 대규모 언어 모델(LLM) 이 텍스트 입력을 처리하는 방식과 유사합니다. 이산 표현 학습에 대한 기초 연구를 살펴보면, 초기 구현들이 어떻게 현대의 토큰 기반 비전 시스템의 토대를 마련했는지 확인할 수 있습니다.

실제 애플리케이션

벡터 양자화는 성능과 메모리 효율성이 가장 중요한 여러 실제 AI 응용 분야에서 핵심적인 역할을 합니다:

생성형 AI와 미디어 압축: 벡터 양자화는 복잡한 시각 데이터를 이산적인 잠재 코드로 압축함으로써 매우 효율적인 이미지 및 영상 생성을 가능하게 합니다. 연속적인 픽셀을 이산적인 토큰으로 매핑하는 모델은 계산 오버헤드를 대폭 줄여주며, 잠재 확산 모델과 같은 고급 아키텍처의 구현을 돕습니다.
고속 벡터 검색: 신속한 유사도 검색을 수행하기 위해, 최신 시스템은 수백만 개의 임베딩을 쿼리해야 합니다. 벡터 양자화는 이러한 방대한 데이터 세트를 압축하여, 검색 엔진이 빠른 근사 최인접 이웃 (ANN) 검색을 수행할 수 있게 하며, 이는 소매 및 제품 추천 시스템 분야의 AI에 매우 유용합니다. 고차원 데이터 처리에 대한 더 자세한 내용은 OpenAI의 임베딩 가이드를 확인해 보세요.

기본 구현 예시

벡터 양자화가 실제로 연속적인 입력값을 이산 토큰으로 어떻게 매핑하는지 확인하려면, PyTorch 유클리드 거리를 PyTorch 미리 정의된 코드북에서 가장 가까운 프로토타입을 찾을 수 있습니다:

import torch

# Define a continuous input batch and a discrete codebook vocabulary
inputs = torch.randn(4, 128)  # 4 input vectors of dimension 128
codebook = torch.randn(10, 128)  # 10 discrete prototype vectors

# Compute distances and find the nearest codebook index for each input
distances = torch.cdist(inputs, codebook)
quantized_indices = torch.argmin(distances, dim=1)

# Retrieve the discrete quantized vectors corresponding to the inputs
quantized_vectors = codebook[quantized_indices]

tensor 계산의 기본 원리와 해당 연산 최적화에 대한 자세한 내용은 공식 PyTorch 문서를 참조하십시오.

Ultralytics 통한 워크플로 개선

최적화된 임베딩을 파이프라인에 통합하려면 강력한 도구가 필요합니다. Ultralytics 훈련 데이터를 큐레이션하고 최첨단 비전 모델을 훈련할 수 있는 엔드투엔드 환경을 제공합니다. 데이터 관리를 효율화하고 모델 배포를 간소화함으로써, 개발자는 벡터 양자화에 적합한 고품질 시각적 특징을 손쉽게 생성할 수 있으며, 이를 통해 물체 탐지 및 대규모 미디어 검색 애플리케이션의 성능을 향상시킬 수 있습니다.

벡터 양자화

17가지 이상의 형식으로 내보내기. 전 세계 43개 지역에 배포.

H100 GPU에서 YOLO26을 시간당 2.39달러에 훈련하세요.

비전 AI 프로젝트를 뒷받침하는 유연한 기업용 라이선스.

차기 프로젝트를 성공적으로 이끌어 줄 엔터프라이즈 라이선스

스마트 주석 기능을 통해 최대 10배 더 빠르게 라벨링하세요

라벨링. 학습. 배포. 단일 플랫폼에서 모두 해결.

딥 러닝에서 이산화(Discretization)의 역할

실제 애플리케이션

관련 개념 구분하기

기본 구현 예시

Ultralytics 통한 워크플로 개선

이 카테고리에서 더 읽어보기

Ultralytics 사용하여 Ultralytics YOLO 내보내는 방법

Ultralytics 활용한 안전하지 않은 팔레트 적재 감지

Ultralytics 활용한 폴리곤 주석 달기 가이드

함께 AI의 미래를 만들어 갑시다!

벡터 양자화

17가지 이상의 형식으로 내보내기. 전 세계 43개 지역에 배포.

H100 GPU에서 YOLO26을 시간당 2.39달러에 훈련하세요.

비전 AI 프로젝트를 뒷받침하는 유연한 기업용 라이선스.

차기 프로젝트를 성공적으로 이끌어 줄 엔터프라이즈 라이선스

스마트 주석 기능을 통해 최대 10배 더 빠르게 라벨링하세요

라벨링. 학습. 배포. 단일 플랫폼에서 모두 해결.

딥 러닝에서 이산화(Discretization)의 역할

실제 애플리케이션

관련 개념 구분하기

기본 구현 예시

Ultralytics 통한 워크플로 개선

이 카테고리에서 더 읽어보기

Ultralytics 사용하여 Ultralytics YOLO 내보내는 방법

Ultralytics 활용한 안전하지 않은 팔레트 적재 감지

Ultralytics 활용한 폴리곤 주석 달기 가이드

함께 AI의 미래를 만들어 갑시다!

라벨링. 학습. 배포. 단일 플랫폼에서 모두 해결.