용어집

토큰 통합 (ToMe)

토큰 병합(ToMe)이 트랜스포머(Transformer) 및 ViT 모델을 어떻게 최적화하는지 알아보세요. FLOPs를 줄이고, 실시간 추론을 가속화하며, 생성형 AI의 속도를 높이는 방법을 확인해 보세요.

토큰 병합(ToMe)은 전방 전달 단계에서 처리되는 토큰의 수를 줄임으로써 트랜스포머 아키텍처의 성능과 효율성을 최적화하도록 설계된 최첨단 기법입니다. 원래 비전 트랜스포머(ViT) 모델의 처리 속도를 높이기 위해 개발된 ToMe는 추가적인 훈련 없이도 네트워크 내의 중복 토큰을 체계적으로 식별하고 결합하는 방식으로 작동합니다. 셀프 어텐션 메커니즘의 계산 복잡도는 토큰 수에 따라 2차적으로 증가하므로, 유사한 토큰을 병합하면 전체 부동소수점 연산(FLOPs)이 대폭 감소하여 실시간 추론 속도가 크게 향상됩니다.

토큰 통합 프로세스 이해하기

ToMe는 토큰화(tokenization)와 근본적으로 다릅니다. 토큰화란 이미지나 텍스트를 개별 토큰으로 분해하는 초기 전처리 단계입니다. 토큰화가 개별 요소를 생성하는 반면, 토큰 병합(Token Merging)은 모델의 전방 실행 과정에서 동적인 다운샘플링 메커니즘으로 작용합니다.

이 알고리즘은 일반적으로 토큰의 유사성을 평가하기 위해 이분 그래프 매칭을 사용하며, 주로 어텐션 레이어 내 토큰의 키 간 코사인 유사도를 계산합니다. 시각적 또는 의미적 정보가 매우 유사한 토큰들은—주로 특징값을 평균화하여—합쳐집니다. 이를 통해 불필요한 계산 부하를 줄이면서도 필수적인 공간적 또는 문맥적 정보는 보존되므로, PyTorch 와 같은 프레임워크가 복잡한 비전 모델을 훨씬 더 빠르게 처리할 수 있게 합니다.

토큰 통합의 실제 적용 사례

토큰 병합은 연산 자원이 제한된 환경에서 대규모 어텐션 기반 아키텍처를 배포하기 위한 핵심적인 최적화 전략으로 자리 잡았다.

생성형 AI와 이미지 합성: 널리 사용되는 텍스트-이미지 확산 모델에서 ToMe는 이미지 생성을 가속화하는 데 자주 사용됩니다. 배경이나 디테일이 적은 토큰을 병합함으로써 생성 과정이 더 적은 단계로 이루어지므로, 막대한 GPU 절약하고 생성형 모델에 의존하는 최종 사용자의 지연 시간을 줄일 수 있습니다. 확산 과정에 대한 자세한 내용은 arXiv의 기초 연구에서 확인할 수 있습니다.
엣지 AI 배포: Segment Anything Model(SAM) 과 같은 대규모 모델을 모바일 기기에 배포하는 것은 메모리 제약으로 인해 매우 어려운 것으로 알려져 있습니다. ToMe는 메모리 사용량을 동적으로 줄여주어, 복잡한 이미지 분할 작업을 엣지 하드웨어에서 실행할 수 있게 합니다. 순수한 속도가 중요한 시나리오의 경우, 엔지니어들은 더 빠른 엔드투엔드 엣지 추론을 위해 Ultralytics 같이 네이티브로 최적화되고 어텐션이 없는 아키텍처로 전환하는 경우가 많습니다.

Python : 토큰 유사도 계산

ToMe를 전체 아키텍처에 통합하려면 어텐션 블록을 수정해야 하지만, 핵심 개념은 유사한 토큰을 찾는 데 있습니다. 다음 PyTorch 토큰 집합 간의 코사인 유사도를 계산하여 어떤 토큰을 병합 후보로 선정할지 확인하는 방법을 보여줍니다.

import torch
import torch.nn.functional as F

# Simulate a batch of 4 image patches (tokens) with 64-dimensional features
tokens = torch.randn(1, 4, 64)

# Normalize the tokens to easily compute cosine similarity via dot product
normalized_tokens = F.normalize(tokens, p=2, dim=-1)

# Compute the similarity matrix between all tokens (1 x 4 x 4)
similarity_matrix = torch.matmul(normalized_tokens, normalized_tokens.transpose(1, 2))

# Tokens with high similarity scores (close to 1.0) off the diagonal
# are prime candidates for Token Merging.
print("Similarity Matrix:", similarity_matrix)

현대적인 머신러닝 파이프라인은 정확도와 속도의 신중한 균형을 요구합니다. 맞춤형 ViT를 최적화하기 위해 토큰 병합(Token Merging)을 활용하든, YOLO26의 최첨단 효율성에 의존하든, Ultralytics 통해 이러한 복잡한 데이터 워크플로우를 관리하는 과정이 크게 간소화됩니다. 이 플랫폼은 자동화된 데이터 주석 작업, 원활한 클라우드 훈련, 그리고 다양한 엣지 컴퓨팅 하드웨어 환경에 걸친 안정적인 모델 배포를 위한 직관적인 생태계를 제공합니다. 컴퓨터 비전 이니셔티브를 확장하는 기업들은 이러한 도구를 활용하여 최첨단 모델을 안정적이고 효율적으로 실전 환경에 적용하고 있습니다.

토큰 통합 (ToMe)

17가지 이상의 형식으로 내보내기. 전 세계 43개 지역에 배포.

H100 GPU에서 YOLO26을 시간당 2.39달러에 훈련하세요.

비전 AI 프로젝트를 뒷받침하는 유연한 기업용 라이선스.

차기 프로젝트를 성공적으로 이끌어 줄 엔터프라이즈 라이선스

스마트 주석 기능을 통해 최대 10배 더 빠르게 라벨링하세요

라벨링. 학습. 배포. 단일 플랫폼에서 모두 해결.

토큰 통합 프로세스 이해하기

토큰 통합의 실제 적용 사례

Python : 토큰 유사도 계산

이 카테고리에서 더 읽어보기

독일 하노버 메세 Ultralytics 주요 하이라이트

컴퓨터 비전 프로젝트를 TensorFlow PyTorch TensorFlow 중 선택하기

컴퓨터 비전 분야에서 지도 학습과 비지도 학습 비교 분석

함께 AI의 미래를 만들어 갑시다!

토큰 통합 (ToMe)

17가지 이상의 형식으로 내보내기. 전 세계 43개 지역에 배포.

H100 GPU에서 YOLO26을 시간당 2.39달러에 훈련하세요.

비전 AI 프로젝트를 뒷받침하는 유연한 기업용 라이선스.

차기 프로젝트를 성공적으로 이끌어 줄 엔터프라이즈 라이선스

스마트 주석 기능을 통해 최대 10배 더 빠르게 라벨링하세요

라벨링. 학습. 배포. 단일 플랫폼에서 모두 해결.

토큰 통합 프로세스 이해하기

토큰 통합의 실제 적용 사례

Python : 토큰 유사도 계산

이 카테고리에서 더 읽어보기

독일 하노버 메세 Ultralytics 주요 하이라이트

컴퓨터 비전 프로젝트를 TensorFlow PyTorch TensorFlow 중 선택하기

컴퓨터 비전 분야에서 지도 학습과 비지도 학습 비교 분석

함께 AI의 미래를 만들어 갑시다!

라벨링. 학습. 배포. 단일 플랫폼에서 모두 해결.