용어집

슬라이딩 윈도우 주의

슬라이딩 윈도우 어텐션이 어떻게 계산 비용을 줄여 트랜스포머의 효율성을 높이는지 알아보세요. Ultralytics 통해 NLP 및 비전 분야에서 이 기법이 어떤 역할을 하는지 확인해 보세요.

슬라이딩 윈도우 어텐션(Sliding Window Attention)은 현대적인 트랜스포머 아키텍처에서 사용되는 표준 어텐션 메커니즘을 최적화한 변형으로, 계산 효율을 획기적으로 향상시킵니다. 기존의 셀프 어텐션에서는 시퀀스 내의 모든 토큰이 다른 모든 토큰을 처리해야 하므로, 시퀀스 길이에 비례하여 메모리 및 계산 비용이 2제곱으로 증가합니다. 슬라이딩 윈도우 어텐션은 토큰의 집중 범위를 주변 토큰들로 구성된 고정 크기의 국소 영역, 즉 "윈도우"로 제한함으로써 이러한 병목 현상을 해결합니다. 이 접근 방식은 복잡도를 2차에서 선형으로 줄여주어, 대규모 인공지능(AI) 모델에서 컨텍스트 윈도우를 확장하는 데 있어 핵심적인 구성 요소가 됩니다.

이 기법을 사용하는 여러 신경망 레이어를 쌓아 올리면, 국소적인 윈도우들이 서로 겹치며 네트워크의 더 깊은 층에서 정보를 공유함에 따라 모델은 입력 데이터에 대한 전반적인 이해를 점차적으로 구축할 수 있습니다. 이 기초적인 개념은 Google 연구를 통해 널리 입증되었으며, 다음과 같은 최신 프레임워크에 적극적으로 적용되고 있습니다. PyTorch와 같은 현대적인 프레임워크에서 활발히 적용되고 있습니다.

실제 애플리케이션

계산 메모리를 소진하지 않고 방대한 데이터 시퀀스를 처리할 수 있는 능력은 다양한 AI 분야에서 다음과 같은 고급 기능을 가능하게 합니다:

NLP에서의 장문 요약: 방대한 법률 계약서, 코드베이스 저장소 또는 재무 보고서를 분석하는 대규모 언어 모델(LLM) 의 경우, 슬라이딩 윈도우 어텐션 기법을 통해 모델이 수천 개의 토큰을 동시에 처리할 수 있게 됩니다. 이를 통해 정확한 텍스트 요약을 위해 필요한 서사적 일관성을 유지하면서도 메모리 오류를 방지할 수 있습니다.
고해상도 비전 과제: 컴퓨터 비전(CV) 분야에서 의료 영상 분석이나 위성 영상 분석에사용되는 것과 같은 기가픽셀급 이미지를 처리하면 방대한 양의 데이터 시퀀스가 생성됩니다. 모델은 주의 집중 영역을 국소화함으로써 원본 이미지의 해상도를 과도하게 낮추지 않고도 세밀한 이미지 분할을 수행하고 미세한 이상 징후를 식별할 수 있습니다.

효율적인 아키텍처 구현

고속 물체 탐지 시스템을 구축하는 개발자들에게는 고도로 최적화된 아키텍처를 활용하는 것이 필수적입니다. 원시 어텐션 메커니즘도 강력하지만, Ultralytics 같은 엔드투엔드 모델은 고급 특징 추출과 엣지 디바이스의 효율성을 조화시켜 업계 최고 수준의 성능을 제공합니다.

from ultralytics import YOLO

# Load the recommended YOLO26 model for high-resolution vision tasks
model = YOLO("yolo26x.pt")

# Perform inference on a large image, utilizing optimized internal processing
results = model.predict(source="large_aerial_map.jpg", imgsz=1024, show=True)

# Output the number of detected instances
print(f"Detected {len(results[0].boxes)} objects in the high-resolution input.")

이러한 정교한 파이프라인을 로컬 프로토타이핑 단계에서 기업용 생산 환경으로 확장하려면 견고한 인프라가 필요합니다. Ultralytics 자동화된 데이터셋 주석 달기, 원활한 클라우드 훈련, 실시간 모델 모니터링을 위한 직관적인 인터페이스를 제공함으로써 이 과정을 완전히 간소화합니다. 이를 통해 팀은 다양한 하드웨어 환경에서 고효율의 대규모 컨텍스트 모델이 제공하는 이점을 원활하게 활용할 수 있습니다.

슬라이딩 윈도우 주의

17가지 이상의 형식으로 내보내기. 전 세계 43개 지역에 배포.

H100 GPU에서 YOLO26을 시간당 2.39달러에 훈련하세요.

비전 AI 프로젝트를 뒷받침하는 유연한 기업용 라이선스.

차기 프로젝트를 성공적으로 이끌어 줄 엔터프라이즈 라이선스

스마트 주석 기능을 통해 최대 10배 더 빠르게 라벨링하세요

라벨링. 학습. 배포. 단일 플랫폼에서 모두 해결.

실제 애플리케이션

관련 용어 차별화

효율적인 아키텍처 구현

이 카테고리에서 더 읽어보기

Ultralytics 활용한 폴리곤 주석 달기 가이드

독일 하노버 메세 Ultralytics 주요 하이라이트

컴퓨터 비전 프로젝트를 TensorFlow PyTorch TensorFlow 중 선택하기

함께 AI의 미래를 만들어 갑시다!

슬라이딩 윈도우 주의

17가지 이상의 형식으로 내보내기. 전 세계 43개 지역에 배포.

H100 GPU에서 YOLO26을 시간당 2.39달러에 훈련하세요.

비전 AI 프로젝트를 뒷받침하는 유연한 기업용 라이선스.

차기 프로젝트를 성공적으로 이끌어 줄 엔터프라이즈 라이선스

스마트 주석 기능을 통해 최대 10배 더 빠르게 라벨링하세요

라벨링. 학습. 배포. 단일 플랫폼에서 모두 해결.

실제 애플리케이션

관련 용어 차별화

효율적인 아키텍처 구현

이 카테고리에서 더 읽어보기

Ultralytics 활용한 폴리곤 주석 달기 가이드

독일 하노버 메세 Ultralytics 주요 하이라이트

컴퓨터 비전 프로젝트를 TensorFlow PyTorch TensorFlow 중 선택하기

함께 AI의 미래를 만들어 갑시다!

라벨링. 학습. 배포. 단일 플랫폼에서 모두 해결.