YOLO26 소개: 차세대 비전 AI입니다.
Ultralytics
Ultralytics 용어집으로 돌아가기

Attention Sinks

어텐션 싱크(Attention Sinks)가 LLM 및 VLM의 무한 시퀀스 생성을 위해 어떻게 안정화하는지 확인해 보십시오. Ultralytics YOLO26으로 메모리를 최적화하고 안정적인 AI를 배포하는 방법을 배워 보십시오.

Attention sink는 현대적인 대규모 언어 모델(LLM)시각-언어 모델(VLM)의 아키텍처에서 발견된 중요한 현상으로, 연속적이고 긴 형식의 텍스트나 데이터 생성 과정에서 안정성을 보장합니다. 어텐션 메커니즘에서 신경망은 입력의 각 부분에 대해 동적으로 "가중치"를 할당합니다. 연구자들은 자기회귀 모델이 실제 의미와 관계없이 시퀀스의 첫 몇 개 토큰에 막대한 양의 과도한 어텐션 점수를 할당한다는 사실을 관찰했습니다. 이러한 초기 토큰은 "attention sink" 역할을 하며, 모델의 어텐션 점수가 붕괴되지 않도록 수학적 앵커(anchor)를 제공합니다. 이러한 sink 토큰을 모델의 KV cache에 영구적으로 유지함으로써, 개발자는 정확도를 저하시키거나 메모리 제한으로 인해 충돌을 일으키지 않으면서 무한한 시퀀스 생성을 가능하게 할 수 있습니다.

Link to this sectionAttention Sink가 모델을 안정화하는 방법#

Attention sink에 대한 필요성은 Transformer에서 사용되는 Softmax 연산에서 발생합니다. 어텐션 점수는 항상 합이 1이 되어야 하므로, 모델은 고도로 국소화된 데이터를 처리할 때 불필요한 어텐션을 할당할 장소가 필요합니다. 프롬프트의 가장 초기 토큰들이 자연스럽게 이러한 초과분을 흡수합니다.

역사적으로 매우 긴 시퀀스를 생성할 때 엔지니어들은 메모리에서 오래된 토큰을 제거하는 윈도잉 기법을 사용했습니다. 그러나 초기 sink 토큰을 삭제하면 즉각적인 성능 붕괴가 발생했습니다. StreamingLLM과 같은 최신 구현체는 이러한 초기 토큰을 가장 최근의 토큰과 함께 명시적으로 유지합니다. 메모리 관리에 대한 이러한 고도로 최적화된 접근 방식은 OpenAI vision developmentsGoogle DeepMind research에서 활발히 연구되고 있으며, PyTorch ecosystem 내에서 기본적으로 지원됩니다.

Link to this section관련 어텐션 개념의 차이점#

AI 모델이 컨텍스트를 최적화하는 방법을 완전히 이해하려면, attention sink를 다른 메모리 및 하드웨어 전략과 대조해보는 것이 도움이 됩니다:

  • Attention Sink vs. Sliding Window Attention: Sliding window attention은 메모리를 절약하기 위해 모델의 초점을 고정된 수의 최근 토큰으로 제한합니다. 그러나 엄격한 슬라이딩 윈도우는 첫 번째 토큰들을 버리기 때문에 불안정성을 초래합니다. Attention sink는 이러한 윈도우를 중요한 첫 번째 토큰들로 고정함으로써 이를 개선합니다.
  • Attention Sink vs. Flash Attention: Flash Attention은 GPU에서 메모리 읽기 및 쓰기 속도를 높이는 하드웨어 수준의 최적화입니다. 반면, attention sink는 논리적 안정성을 유지하기 위해 어떤 토큰이 메모리에 보존되어야 하는지에 대한 아키텍처적 발견입니다.

Link to this section실제 애플리케이션 사례#

Attention sink의 발견으로 다양한 산업 분야에서 고효율의 연속적인 처리 기능이 가능해졌습니다.

  1. 연속적인 AI 에이전트 및 챗봇: Attention sink를 유지함으로써 AI agent나 고객 서비스 봇은 수 시간 동안 중단 없이 대화를 스트리밍할 수 있습니다. 이는 초기 sink와 최근 컨텍스트를 유지하면서 중간 토큰을 선택적으로 잊음으로써, 메모리 부족 오류를 방지하고 대화의 일관성을 유지합니다.

  2. 실시간 영상 이해: 스마트 감시 및 지속적인 모니터링에서는 안정적인 컨텍스트 윈도우를 유지하는 것이 중요합니다. 모델은 에지 최적화된 비전 아키텍처의 효율성에 맞춰 며칠 동안 지속적으로 영상 피드를 분석할 수 있습니다.

Link to this section효율적인 연속 추론 구현#

Attention sink는 주로 대규모 생성 모델을 최적화하지만, 효율적이고 메모리를 고려한 추론 루프를 적용하는 것은 컴퓨터 비전(CV) 분야에서 보편적으로 중요합니다. Ultralytics YOLO26을 사용하여 연속적인 영상 스트림을 처리할 때, Python 제너레이터를 활용하면 국소화된 컨텍스트 윈도우를 관리하는 것과 유사하게 장기간 동안 메모리 안정성을 보장할 수 있습니다.

from ultralytics import YOLO

# Load the recommended Ultralytics YOLO26 model for efficient, real-time edge processing
model = YOLO("yolo26n.pt")

# Process a continuous video stream efficiently without memory overflow
results = model.predict(source="rtsp://continuous_camera_stream", stream=True)

# Iterate through the generator to maintain a stable memory footprint over time
for frame_result in results:
    print(f"Detected {len(frame_result.boxes)} objects in the current frame.")

이러한 효율적이고 연속적인 객체 탐지 파이프라인을 엔터프라이즈 용도로 확장하려면 강력한 관리 도구가 필요합니다. 개발자는 Ultralytics Platform을 활용하여 모델 배포 및 자동화된 데이터셋 관리를 간소화함으로써, 팀이 안정적이고 장기간 실행되는 비전 애플리케이션을 쉽게 구축할 수 있도록 지원합니다.

Explore solutions

Real-time AI that works with your team

로봇 공학에서의 AI

Ultralytics YOLO 모델로 더 스마트한 기기를 구동하십시오. 로봇 공학의 비전 AI는 자율 주행, 인식, 객체 추적 및 실시간 제어를 촉진합니다.
더 알아보기
Real-time AI that works with your team

물류 분야의 AI

Ultralytics YOLO 모델로 물류 프로세스를 간소화하십시오. 비전 AI를 통해 패키지 검사, 분류, 차량 추적 및 실시간 창고 안전 모니터링이 가능합니다.
더 알아보기
Real-time AI that works with your team

소매업에서의 AI

Ultralytics YOLO 모델로 소매업을 재구상하십시오. 비전 AI는 재고 추적, 선반 모니터링, 대기열 관리 및 더 스마트한 고객 인사이트를 지원합니다.
더 알아보기
Real-time AI that works with your team

의료 분야의 AI

Ultralytics YOLO 모델로 의료 솔루션을 구축하십시오. 의료 분야의 비전 AI는 더 빠른 의료 영상 분석, 더 스마트한 진단 및 환자 모니터링을 지원합니다.
더 알아보기
Real-time AI that works with your team

제조 분야의 AI

Ultralytics YOLO 모델로 제조 공정을 최적화하십시오. 비전 AI는 품질 관리, 결함 탐지, PPE 규정 준수 및 조립 라인 자동화를 주도합니다.
더 알아보기
Real-time AI that works with your operation

자동차 분야의 AI

Ultralytics YOLO 모델을 통해 자동차 분야에 컴퓨터 비전을 적용하십시오. 비전 AI는 도로 안전, 운전자 보조 및 차량 자동화를 향상하여 더 스마트한 도로를 만듭니다.
더 알아보기
Real-time AI tailored to your operation

농업 분야의 AI

Ultralytics YOLO 모델을 통해 스마트 농업에 비전 AI를 도입하십시오. 작물 모니터링, 가축 추적 및 정밀 농업을 강화하여 더 높고 스마트한 생산량을 달성하십시오.
더 알아보기
Real-time AI that works with your team

로봇 공학에서의 AI

Ultralytics YOLO 모델로 더 스마트한 기기를 구동하십시오. 로봇 공학의 비전 AI는 자율 주행, 인식, 객체 추적 및 실시간 제어를 촉진합니다.
더 알아보기
Real-time AI that works with your team

물류 분야의 AI

Ultralytics YOLO 모델로 물류 프로세스를 간소화하십시오. 비전 AI를 통해 패키지 검사, 분류, 차량 추적 및 실시간 창고 안전 모니터링이 가능합니다.
더 알아보기
Real-time AI that works with your team

소매업에서의 AI

Ultralytics YOLO 모델로 소매업을 재구상하십시오. 비전 AI는 재고 추적, 선반 모니터링, 대기열 관리 및 더 스마트한 고객 인사이트를 지원합니다.
더 알아보기
Real-time AI that works with your team

의료 분야의 AI

Ultralytics YOLO 모델로 의료 솔루션을 구축하십시오. 의료 분야의 비전 AI는 더 빠른 의료 영상 분석, 더 스마트한 진단 및 환자 모니터링을 지원합니다.
더 알아보기
Real-time AI that works with your team

제조 분야의 AI

Ultralytics YOLO 모델로 제조 공정을 최적화하십시오. 비전 AI는 품질 관리, 결함 탐지, PPE 규정 준수 및 조립 라인 자동화를 주도합니다.
더 알아보기
Real-time AI that works with your operation

자동차 분야의 AI

Ultralytics YOLO 모델을 통해 자동차 분야에 컴퓨터 비전을 적용하십시오. 비전 AI는 도로 안전, 운전자 보조 및 차량 자동화를 향상하여 더 스마트한 도로를 만듭니다.
더 알아보기
Real-time AI tailored to your operation

농업 분야의 AI

Ultralytics YOLO 모델을 통해 스마트 농업에 비전 AI를 도입하십시오. 작물 모니터링, 가축 추적 및 정밀 농업을 강화하여 더 높고 스마트한 생산량을 달성하십시오.
더 알아보기
Real-time AI that works with your team

로봇 공학에서의 AI

Ultralytics YOLO 모델로 더 스마트한 기기를 구동하십시오. 로봇 공학의 비전 AI는 자율 주행, 인식, 객체 추적 및 실시간 제어를 촉진합니다.
더 알아보기
Real-time AI that works with your team

물류 분야의 AI

Ultralytics YOLO 모델로 물류 프로세스를 간소화하십시오. 비전 AI를 통해 패키지 검사, 분류, 차량 추적 및 실시간 창고 안전 모니터링이 가능합니다.
더 알아보기
Real-time AI that works with your team

소매업에서의 AI

Ultralytics YOLO 모델로 소매업을 재구상하십시오. 비전 AI는 재고 추적, 선반 모니터링, 대기열 관리 및 더 스마트한 고객 인사이트를 지원합니다.
더 알아보기
Real-time AI that works with your team

의료 분야의 AI

Ultralytics YOLO 모델로 의료 솔루션을 구축하십시오. 의료 분야의 비전 AI는 더 빠른 의료 영상 분석, 더 스마트한 진단 및 환자 모니터링을 지원합니다.
더 알아보기
Real-time AI that works with your team

제조 분야의 AI

Ultralytics YOLO 모델로 제조 공정을 최적화하십시오. 비전 AI는 품질 관리, 결함 탐지, PPE 규정 준수 및 조립 라인 자동화를 주도합니다.
더 알아보기
Real-time AI that works with your operation

자동차 분야의 AI

Ultralytics YOLO 모델을 통해 자동차 분야에 컴퓨터 비전을 적용하십시오. 비전 AI는 도로 안전, 운전자 보조 및 차량 자동화를 향상하여 더 스마트한 도로를 만듭니다.
더 알아보기
Real-time AI tailored to your operation

농업 분야의 AI

Ultralytics YOLO 모델을 통해 스마트 농업에 비전 AI를 도입하십시오. 작물 모니터링, 가축 추적 및 정밀 농업을 강화하여 더 높고 스마트한 생산량을 달성하십시오.
더 알아보기

미래의 AI를 함께 구축합시다!

머신 러닝의 미래와 함께 여정을 시작하십시오.