YOLO26の紹介: 次世代のビジョンAI。
Ultralytics
Ultralytics用語集に戻る

Attention Sinks

アテンションシンクがLLMおよびVLMの無限シーケンス生成をどのように安定させるかを発見します。メモリを最適化し、Ultralytics YOLO26で安定したAIをデプロイする方法を学びましょう。

Attention sinksは、現代のlarge language models (LLMs)vision-language models (VLMs)のアーキテクチャにおいて発見された重要な現象であり、継続的で長文のテキスト生成やデータ生成における安定性を確保します。attention mechanismにおいて、ニューラルネットワークは入力の各部分に対して動的に「重み」を割り当てます。研究者は、自己回帰モデルがその実際の意味的意義にかかわらず、シーケンスの最初の数トークンに対して大量の過剰なAttentionスコアを本質的に割り当てることを観察しました。これらの初期トークンは「attention sink」として機能し、モデルのAttentionスコアの崩壊を防ぐ数学的なアンカーを提供します。開発者は、これらのsinkトークンをモデルのKV cacheに永続的に保持することで、精度を低下させたりメモリ制限によりクラッシュしたりすることなく、無限のシーケンス生成を実現できます。

Link to this sectionAttention Sinksがモデルを安定させる仕組み#

Attention sinksの必要性は、Transformersで使用されるSoftmax演算から生じます。Attentionスコアは常に合計が1になる必要があるため、モデルは高度に局所化されたデータを処理する際に、不要なAttentionを割り当てる場所を必要とします。プロンプトの最初のトークンは、自然にこの過剰な分を吸収します。

歴史的に、非常に長いシーケンスを生成する場合、エンジニアは古いトークンをメモリから削除するウィンドウ処理技術を使用していました。しかし、最初のsinkトークンを破棄すると、即座にパフォーマンスが低下しました。StreamingLLMのような最新の実装では、これらの最初のトークンを最新のトークンとともに明示的に保持します。この高度に最適化されたメモリ管理のアプローチは、OpenAI vision developmentsGoogle DeepMind researchで積極的に研究されており、PyTorch ecosystem内でネイティブにサポートされています。

Link to this section関連するAttention概念の識別#

AIモデルがどのようにコンテキストを最適化するかを完全に理解するために、attention sinksと他のメモリおよびハードウェア戦略を対比させることが役立ちます。

  • Attention SinksとSliding Window Attentionの比較: Sliding window attentionは、メモリを節約するためにモデルの焦点を固定された数の最新トークンに制限します。しかし、厳密なスライディングウィンドウでは最初のトークンが破棄されるため、不安定さにつながります。Attention sinksは、重要な最初のトークンでウィンドウを固定することで、これを修正します。
  • Attention SinksとFlash Attentionの比較: Flash Attentionは、GPUでのメモリの読み書きを高速化するハードウェアレベルの最適化です。対照的に、Attention sinksは、論理的な安定性を維持するためにどのトークンをメモリに保持する必要があるかというアーキテクチャ上の発見です。

Link to this section実社会での応用#

Attention sinksの発見により、さまざまな業界で非常に効率的な継続的処理能力が解放されました。

  1. 継続的なAIエージェントとチャットボット: Attention sinksを保持することで、AI agentやカスタマーサービスボットは何時間も中断することなくダイアログをストリーミングできます。中間のトークンを選択的に忘れながら最初のsinkと最近のコンテキストを保持することで、会話の一貫性を保ちつつメモリ不足エラーを防ぎます。

  2. リアルタイムのビデオ理解: smart surveillanceや継続的な監視において、安定したコンテキストウィンドウを維持することは不可欠です。モデルは何日も継続的なビデオフィードを分析でき、エッジ最適化されたビジョンアーキテクチャと同等の効率を実現します。

Link to this section効率的な継続的推論の実装#

Attention sinksは主に大規模な生成モデルを最適化するものですが、効率的でメモリを意識した推論ループを適用することは、computer vision (CV)において普遍的に重要です。Ultralytics YOLO26を使用して継続的なビデオストリームを処理する場合、Pythonジェネレーターを活用することで、局所的なコンテキストウィンドウを管理するのと同様に、長期間にわたってメモリの安定性を確保できます。

from ultralytics import YOLO

# Load the recommended Ultralytics YOLO26 model for efficient, real-time edge processing
model = YOLO("yolo26n.pt")

# Process a continuous video stream efficiently without memory overflow
results = model.predict(source="rtsp://continuous_camera_stream", stream=True)

# Iterate through the generator to maintain a stable memory footprint over time
for frame_result in results:
    print(f"Detected {len(frame_result.boxes)} objects in the current frame.")

エンタープライズ利用のためにこれらの効率的で継続的なobject detectionパイプラインをスケーリングするには、堅牢な管理ツールが必要です。開発者はUltralytics Platformを活用してmodel deploymentと自動化されたデータセット管理を簡素化し、チームが安定した長時間稼働するビジョンアプリケーションを容易に構築できるようにすることができます。

Explore solutions

Real-time AI that works with your team

ロボティクスにおけるAI

Ultralytics YOLOモデルで、よりスマートなマシンを実現しましょう。ロボティクスにおけるビジョンAIは、自律航行、認識、物体追跡、リアルタイム制御を推進します。
詳細はこちら
Real-time AI that works with your team

物流におけるAI

Ultralytics YOLOモデルで物流を効率化しましょう。ビジョンAIにより、荷物の検査、仕分け、車両追跡、リアルタイムの倉庫安全モニタリングが可能になります。
詳細はこちら
Real-time AI that works with your team

小売業界におけるAI

Ultralytics YOLOモデルで小売を再定義しましょう。ビジョンAIは、在庫追跡、棚のモニタリング、キュー管理、そしてより賢明な顧客インサイトを促進します。
詳細はこちら
Real-time AI that works with your team

ヘルスケアにおけるAI

Ultralytics YOLOモデルを使用してヘルスケアソリューションを構築しましょう。ヘルスケア分野におけるビジョンAIは、より高速な医療画像診断、よりスマートな診断、患者モニタリングを推進します。
詳細はこちら
Real-time AI that works with your team

製造におけるAI

Ultralytics YOLOモデルで製造を最適化しましょう。ビジョンAIは、品質管理、欠陥検出、PPEコンプライアンス、組立ラインの自動化を促進します。
詳細はこちら
Real-time AI that works with your operation

自動車におけるAI

Ultralytics YOLOモデルを使用して、自動車分野にコンピュータビジョンを適用しましょう。ビジョンAIは、道路の安全性、運転支援、車両の自動化を向上させ、よりスマートな道路を実現します。
詳細はこちら
Real-time AI tailored to your operation

農業におけるAI

Ultralytics YOLOモデルを使用して、スマート農業にビジョンAIを導入しましょう。作物モニタリング、家畜のトラッキング、精密農業を強化し、より高くスマートな収穫を実現します。
詳細はこちら
Real-time AI that works with your team

ロボティクスにおけるAI

Ultralytics YOLOモデルで、よりスマートなマシンを実現しましょう。ロボティクスにおけるビジョンAIは、自律航行、認識、物体追跡、リアルタイム制御を推進します。
詳細はこちら
Real-time AI that works with your team

物流におけるAI

Ultralytics YOLOモデルで物流を効率化しましょう。ビジョンAIにより、荷物の検査、仕分け、車両追跡、リアルタイムの倉庫安全モニタリングが可能になります。
詳細はこちら
Real-time AI that works with your team

小売業界におけるAI

Ultralytics YOLOモデルで小売を再定義しましょう。ビジョンAIは、在庫追跡、棚のモニタリング、キュー管理、そしてより賢明な顧客インサイトを促進します。
詳細はこちら
Real-time AI that works with your team

ヘルスケアにおけるAI

Ultralytics YOLOモデルを使用してヘルスケアソリューションを構築しましょう。ヘルスケア分野におけるビジョンAIは、より高速な医療画像診断、よりスマートな診断、患者モニタリングを推進します。
詳細はこちら
Real-time AI that works with your team

製造におけるAI

Ultralytics YOLOモデルで製造を最適化しましょう。ビジョンAIは、品質管理、欠陥検出、PPEコンプライアンス、組立ラインの自動化を促進します。
詳細はこちら
Real-time AI that works with your operation

自動車におけるAI

Ultralytics YOLOモデルを使用して、自動車分野にコンピュータビジョンを適用しましょう。ビジョンAIは、道路の安全性、運転支援、車両の自動化を向上させ、よりスマートな道路を実現します。
詳細はこちら
Real-time AI tailored to your operation

農業におけるAI

Ultralytics YOLOモデルを使用して、スマート農業にビジョンAIを導入しましょう。作物モニタリング、家畜のトラッキング、精密農業を強化し、より高くスマートな収穫を実現します。
詳細はこちら
Real-time AI that works with your team

ロボティクスにおけるAI

Ultralytics YOLOモデルで、よりスマートなマシンを実現しましょう。ロボティクスにおけるビジョンAIは、自律航行、認識、物体追跡、リアルタイム制御を推進します。
詳細はこちら
Real-time AI that works with your team

物流におけるAI

Ultralytics YOLOモデルで物流を効率化しましょう。ビジョンAIにより、荷物の検査、仕分け、車両追跡、リアルタイムの倉庫安全モニタリングが可能になります。
詳細はこちら
Real-time AI that works with your team

小売業界におけるAI

Ultralytics YOLOモデルで小売を再定義しましょう。ビジョンAIは、在庫追跡、棚のモニタリング、キュー管理、そしてより賢明な顧客インサイトを促進します。
詳細はこちら
Real-time AI that works with your team

ヘルスケアにおけるAI

Ultralytics YOLOモデルを使用してヘルスケアソリューションを構築しましょう。ヘルスケア分野におけるビジョンAIは、より高速な医療画像診断、よりスマートな診断、患者モニタリングを推進します。
詳細はこちら
Real-time AI that works with your team

製造におけるAI

Ultralytics YOLOモデルで製造を最適化しましょう。ビジョンAIは、品質管理、欠陥検出、PPEコンプライアンス、組立ラインの自動化を促進します。
詳細はこちら
Real-time AI that works with your operation

自動車におけるAI

Ultralytics YOLOモデルを使用して、自動車分野にコンピュータビジョンを適用しましょう。ビジョンAIは、道路の安全性、運転支援、車両の自動化を向上させ、よりスマートな道路を実現します。
詳細はこちら
Real-time AI tailored to your operation

農業におけるAI

Ultralytics YOLOモデルを使用して、スマート農業にビジョンAIを導入しましょう。作物モニタリング、家畜のトラッキング、精密農業を強化し、より高くスマートな収穫を実現します。
詳細はこちら

AIの未来を共に築き上げましょう!

機械学習の未来とともに旅を始めましょう