用語集

スライディング・ウィンドウ法

スライディングウィンドウ・アテンションが、計算コストを削減することでトランスフォーマーの効率を最適化する仕組みについて学びましょう。Ultralytics を用いて、NLPや画像処理分野におけるその役割を探ります。

スライディングウィンドウ・アテンションは、現代のトランスフォーマーアーキテクチャで利用されている標準的なアテンションメカニズムを最適化したもので、計算効率を劇的に向上させます。従来のセルフアテンションでは、シーケンス内のすべてのトークンが他のすべてのトークンを処理する必要があるため、シーケンスの長さに比例してメモリおよび計算コストが2乗的に増加してしまいます。スライディングウィンドウアテンションは、トークンの注目範囲を、周囲のトークンからなる固定サイズの局所領域、すなわち「ウィンドウ」に限定することで、このボトルネックに対処します。このアプローチにより、計算の複雑度は2乗から線形へと低減され、大規模な人工知能（AI）モデルにおいてコンテキストウィンドウを拡張するための重要な構成要素となっています。

この手法を用いた複数のニューラルネットワーク層を積み重ねることで、局所的なウィンドウが重なり合い、ネットワークの深層で情報を共有するにつれて、モデルは入力データに対する全体的な理解を徐々に構築していくことができます。この基礎的な概念は、Google 研究によって広く支持されており、次のような最新のフレームワークで積極的に実装されています PyTorchなどで積極的に実装されています。

実際のアプリケーション

膨大なデータシーケンスを、計算メモリを使い果たすことなく処理できる能力は、さまざまなAI分野において高度な機能を実現します：

NLPにおける長文要約： 膨大な法的契約書、コードリポジトリ、あるいは財務報告書を分析する大規模言語モデル（LLM）において、スライディングウィンドウ・アテンションにより、モデルは数千のトークンを同時に読み取ることが可能になります。これにより、正確なテキスト要約に必要な文脈の一貫性を維持しつつ、メモリクラッシュを防ぐことができます。
高解像度画像処理タスク： コンピュータビジョン（CV）において、医療画像解析や衛星画像解析などで使用されるようなギガピクセル級の画像を処理すると、膨大なデータシーケンスが生成されます。モデルは、注目領域を特定することで、元の画像解像度を大幅に低下させることなく、詳細な画像セグメンテーションを実行し、微細な異常を検出することができます。

効率的なアーキテクチャの実装

高速な物体検出システムを開発する開発者にとって、高度に最適化されたアーキテクチャを活用することは不可欠です。生のアテンション機構も強力ですが、Ultralytics のようなエンドツーエンドモデルは、高度な特徴抽出とエッジデバイスの効率性を両立させることで、業界トップクラスの性能を発揮します。

from ultralytics import YOLO

# Load the recommended YOLO26 model for high-resolution vision tasks
model = YOLO("yolo26x.pt")

# Perform inference on a large image, utilizing optimized internal processing
results = model.predict(source="large_aerial_map.jpg", imgsz=1024, show=True)

# Output the number of detected instances
print(f"Detected {len(results[0].boxes)} objects in the high-resolution input.")

こうした高度なパイプラインを、ローカルでのプロトタイピングから企業の本番環境へとスケールアップするには、堅牢なインフラストラクチャが必要です。 Ultralytics 、このプロセスを完全に簡素化し、データセットの自動アノテーション、シームレスなクラウドトレーニング、およびリアルタイムのモデル監視を実現する直感的なインターフェースを提供します。これにより、チームは多様なハードウェア環境において、高効率で広範なコンテキストを扱うモデルのメリットをシームレスに活用できるようになります。

スライディング・ウィンドウ法

17以上の形式にエクスポート。世界43の地域にデプロイ。

H100 GPUでYOLO26を1時間あたり2.39ドルで学習。

ビジョンAIプロジェクトを推進する柔軟なエンタープライズライセンス

次のプロジェクトを推進するために構築されたエンタープライズライセンス

スマートアノテーションで最大10倍高速にラベル付け

アノテーション。トレーニング。デプロイ。 すべて1つのプラットフォームで。

実際のアプリケーション

関連用語の区別

効率的なアーキテクチャの実装

このカテゴリの関連記事

Ultralytics を使用したポリゴン注釈ガイド

ドイツで開催されるハノーバー・メッセ2026Ultralytics の主な見どころ

コンピュータビジョンプロジェクトTensorFlow PyTorch TensorFlow の選択

共にAIの未来を築きましょう！

スライディング・ウィンドウ法

17以上の形式にエクスポート。世界43の地域にデプロイ。

H100 GPUでYOLO26を1時間あたり2.39ドルで学習。

ビジョンAIプロジェクトを推進する柔軟なエンタープライズライセンス

次のプロジェクトを推進するために構築されたエンタープライズライセンス

スマートアノテーションで最大10倍高速にラベル付け

アノテーション。トレーニング。デプロイ。 すべて1つのプラットフォームで。

実際のアプリケーション

関連用語の区別

効率的なアーキテクチャの実装

このカテゴリの関連記事

Ultralytics を使用したポリゴン注釈ガイド

ドイツで開催されるハノーバー・メッセ2026Ultralytics の主な見どころ

コンピュータビジョンプロジェクトTensorFlow PyTorch TensorFlow の選択

共にAIの未来を築きましょう！

アノテーション。トレーニング。デプロイ。 すべて1つのプラットフォームで。