用語集

ベクトル量子化

機械学習におけるデータ圧縮と離散化のためのベクトル量子化について解説します。VQ-VAE、ベクトル検索、Ultralytics のデプロイメントを最適化する仕組みについて学びましょう。

ベクトル量子化は、現代の機械学習（ML）やデジタル信号処理で広く用いられている、強力なデータ圧縮および離散化の手法です。その仕組みは、多数の連続した点やベクトルの集合をグループに分割し、各グループを単一の「プロトタイプ」ベクトルで表現することで、これらをまとめてコードブックと呼ばれる構造を形成するものです。連続した高次元ベクトルをこれらの離散的なコードブックのエントリにマッピングすることで、システムはメモリ使用量を大幅に削減しつつ、データの本質的な意味的特性を保持し、効果的な次元削減を実現することができます。

ディープラーニングにおける離散化の役割

現代のディープラーニング（DL）において、この概念はベクトル量子化変分オートエンコーダー（VQ-VAE）によって広く知られるようになりました。特徴抽出を行うために連続的な潜在空間を学習する標準的なオートエンコーダーとは異なり、VQ-VAEは離散的な表現を学習します。これにより、生成モデルは画像、音声、または動画を、大規模言語モデル（LLM）がテキスト入力を処理するのと同様に、離散的なトークンのシーケンスとして扱うことが可能になります。離散表現学習に関する基礎研究を調査することで、初期の実装が現代のトークンベースの視覚システムへの道筋をどのように切り開いたかを確認できます。

実際のアプリケーション

ベクトル量子化は、性能とメモリ効率が最優先される多くの実世界のAIアプリケーションにおいて、極めて重要な役割を果たしています：

生成AIとメディア圧縮：複雑な視覚データを離散的な潜在コードに圧縮することで、ベクトル量子化は極めて効率的な画像および動画生成を可能にします。連続的なピクセルを離散的なトークンにマッピングするモデルは、計算負荷を大幅に低減し、潜在拡散モデルのような高度なアーキテクチャの実現を支援します。
高速ベクトル検索: 高速な類似性検索を行うためには、最新のシステムは数百万もの埋め込みベクトルを検索する必要があります。ベクトル量子化はこれらの膨大なデータセットを圧縮し、検索エンジンが高速な近似最近傍（ANN）検索を実行できるようにします。これは、小売業界や商品レコメンデーションシステムにおける AIにとって非常に有益です。高次元データの取り扱いに関する詳細については、OpenAIの埋め込みに関するガイドをご参照ください。

基本的な実装例

ベクトル量子化が実際にどのように連続的な入力を離散的なトークンにマッピングするのかを確認するには、PyTorch を使用してユークリッド距離をPyTorch あらかじめ定義されたコードブックの中から最も近いプロトタイプを見つけることができます：

import torch

# Define a continuous input batch and a discrete codebook vocabulary
inputs = torch.randn(4, 128)  # 4 input vectors of dimension 128
codebook = torch.randn(10, 128)  # 10 discrete prototype vectors

# Compute distances and find the nearest codebook index for each input
distances = torch.cdist(inputs, codebook)
quantized_indices = torch.argmin(distances, dim=1)

# Retrieve the discrete quantized vectors corresponding to the inputs
quantized_vectors = codebook[quantized_indices]

tensor ネイティブ計算やこれらの演算の最適化について詳しく知りたい場合は、公式の PyTorch ドキュメントを参照してください。

Ultralytics によるワークフローの強化

最適化された埋め込み表現をパイプラインに組み込むには、堅牢なツールセットが必要です。 Ultralytics 、トレーニングデータのキュレーションや最先端のビジョンモデルのトレーニングを行うためのエンドツーエンドの環境を提供します。データ管理の効率化とモデル展開の簡素化により、開発者はベクトル量子化に適した高品質な視覚特徴量を容易に生成でき、その結果、物体検出や大規模なメディア検索アプリケーションの高速化につながります。

ベクトル量子化

17以上の形式にエクスポート。世界43の地域にデプロイ。

H100 GPUでYOLO26を1時間あたり2.39ドルで学習。

ビジョンAIプロジェクトを推進する柔軟なエンタープライズライセンス

次のプロジェクトを推進するために構築されたエンタープライズライセンス

スマートアノテーションで最大10倍高速にラベル付け

アノテーション。トレーニング。デプロイ。 すべて1つのプラットフォームで。

ディープラーニングにおける離散化の役割

実際のアプリケーション

関連概念の区別

基本的な実装例

Ultralytics によるワークフローの強化

このカテゴリの関連記事

Ultralytics を使用してUltralytics YOLO エクスポートする方法

Ultralytics を使用したパレットの不適切な積み重ねの検知

Ultralytics を使用したポリゴン注釈ガイド

共にAIの未来を築きましょう！

ベクトル量子化

17以上の形式にエクスポート。世界43の地域にデプロイ。

H100 GPUでYOLO26を1時間あたり2.39ドルで学習。

ビジョンAIプロジェクトを推進する柔軟なエンタープライズライセンス

次のプロジェクトを推進するために構築されたエンタープライズライセンス

スマートアノテーションで最大10倍高速にラベル付け

アノテーション。トレーニング。デプロイ。 すべて1つのプラットフォームで。

ディープラーニングにおける離散化の役割

実際のアプリケーション

関連概念の区別

基本的な実装例

Ultralytics によるワークフローの強化

このカテゴリの関連記事

Ultralytics を使用してUltralytics YOLO エクスポートする方法

Ultralytics を使用したパレットの不適切な積み重ねの検知

Ultralytics を使用したポリゴン注釈ガイド

共にAIの未来を築きましょう！

アノテーション。トレーニング。デプロイ。 すべて1つのプラットフォームで。