ベクトルデータベースが、効率的な類似性検索、セマンティック検索、およびインテリジェントシステムのための異常検出を可能にすることで、AIに革命をもたらす様子をご覧ください。
ベクトル・データベースは、高次元のベクトル・データを管理、索引付け、照会するために設計された特殊なストレージ・システムである、 エンベッディングと呼ばれることもある。従来の ベクトルデータベースは、行と列に構造化されたデータを格納し、キーワードを正確にマッチングさせる従来のリレーショナルデータベースとは異なり、意味的な類似性に基づいて項目を検索するために最適化されている。 意味的な類似性に基づいて項目を見つけるために最適化されている。この機能により 人工知能(AI) システムは、画像、音声、テキストなどの非構造化データを、それらの間の文脈的関係を理解することによって処理することができる。 これらの間の文脈的関係を理解することによって、システムは画像、音声、テキストなどの非構造化データを処理することができる。これらは基本的に 機械学習アプリケーション 同一ではなく概念的に関連する情報を効率的に検索することができる。
ベクトル・データベースの核となる機能は、生のデータを特徴抽出というプロセスを通じて数学的なベクトルに変換することにある。 特徴抽出A ディープラーニングモデル ヴィジョン・トランスフォーマー(ViT)や Convolutional Neural Network (CNN)などのディープラーニングモデルがデータを分析し、ベクトル(データの特徴を表す数値の長いリスト)を出力する。
これらのベクトルが生成されると、データベースは次のような特殊なアルゴリズムを使ってインデックスを作成する。 近似最近傍(ANN)。ユーザーがクエリを実行すると、システムは検索語(画像またはテキスト)をベクトルに変換し、次のような距離メトリックを使用して、保存されているベクトルとの近接性を計算します。 のような距離メトリクスを使用して、保存されているベクトルとの近さを計算します。 コサイン類似度 ユークリッド距離のようなこれにより、データベースは は、最も関連性の高い結果を表す「最も近い」隣人を特定します。
以下のコード・スニペットは、YOLO11モデルを使って埋め込みデータを生成する方法を示している。 これはYOLO11 ・データベースにデータを格納する前の最初のステップです。 ベクトル・データベースにデータを格納する前の最初のステップです。
from ultralytics import YOLO
# Load a pre-trained YOLO11 classification model
model = YOLO("yolo11n-cls.pt")
# Generate feature embeddings for an image file
# This converts the visual content into a numerical vector
results = model.embed("bus.jpg")
# Output the shape of the resulting embedding vector
print(f"Embedding vector shape: {results[0].shape}")
ベクターデータベースは、商用および企業向けソフトウェアの多くのインテリジェント機能を支えるエンジンである。
エコシステムを理解するためには、ベクター・データベースを関連用語と区別することが役に立つ:
市場には、オープンソースのツールからマネージドサービスまで、ベクターストレージを実装するための堅牢なオプションがいくつかあります。 サービスがある:
これらのツールを MLOpsワークフローに統合することで、開発者は以下のことが可能になります。 データ・コンテンツを真に「理解」するシステムを構築し、セマンティック検索や異常検知、パーソナライズされたコンテンツ配信などの高度な機能を実現できる、 異常検知、パーソナライズされたコンテンツ配信などの高度な機能を実現します。


