ベクトルデータベースが、効率的な類似検索、意味検索、インテリジェントシステムの異常検知を可能にすることで、AIにどのような革命をもたらすかをご覧ください。
ベクトルデータベースは、ベクトル埋め込みとして知られる高次元データを保存、管理、検索するために設計された特殊なデータベースである。構造化データや完全一致に最適化された従来のリレーショナル・データベースとは異なり、ベクトル・データベースは類似性に基づいてアイテムを見つけることに優れている。この機能は、レコメンデーション・エンジンからビジュアル検索に至るまで、最新のAIアプリケーションの基礎となっており、機械学習インフラにおける重要なコンポーネントとなっている。ベクトル・データベースはAIモデルの長期記憶として機能し、トレーニング中に学習した複雑なパターンを活用できるようにする。
ベクトルデータベースの中核機能は、ベクトル検索を効率的に実行することだ。このプロセスは、画像、テキストブロック、オーディオクリップなどの非構造化データが、ディープラーニングモデルに通され、ベクトル埋め込みと呼ばれる数値表現が作成されるところから始まる。これらの埋め込みは、元のデータの意味的な意味を捉える。
ベクトル・データベースは、これらの埋め込みデータを保存し、専用のアルゴリズムを使ってインデックスを作成する。クエリー(画像検索など)が行われると、クエリーデータもベクトルに変換される。次にデータベースは、コサイン類似度や ユークリッド距離のような類似度メトリクスを使用して、このクエリベクトルと保存されたベクトルを比較し、「最も近い」または最も類似したアイテムを見つけます。数百万、数十億のベクトルを用いてこれを大規模に実行するには、多くの場合、非常に効率的な近似最近傍(ANN)アルゴリズムに依存する。
ベクターデータベースは、ユーザーが日常的に使用する多くのインテリジェントな機能を提供します。
ベクトル・データベースは、密接に関連する用語と区別するのに役立つ:
これらのコンポーネントは、完全なMLOpsワークフローの一部として管理され、多くの場合、Ultralytics HUBのようなエンドツーエンドのモデルとデータセット管理のためのプラットフォームによって促進される。
オープンソースおよび商用のベクターデータベースがいくつか利用可能で、それぞれスケーラビリティ、デプロイメント、機能に関して異なる強みを持つ。最も広く使われているものには、次のようなものがあります: