ベクトルデータベースが、効率的な類似性検索、セマンティック検索、およびインテリジェントシステムのための異常検出を可能にすることで、AIに革命をもたらす様子をご覧ください。
ベクトルデータベースは、ベクトル埋め込みとして知られる高次元データを保存、管理、および検索するために設計された特殊なタイプのデータベースです。構造化データと完全一致に最適化された従来のリレーショナルデータベースとは異なり、ベクトルデータベースは類似性に基づいてアイテムを見つけることに優れています。この機能は、レコメンデーションエンジンからビジュアル検索まで、幅広い最新のAIアプリケーションにとって不可欠であり、機械学習インフラストラクチャにおける重要なコンポーネントとなっています。これらはAIモデルの長期記憶として機能し、トレーニング中に学習した複雑なパターンを活用できるようにします。
ベクトルデータベースの主な機能は、ベクトル検索を効率的に実行することです。そのプロセスは、画像、テキストブロック、オーディオクリップなどの非構造化データが深層学習モデルを通過し、ベクトル埋め込みと呼ばれる数値表現を生成するときに始まります。これらの埋め込みは、元のデータのセマンティックな意味を捉えます。
ベクトルデータベースは、これらの埋め込みを保存し、特殊なアルゴリズムを使用してインデックスを作成します。クエリが実行されると(例えば、画像で検索する場合)、クエリデータもベクトルに変換されます。次に、データベースは、コサイン類似度やユークリッド距離などの類似性指標を使用して、このクエリベクトルを保存されたベクトルと比較し、「最も近い」または最も類似したアイテムを見つけます。数百万または数十億のベクトルでこれを大規模に実行するために、多くの場合、非常に効率的な近似最近傍探索(ANN)アルゴリズムに依存します。
ベクターデータベースは、ユーザーが日常的に利用する多くのインテリジェントな機能を強化します。
ベクトルデータベースを密接に関連する用語と区別すると役立ちます。
これらのコンポーネントは、完全なMLOpsワークフローの一部として管理され、多くの場合、エンドツーエンドのモデルおよびデータセット管理のためにUltralytics HUBのようなプラットフォームによって促進されます。
スケーラビリティ、デプロイメント、機能に関してそれぞれ異なる強みを持つ、いくつかのオープンソースおよび商用ベクターデータベースが利用可能です。最も広く使用されているものには、以下が含まれます。