用語集

ベクトル・データベース

ベクトルデータベースが、効率的な類似検索、意味検索、インテリジェントシステムの異常検知を可能にすることで、AIにどのような革命をもたらすかをご覧ください。

ベクトルデータベースは、ベクトル埋め込みとして知られる高次元データを保存、管理、検索するために設計された特殊なデータベースである。構造化データや完全一致に最適化された従来のリレーショナル・データベースとは異なり、ベクトル・データベースは類似性に基づいてアイテムを見つけることに優れている。この機能は、レコメンデーション・エンジンからビジュアル検索に至るまで、最新のAIアプリケーションの基礎となっており、機械学習インフラにおける重要なコンポーネントとなっている。ベクトル・データベースはAIモデルの長期記憶として機能し、トレーニング中に学習した複雑なパターンを活用できるようにする。

ベクター・データベースの仕組み

ベクトルデータベースの中核機能は、ベクトル検索を効率的に実行することだ。このプロセスは、画像、テキストブロック、オーディオクリップなどの非構造化データが、ディープラーニングモデルに通され、ベクトル埋め込みと呼ばれる数値表現が作成されるところから始まる。これらの埋め込みは、元のデータの意味的な意味を捉える。

ベクトル・データベースは、これらの埋め込みデータを保存し、専用のアルゴリズムを使ってインデックスを作成する。クエリー(画像検索など)が行われると、クエリーデータもベクトルに変換される。次にデータベースは、コサイン類似度や ユークリッド距離のような類似度メトリクスを使用して、このクエリベクトルと保存されたベクトルを比較し、「最も近い」または最も類似したアイテムを見つけます。数百万、数十億のベクトルを用いてこれを大規模に実行するには、多くの場合、非常に効率的な近似最近傍(ANN)アルゴリズムに依存する。

実世界での応用

ベクターデータベースは、ユーザーが日常的に使用する多くのインテリジェントな機能を提供します。

  1. Eコマースにおけるビジュアル検索:ユーザーは気に入った商品の写真をアップロードすることができる。UltralyticsのYOLO11モデルのようなコンピュータビジョンモデルが、画像の埋め込みを生成する。この埋め込みは、Eコマースサイトのベクトルデータベースに問い合わせるために使用される。このデータベースは、最も類似したベクトルを返すので、サイトは視覚的に同一またはスタイル的に関連する商品を表示できる。
  2. 文書の意味検索:企業は、報告書やサポートチケットのようなすべての内部文書の埋め込みを作成することができます。従業員は、特定のキーワードの代わりに、「前四半期の利益はいくらでしたか」というような自然言語の質問を使って検索することができます。自然言語処理(NLP)モデルは、このクエリをエンベッディングに変換し、ベクトル・データベースは、エンベッディングが意味的に最も近いドキュメントを見つけ、たとえ正確な言い回しが一致しなくても、関連する情報を提供する。これは、検索支援生成(RAG)システムの中核をなす要素である。

ベクトル・データベースと関連概念

ベクトル・データベースは、密接に関連する用語と区別するのに役立つ:

  • 埋め込み:エンベッディングはデータのベクトル表現である。ベクトル・データベースは、これらのエンベッディングを効率的に格納し、インデックスを付け、問い合わせるために構築された特別なシステムです。エンベッディングは書籍であり、ベクトルデータベースはそれらを整理するインテリジェントなライブラリであると考えてください。
  • ベクトル検索:ベクトル検索とは、データセットから最も類似したベクトルを見つけるプロセスである。ベクトル・データベースは、このプロセスを高速かつスケーラブルにする基盤技術であり、特にリアルタイムの推論に適している。

これらのコンポーネントは、完全なMLOpsワークフローの一部として管理され、多くの場合、Ultralytics HUBのようなエンドツーエンドのモデルとデータセット管理のためのプラットフォームによって促進される。

人気のベクターデータベース

オープンソースおよび商用のベクターデータベースがいくつか利用可能で、それぞれスケーラビリティ、デプロイメント、機能に関して異なる強みを持つ。最も広く使われているものには、次のようなものがあります:

  • 松ぼっくり:人気のフルマネージドベクターデータベースサービス。
  • Milvus: 高いパフォーマンスとスケーラビリティのために設計されたオープンソースのベクトルデータベース。
  • Weaviate:グラフ機能を備えたオープンソースのAIネイティブデータベース。
  • Chroma DB: シンプルさと開発者の使いやすさを重視したオープンソースのエンベッディングデータベース。
  • Qdrant:パフォーマンスと安全性のためにRustで書かれたオープンソースのベクトルデータベースと類似検索エンジン。

Ultralyticsコミュニティに参加する

AIの未来に参加しませんか。世界のイノベーターとつながり、協力し、成長する

今すぐ参加する
クリップボードにコピーされたリンク