YOLO Vision 2025にご期待ください!
2025年9月25日
10:00 — 18:00(英国夏時間)
ハイブリッドイベント
Yolo Vision 2024
用語集

ベクトルデータベース

ベクトルデータベースが、効率的な類似性検索、セマンティック検索、およびインテリジェントシステムのための異常検出を可能にすることで、AIに革命をもたらす様子をご覧ください。

ベクトルデータベースは、ベクトル埋め込みとして知られる高次元データを保存、管理、および検索するために設計された特殊なタイプのデータベースです。構造化データと完全一致に最適化された従来のリレーショナルデータベースとは異なり、ベクトルデータベースは類似性に基づいてアイテムを見つけることに優れています。この機能は、レコメンデーションエンジンからビジュアル検索まで、幅広い最新のAIアプリケーションにとって不可欠であり、機械学習インフラストラクチャにおける重要なコンポーネントとなっています。これらはAIモデルの長期記憶として機能し、トレーニング中に学習した複雑なパターンを活用できるようにします。

ベクトルデータベースの仕組み

ベクトルデータベースの主な機能は、ベクトル検索を効率的に実行することです。そのプロセスは、画像、テキストブロック、オーディオクリップなどの非構造化データが深層学習モデルを通過し、ベクトル埋め込みと呼ばれる数値表現を生成するときに始まります。これらの埋め込みは、元のデータのセマンティックな意味を捉えます。

ベクトルデータベースは、これらの埋め込みを保存し、特殊なアルゴリズムを使用してインデックスを作成します。クエリが実行されると(例えば、画像で検索する場合)、クエリデータもベクトルに変換されます。次に、データベースは、コサイン類似度ユークリッド距離などの類似性指標を使用して、このクエリベクトルを保存されたベクトルと比較し、「最も近い」または最も類似したアイテムを見つけます。数百万または数十億のベクトルでこれを大規模に実行するために、多くの場合、非常に効率的な近似最近傍探索(ANN)アルゴリズムに依存します。

実際のアプリケーション

ベクターデータベースは、ユーザーが日常的に利用する多くのインテリジェントな機能を強化します。

  1. Eコマースにおけるビジュアル検索: ユーザーは気に入った製品の写真をアップロードできます。すると、コンピュータビジョンモデル(Ultralytics YOLO11モデルなど)がその画像の埋め込みを生成します。この埋め込みを使用して、eコマースサイトのベクトルデータベース(製品カタログ全体の埋め込みを含む)をクエリします。データベースは最も類似したベクトルを返し、サイトは視覚的に同一またはスタイル的に関連する製品を表示できます。これは小売業向けAIの重要な機能です。
  2. ドキュメントのセマンティック検索: 企業は、レポートやサポートチケットなど、すべての内部ドキュメントの埋め込みを作成できます。従業員は、特定のキーワードの代わりに、「前四半期の利益はいくらでしたか?」のような自然言語の質問を使用して検索できます。自然言語処理(NLP)モデルは、このクエリを埋め込みに変換し、ベクターデータベースは、埋め込みが意味的に最も近いドキュメントを見つけ、正確な言い回しが一致しなくても関連情報を提供します。これは、検索拡張生成(RAG)システムのコアコンポーネントです。

ベクターデータベース vs. 関連概念

ベクトルデータベースを密接に関連する用語と区別すると役立ちます。

  • 埋め込み: 埋め込みは、データのベクトル表現です。ベクトルデータベースは、これらの埋め込みを効率的に保存、インデックス作成、およびクエリするために構築された特殊なシステムです。埋め込みを本、ベクトルデータベースをそれらを整理するインテリジェントな図書館と考えてください。
  • ベクトル検索: ベクトル検索は、データセット内で最も類似したベクトルを見つけるプロセスです。ベクトルデータベースは、特にリアルタイム推論において、このプロセスを高速かつスケーラブルにする基盤となるテクノロジーです。

これらのコンポーネントは、完全なMLOpsワークフローの一部として管理され、多くの場合、エンドツーエンドのモデルおよびデータセット管理のためにUltralytics HUBのようなプラットフォームによって促進されます。

一般的なベクトルデータベース

スケーラビリティ、デプロイメント、機能に関してそれぞれ異なる強みを持つ、いくつかのオープンソースおよび商用ベクターデータベースが利用可能です。最も広く使用されているものには、以下が含まれます。

  • Pinecone: 人気のある、フルマネージドのベクトルデータベースサービス。
  • Milvus: 高性能とスケーラビリティのために設計されたオープンソースのベクトルデータベース。
  • Weaviate: グラフ機能を備えた、オープンソースのAIネイティブデータベース。
  • Chroma DB: シンプルさと開発者体験に焦点を当てたオープンソースの埋め込みデータベース。
  • Qdrant: パフォーマンスと安全性のためにRustで書かれた、オープンソースのベクトルデータベースおよび類似性検索エンジン。

Ultralyticsコミュニティに参加しませんか?

AIの未来を共に切り開きましょう。グローバルなイノベーターと繋がり、協力し、成長を。

今すぐ参加
クリップボードにコピーしました