Yolo 深圳
深セン
今すぐ参加
用語集

ベクトルデータベース

ベクトルデータベースが、効率的な類似性検索、セマンティック検索、およびインテリジェントシステムのための異常検出を可能にすることで、AIに革命をもたらす様子をご覧ください。

A vector database is a specialized storage system designed to manage, index, and query high-dimensional vector data, often commonly referred to as embeddings. Unlike a traditional relational database, which organizes structured data into rows and columns for exact keyword matching, a vector database is optimized for semantic retrieval. It enables intelligent systems to find data points that are conceptually similar rather than identical. This capability is fundamental to modern artificial intelligence (AI) infrastructure, allowing applications to process and understand unstructured data—such as images, audio, video, and text—by analyzing the mathematical relationships between them. These databases serve as the long-term memory for intelligent agents, facilitating tasks like visual search and personalized recommendations.

ベクトルデータベースの仕組み

ベクトルデータベースの機能は、ベクトル空間の概念を中心に展開される。この空間では、データ項目が多次元座標系上の点としてマッピングされる。プロセスは特徴抽出から始まり、深層学習(DL)モデルが生データを入力として数値ベクトルに変換する。

  1. Ingestion: Data is processed by a neural network, such as the state-of-the-art YOLO26, to generate embeddings. These vectors compress the semantic meaning of the input into a dense list of floating-point numbers.
  2. インデックス作成:検索時の推論遅延を低減するため、データベースは特殊なアルゴリズムを用いてこれらのベクトルを整理します。階層的ナビゲーション可能なスモールワールド(HNSW) や逆ファイルインデックス(IVF)といった技術により、システムは数十億のベクトルを効率的に探索でき、すべてのエントリをスキャンする必要がありません。
  3. Querying: When a user submits a search query (e.g., an image of a specific shoe style), the system converts the query into a vector and calculates its proximity to stored vectors using distance metrics like cosine similarity or Euclidean distance.
  4. 検索:データベースは「最近傍」を返します。これは文脈的に最も関連性の高い結果を表します。

以下のPython は、標準的な手法を用いて埋め込みを生成する方法を示しています。 ultralytics モデル、 これはベクトルデータベースを構築する前に必要な前提ステップです。

from ultralytics import YOLO

# Load a pre-trained YOLO26 classification model
model = YOLO("yolo26n-cls.pt")

# Generate feature embeddings for an image file
# The 'embed' method creates the vector representation needed for the database
results = model.embed("https://ultralytics.com/images/bus.jpg")

# Output the shape of the resulting embedding vector
print(f"Embedding vector shape: {results[0].shape}")

実際のアプリケーション

ベクトルデータベースは、今日の企業環境で使用される多くの高度な コンピュータビジョン(CV)および 自然言語処理(NLP)アプリケーションを支える基盤技術である。

  • 検索拡張生成(RAG): 生成AIの時代において、ベクトルデータベースは大規模言語モデル(LLM)が膨大なプライベートで最新のデータライブラリにアクセスすることを可能にする。ユーザーの入力文の意味に基づいて関連文書を検索することで、システムはLLMの幻覚現象を低減し、事実に基づいた文脈認識型の応答を提供する。
  • ビジュアルレコメンデーションエンジン: 小売業界におけるAIでは、プラットフォームがベクトルデータベースを活用し「類似スタイルの商品を閲覧」機能を実現している。ユーザーが特定のサマードレスを閲覧すると、システムはデータベースに対し、類似したビジュアル埋め込み(パターン・カット・カラーが一致する)を持つ他の商品画像を照会する。これにより、単純なタグベースのフィルタリングよりも優れたユーザー体験を提供する。
  • 異常検知と脅威検知:セキュリティシステムは異常検知にベクトルデータベースを活用する。 「正常」な動作や許可された要員の埋め込み値を保存することで、システムはベクトル空間内の予想されるクラスター外に存在する外れ値を即座にフラグ付けでき、 データセキュリティと施設監視を強化する。

関連概念の区別

これらのシステムを効果的に実装するには、機械学習運用(MLOps)の領域において、ベクトルデータベースを関連技術と区別することが有用である。

  • ベクトルデータベース対ベクトル検索 ベクトル検索とは、類似するベクトルを見つける操作またはアルゴリズム的プロセス(「方法」)である。 ベクトルデータベースとは、データを保存し、インデックスを管理し、これらの検索を大規模に実行するために構築された堅牢なインフラストラクチャ(「場所」)である。
  • ベクトルデータベース対特徴ストア 特徴ストアは、モデルトレーニングと推論で使用される特徴を管理し一貫性を確保するための集中型リポジトリである。 特徴データを扱う一方で、ベクトルデータベースを定義する類似性ベースの検索クエリに対して主に最適化されているわけではない。
  • ベクトルデータベース対データレイク データレイクは、膨大な量の生データをネイティブ形式で保存します。 ベクトルデータベースは、そのデータの処理済み数学的表現(埋め込み)を保存し、 特に類似性検索向けに最適化されています。

最新のAIワークフローとの統合

Implementing a vector database often involves a pipeline where models like the efficient YOLO26 act as the embedding engine. These models process visual data at the edge or in the cloud, and the resulting vectors are pushed to solutions like Pinecone, Milvus, or Qdrant.

For teams looking to streamline this entire lifecycle—from data curation and auto-annotation to model training and deployment—the Ultralytics Platform offers a comprehensive environment. By integrating model training with efficient deployment strategies, developers can ensure that the embeddings feeding their vector databases are accurate, resulting in higher quality search results and smarter AI agents.

Ultralytics コミュニティに参加する

AIの未来を共に切り開きましょう。グローバルなイノベーターと繋がり、協力し、成長を。

今すぐ参加