Yolo 深圳
深セン
今すぐ参加
用語集

ベクトル検索

ベクター検索が、NLP、ビジュアル検索、レコメンデーションシステムなどのデータ検索において、セマンティック類似性を可能にすることで、AIにどのような革命をもたらすかを発見してください。

ベクトル検索は、キーワードの完全一致ではなく、数学的な特徴に基づいてデータセット内の類似項目を識別する高度な情報検索技術である。 キーワードの完全一致ではなく、その数学的特徴に基づいてデータセット内の類似項目を特定する高度な情報検索手法である。テキスト、画像、音声などのデータを として知られる高次元数値ベクトルとしてデータを表現することで として表現することで、この手法によってコンピュータは クエリの背後にある文脈や意味的な意味を理解することができる。従来の ベクトル検索は、特定の単語のマッチングに依存する従来のキーワード検索とは異なり、近接度を計算する、 ベクトル検索は、多次元空間における項目間の近さを計算するため、言い回しが異なっていても、関連性のある結果を返すことができる。 の結果を返すことができる。この機能は、現代の 人工知能(AI)と 機械学習(ML)システム、特に 特にビデオフィードや自然言語のような非構造化データを扱う場合 自然言語のような非構造化データを扱う際には特に重要である。

ベクター検索の仕組み

ベクトル検索の核となるメカニズムは、生データを検索可能な数値フォーマットに変換することである。このプロセスは このプロセスは、ディープラーニング・モデルに依存している。 特徴抽出を行い、入力を ベクトル埋め込みに変換する。

  1. ベクトル化:MLモデル、例えば最先端の YOLO11のようなMLモデルは、画像やテキストを処理し、ベクトルを出力する。 ベクトル:最先端のYOLO11のようなMLモデルは、画像やテキストを処理し、アイテムの特徴(例えば、形状、色、または意味概念)を表す数値の長いリストを出力する。
  2. インデックス作成:これらのベクターは、多くの場合、専用のベクターデータベース内で効率的に整理されます。 ベクターデータベース内に効率的に整理され,迅速な検索を可能にする。
  3. 類似度計算:ユーザーがクエリを送信すると、システムはクエリをベクトルに変換する。 に変換し、コサイン類似度や コサイン類似度 ユークリッド距離
  4. 検索:システムは「最近傍」、つまりクエリに数学的に最も近いベクトルを特定し、返す。 クエリに数学的に最も近いベクトルを特定し返します。 近似最近傍(ANN) アルゴリズムを利用する。

実際のアプリケーション

ベクトル検索は、ユーザーが日常的に利用するインテリジェントな機能の多くを駆動しており、以下のような様々な業界に及んでいる。 様々な業界で利用されています。

  • 小売業における視覚的発見:で 小売業におけるAIでは、ベクトル検索が「ショップ・ザ・ルック」機能を強化する。 ルック」機能を提供する。ユーザーがスニーカーの写真をアップロードすると、システムはコンピュータ・ビジョンを使って コンピュータ・ビジョンを使って埋め込みを生成し 視覚的に類似した商品をカタログから探し出す。 商品名ではなくスタイルに基づいた として機能する。
  • コンテンツモデレーションとセキュリティ:プラットフォームはベクトル検索を 新しいアップロードを既知の を不正コンテンツやセキュリティ脅威の既知のデータベースと比較することで異常検知を行う。画像やビデオフレームの意味的特徴を照合することで の意味的特徴を照合することで、たとえわずかに改変されていたとしても、潜在的に有害なコンテンツにフラグを立てることができる。 データ・セキュリティを強化する。

Python 例:エンベッディングの生成

ベクトル検索パイプラインの最初のステップは、埋め込みを生成することです。次のコードは を使って画像から特徴ベクトルを生成する方法を示します。 Ultralytics Pythonパッケージと事前に訓練されたモデルを使用して、画像から特徴ベクトルを生成する方法を示します。

from ultralytics import YOLO

# Load the official YOLO11 model
model = YOLO("yolo11n.pt")

# Generate embeddings for an image file or URL
# The 'embed' method returns the high-dimensional feature vector
results = model.embed("https://ultralytics.com/images/bus.jpg")

# Print the shape of the resulting embedding vector
print(f"Embedding vector shape: {results[0].shape}")

ベクター検索 vs. 関連概念

これらのシステムを効果的に実装するためには、ベクトル検索をデータサイエンスの世界で密接に関連する用語と区別することが役に立つ。 区別する必要がある。

  • ベクトル検索とセマンティック検索:セマンティック検索とは、ユーザーの意図や意味を理解する、より広い概念である。ベクトル検索は ベクトルの数学的な近さを計算することによって、これを達成するために使用される方法です。セマンティック検索 が "何を"(意味を見つけること)説明するのに対して、ベクトル検索は "どのように"(埋め込みと距離メトリックを使って 距離メトリクスを使用)。
  • ベクター検索とベクターデータベースの比較:ベクトルデータベースは、埋め込みデータを保存し、インデックスを作成するために使用される特別なインフラストラクチャです。ベクトル検索とは 類似したアイテムを見つけるために、そのデータベースに問い合わせるアクションまたはプロセスです。ベクトル検索を効率的に行うために ベクトル検索を効率的に実行します。
  • ベクトル検索 vs. 自然言語処理 自然言語処理(NLP):NLPは、コンピュータと人間の言語との相互作用に焦点を当てています。NLPモデル(Transformersのような)は、テキストの埋め込みを作成するために使われることが多い。 NLPモデル(Transformerなど)はテキストの埋め込みを作成するために使われることが多いが、ベクトル検索はその埋め込みに作用する検索メカニズムである。 埋め込みに作用する検索メカニズムである。

リアルタイム推論のスピードと リアルタイム推論とディープラーニングによる特徴抽出の ベクトル検索によって、アプリケーションは硬直したデータベースを超え、直感的で人間のような発見体験を提供することができる、 人間のような発見体験を提供します。以下のような実装が可能です。 インベントリのためのオブジェクト検出を実装する場合でも ベクター検索は、現代のAI開発者の基礎となるツールです。 現代のAI開発者のツールキットの基礎となるツールです。

Ultralytics コミュニティに参加する

AIの未来を共に切り開きましょう。グローバルなイノベーターと繋がり、協力し、成長を。

今すぐ参加