YOLO Vision Shenzhen
深セン
今すぐ参加
用語集

ベクトル検索

ベクトル検索が埋め込みを使用して類似データを見つける方法を探ります。正確な情報検索のために、Ultralytics YOLO26で高品質なベクトルを生成する方法を学びましょう。

ベクトル検索は、厳密なキーワード一致ではなく、数学的特性に基づいてデータセット内の類似アイテムを特定する洗練された情報検索手法です。特定の文字列を見つけることに依存する従来のキーワード検索とは異なり、ベクトル検索はデータの根底にある意味的意味を分析します。この技術は、コンピュータが抽象的な概念間の関係を理解し、画像、音声ファイル、自然言語テキストなどの非構造化データを驚くべき精度で処理することを可能にするため、現代の人工知能 (AI)アプリケーションにとって不可欠です。

ベクター検索の仕組み

ベクトル検索の核は、生データをエンベディングとして知られる高次元の数値ベクトルに変換することを含みます。このプロセスは、概念的に類似した項目が互いに近くに配置される多次元空間内の点に項目をマッピングします。

  1. ベクトル化: ディープラーニング (DL)モデルは、入力データ(例えば犬の画像)を処理し、特徴ベクトルを出力します。YOLO26のような高度なモデルは、これらの豊富な特徴表現を効率的に生成するためによく使用されます。
  2. インデックス作成: 検索を迅速に実行するために、これらのベクトルは特殊なアルゴリズムを使用して整理され、多くの場合、専用のベクトルデータベースに保存されます。
  3. 類似度計算: ユーザーがクエリを送信すると、システムはそのクエリをベクトルに変換し、コサイン類似度ユークリッド距離などのメトリクスを使用して、保存されているベクトルとの距離を測定します。
  4. 検索: システムは「最近傍(nearest neighbors)」を返し、これは最も文脈的に関連性の高い結果を表します。

Python 例:エンベッディングの生成

ベクトル検索を実装するには、まずデータをベクトルに変換する必要があります。以下のコードスニペットは、生成方法を示しています。 特徴マップ 画像からの埋め込みを、これを使用して ultralytics パッケージと事前学習済みのYOLO26モデル。

from ultralytics import YOLO

# Load a pre-trained YOLO26 classification model
model = YOLO("yolo26n-cls.pt")

# Generate feature embeddings for an image URL
# The 'embed' method returns the high-dimensional vector representation
results = model.embed("https://ultralytics.com/images/bus.jpg")

# Print the shape of the resulting embedding vector
print(f"Embedding vector shape: {results[0].shape}")

実際のアプリケーション

ベクトル検索は、今日のソフトウェアエコシステムにおける多くの直感的な機能の原動力であり、コンピュータビジョン (CV)とユーザーの意図の間のギャップを埋めます。

  • 視覚レコメンデーションシステム: 小売業におけるAIの分野では、ベクトル検索が「ショップ・ザ・ルック」機能の原動力となっています。顧客が特定のハンドバッグを気に入った場合、システムは形状、質感、スタイルが一致する視覚ベクトルが類似するアイテムを見つけ、パーソナライズされたレコメンデーションシステムを作成します。
  • 検索拡張生成 (RAG): 大規模言語モデル (LLM)を強化するために、開発者はベクトル検索を使用して知識ベースから関連ドキュメントを検索します。これによりAIにコンテキストが提供され、ハルシネーションが減少し、チャットボットのインタラクションにおける精度が向上します。
  • 異常検知: 「正常な」操作のベクトルをクラスタリングすることで、システムはクラスターから大きく逸脱する外れ値を特定できます。これは、製造品質管理における異常検知データセキュリティにとって極めて重要です。

関連概念の区別

ベクトル検索を類似の用語と区別することは、機械学習(ML)パイプライン全体を理解する上で役立ちます。

  • ベクトル検索 vs. セマンティック検索: セマンティック検索は、ユーザーの意図(「何を」)を理解するためのより広範なアプリケーションです。ベクトル検索は、ベクトル近接度を計算することによってこれを実現するための特定のアルゴリズム的手法(「どのように」)です。
  • ベクトル検索 vs. ベクトルデータベース: ベクトルデータベースは、大規模な埋め込みを保存および管理するために設計されたインフラストラクチャです。ベクトル検索は、そのデータベースをクエリして情報を取得するプロセスです。
  • ベクトル検索 vs. キーワード検索: キーワード検索は正確なテキスト文字列(例:「apple」は「apple」に一致)に一致します。ベクトル検索は意味に一致するため、「apple」は単語が異なっていても「fruit」や「red」に一致する可能性があります。

Ultralytics Platformとの統合

類似性検索システムを構築するチームにとって、データセットの管理と埋め込みモデルのトレーニングは重要な第一歩です。Ultralytics Platformは、データ管理、クラウドトレーニング、モデルデプロイのためのツールを提供することで、このワークフローを簡素化します。オブジェクトdetectまたは分類のいずれであっても、ベースモデルが高性能であることを保証することで、結果として得られるベクトルが正確で意味のある検索結果を提供することを保証します。

共にAIの未来を築きましょう!

未来の機械学習で、新たな一歩を踏み出しましょう。