Yolo 深圳
深セン
今すぐ参加
用語集

ベクトル検索

ベクトル検索が埋め込みを用いて類似データを見つける仕組みを探求しましょう。Ultralytics で高品質なベクトルを生成し、精密な情報検索を実現する方法を学びます。

ベクトル検索は、データセット内の類似項目を正確なキーワード一致ではなく数学的特性に基づいて特定する高度な情報検索手法である。従来のキーワード検索が特定の文字列の発見に依存するのとは異なり、ベクトル検索はデータの根底にある意味的意義を分析します。この技術は、コンピュータが抽象的な概念間の関係性を理解し、画像、音声ファイル、自然言語テキストなどの非構造化データを驚くべき精度で処理することを可能にするため、現代の人工知能(AI)アプリケーションの基盤となっています。

ベクター検索の仕組み

ベクトル検索の核心は、生データを埋め込みと呼ばれる高次元の数値ベクトルへ変換することにある。このプロセスは、概念的に類似したアイテムが互いに近接する多次元空間内の点へアイテムをマッピングする。

  1. ベクトル化深層学習(DL)モデルは入力データ(例:犬の画像)を処理し、特徴ベクトルを出力する。YOLO26のような高度なモデルは、こうした豊富な特徴表現を効率的に生成するためによく用いられる。
  2. 索引付け: 検索を高速化するため、これらのベクトルは特殊なアルゴリズムを用いて整理され、 多くの場合専用のベクトルデータベースに格納される。
  3. 類似度計算:ユーザーがクエリを送信すると、システムはそのクエリをベクトルに変換し、 コサイン類似度や ユークリッド距離などの指標を用いて、 保存されているベクトルとの距離を測定します。
  4. 検索: システムは「最近傍」を返します。これは文脈的に最も関連性の高い結果を表します。

Python 例:エンベッディングの生成

ベクトル検索を実装するには、まずデータをベクトルに変換する必要があります。以下のコードスニペットは生成方法を示しています 特徴マップ 画像からの埋め込み を使用して ultralytics パッケージと事前学習済みYOLO26モデル。

from ultralytics import YOLO

# Load a pre-trained YOLO26 classification model
model = YOLO("yolo26n-cls.pt")

# Generate feature embeddings for an image URL
# The 'embed' method returns the high-dimensional vector representation
results = model.embed("https://ultralytics.com/images/bus.jpg")

# Print the shape of the resulting embedding vector
print(f"Embedding vector shape: {results[0].shape}")

実際のアプリケーション

ベクトル検索は、今日のソフトウェアエコシステムにおける多くの直感的な機能を支えるエンジンであり、 コンピュータビジョン(CV)とユーザーの意図との間の隔たりを埋める役割を果たしている。

  • ビジュアル推薦システム小売業界におけるAI分野では、ベクトル検索が「ショップ・ザ・ルック」機能を支えています。顧客が特定のハンドバッグを気に入った場合、システムは形状、質感、スタイルが一致する類似のビジュアルベクトルを持つアイテムを見つけ出し、パーソナライズされた推薦システムを構築します。
  • 検索拡張生成(RAG)大規模言語モデル(LLM)を強化するため、開発者はベクトル検索を用いて知識ベースから関連文書を取得する。これによりAIに文脈が提供され、幻覚現象が減少するとともに、チャットボット対話の精度が向上する。
  • 異常検出:システムの「正常」な動作のベクトルをクラスタリングすることで、 クラスタから大きく外れた外れ値を特定できる。これは製造品質管理や データセキュリティにおける 異常検出に極めて重要である。

関連概念の区別

機械学習(ML)パイプライン全体を理解するには、ベクトル検索を類似の用語と区別することが有用である。

  • ベクトル検索と意味検索意味検索はユーザー意図(「何を」)を理解する広範な応用である。ベクトル検索は ベクトル近接(「どのように」)を計算することでこれを達成する特定のアルゴリズム的手法である
  • ベクトル検索とベクトルデータベースベクトルデータベースは、大規模な埋め込みを保存・管理するために設計された基盤です。ベクトル検索は、そのデータベースをクエリして情報を取得するプロセスです。
  • ベクトル検索と キーワード検索の比較:キーワード検索は完全一致する文字列を検索します(例:「apple」は「apple」に一致)。ベクトル検索は 意味を一致させるため、「apple」は「fruit」や「red」など、単語が異なっても一致する可能性があります。

Ultralytics プラットフォームとの統合

類似性検索システムを構築するチームにとって、 データセットの管理と埋め込みモデルのトレーニングは重要な第一歩です。 Ultralytics 、データ管理、クラウドトレーニング、モデルデプロイメントのためのツールを提供することで、 このワークフローを簡素化します。 物体検出や分類など、ベースモデルの高性能を保証することで、 結果として得られるベクトルが正確で意味のある検索結果を提供することを保証します。

Ultralytics コミュニティに参加する

AIの未来を共に切り開きましょう。グローバルなイノベーターと繋がり、協力し、成長を。

今すぐ参加