Hybrid Search
ハイブリッド検索がキーワードマッチングとセマンティックAIをどのように統合するかを探索します。Ultralytics YOLO26のメタデータを使用して、コンテキストを認識する検索パイプラインを構築する方法を学びます。
従来のキーワード一致による精度と、最新のAIによる文脈理解を組み合わせたこの検索手法は、スパースなデータ表現と密なデータ表現の両方を活用することで情報を取得およびランク付けします。標準的な検索エンジンが完全に正確なキーワード一致(字句検索として知られる)に依存し、ベクトル検索エンジンが純粋に意味的類似性に依存するのに対し、ハイブリッド検索エンジンはこれら2つのアプローチを統合することで、非常に正確で文脈を意識した結果を提供します。
仕組み
一般的なハイブリッド検索パイプラインは、2つの異なる検索手法を同時に実行し、その出力を単一の最適化されたランキングに統合します。
- 字句(スパース)検索: BM25のようなアルゴリズムを使用して、用語の頻度に基づき正確なキーワード一致をスコアリングします。これは、純粋な意味論的モデルでは特定が困難な特定のエンティティ、頭字語、製品SKU、あるいは専門用語を取得するために極めて重要です。
- 意味論的(密な)検索: AIモデルを使用して高次元の数値配列を生成し、クエリのより深い意味と文脈を理解します。これにより、検索クエリに正確な単語が含まれていない場合でも、システムは関連する結果を見つけることができます。
両方の手法が候補結果を取得すると、融合アルゴリズム(最も一般的なのはReciprocal Rank Fusion (RRF))がリストを結合します。RRFは、それぞれのスパースおよび密な結果セットにおける各アイテムのランクに基づいて新しいスコアを計算します。これにより、いずれか一方または両方の検索で高くランク付けされたドキュメントが確実に上位に表示され、幅広い文脈の一致とピンポイントのキーワード精度のバランスが保たれます。
実世界におけるAIおよびMLの応用
現代のAIアーキテクチャは、本番環境において単一の検索手法を使用することの限界を克服するために、この技術に大きく依存しています。
- ハイブリッドRAG(検索拡張生成): エンタープライズ知識システムにおいて、大規模言語モデル(LLM)に最も関連性の高い文脈を提供することは、ハルシネーションを防ぐために不可欠です。ハイブリッドRAG構成により、モデルは正確な技術的制約に一致するドキュメントを取得しつつ、意味的に関連する段落も取り込むことができます。
- Eコマースおよび視覚的商品発見: 小売業者はハイブリッド検索を使用して製品カタログを強化しています。ユーザーが「赤いランニングシューズ」と検索した場合、字句検索エンジンは正確なブランドやカテゴリのキーワードを一致させ、一方でビジョンAIモデルは画像埋め込みを使用して視覚的に類似したアイテムを提示します。
Today, almost every major vector database—including Pinecone, Qdrant, OpenSearch, and PostgreSQL via pgvector—supports hybrid search natively. This allows developers to index both sparse keywords and dense vectors efficiently in a single infrastructure.
ハイブリッド検索のためのメタデータの生成
コンピュータビジョンパイプラインでは、画像から意味のあるキーワードを抽出して、ハイブリッドインデックスのスパースなコンポーネントを構築できます。Ultralytics YOLO26を使用すると、画像に対して自動的に物体検出を実行し、それらのクラス名をメタデータタグとして使用できます。これらのキーワードタグを画像の密なベクトル埋め込みと組み合わせることで、包括的なインデックス作成が可能になります。
from ultralytics import YOLO
# Load the recommended Ultralytics YOLO26 object detection model
model = YOLO("yolo26n.pt")
# Run inference to detect objects in an image
results = model("store_aisle.jpg")
# Extract predicted class names to be indexed as keyword metadata (sparse data)
keywords = [model.names[int(box.cls)] for box in results[0].boxes]
print("Sparse keywords for lexical search:", keywords)密な画像埋め込みを、AIが生成した正確なスパースキーワードで補強することで、開発者はUltralytics Platformとハイブリッド互換のベクトルデータベースを活用し、明示的なテキストタグと暗黙的な視覚的文脈の両方を完璧に理解する堅牢なマルチモーダル検索エンジンを構築できます。






