用語集

リランカー

リランカーによる検索精度の向上!最適な関連性とユーザー満足度を得るために、高度なモデルがどのように最初の検索結果を絞り込むかをご覧ください。

Ultralytics HUB で
を使ってYOLO モデルをシンプルにトレーニングする。

さらに詳しく

リランカーは、機械学習(ML)システム、特に情報検索(IR)、検索エンジン、推薦システムなどの分野で使われるコンポーネントである。リランカーの主な機能は、最初の候補アイテムのリストの関連性順序を改善することである。高速な初期検索手法によって生成されたランク付けされたリストを、より洗練された計算集約的なモデルを使って上位のアイテムに並べ替えるのだ。これにより、最終的なランキングの精度が向上し、全体的なユーザー満足度が高まります。

リランカーの仕組み

リランカーを使用する基本的な理由は、速度と精度のバランスにある。キーワードに基づく検索や、埋め込みの 近似最近傍(ANN)検索などの初期検索システムは、潜在的に巨大なデータセット(ウェブ文書、製品カタログ、画像データベースなど)を素早くスキャンして、関連する可能性のある項目を特定しなければならない。このような第一段階のシステムは、スピードと高い再現性を優先する。つまり、たとえ関連性の低い項目が含まれていたとしても、関連する可能性のあるすべての項目を検索することを目指す。これらのシステムは、最終的に必要とされるよりも多くの候補を返すことが多い。

次にリランカーは、これらの上位候補のより小さなサブセット(例えば、最初の検索で得られた上位100件)を取り出し、より強力で計算負荷の高いモデルを適用する。このモデルは、ユーザーのクエリと各候補アイテムの関係をより深く分析することができる。一般的な手法では、Transformerのような複雑なディープラーニング(DL)モデル、特にクロスエンコーダと呼ばれる変種を使用する。クロスエンコーダは、クエリと候補アイテムを一緒に評価することで、文脈的な関連性を豊富に理解することができ、クエリとアイテムの埋め込みを別々に評価する最初の検索段階よりも優れていることが多い。リランカーは、各候補の関連性スコアを新たに精製して出力し、システムが最も関連性の高いアイテムを最初に提示することを可能にすることで、最終的な検索結果の精度を向上させる。

再ランクインと初回検索

リランカーを最初の検索やランキングの段階から区別することは極めて重要である:

  • 初回回収(ファーストステージ):
    • 目標:大規模なコーパスから関連する可能性のある候補の幅広いセットを素早く見つける。スピードと再現性を優先。
    • 手法:多くの場合、転置インデックス(Apache LuceneElasticsearch)、埋め込みに対するANN検索、またはより単純なスコアリング関数のようなテクニックを使用する。
    • 複雑さ:1項目あたりの計算量が少なく、数十億項目までスケーラブル。
  • 再ランキング(セカンドステージ):
    • 目標:第1ステージで提供された、より少ない上位候補セットを正確に並べ替える。精度と関連性を優先する。
    • 方法: BERT ベースのクロスエンコーダトランスフォーマー、または他の洗練された特徴相互作用のような、より複雑なモデルを使用する。手法には、最適なパフォーマンスを得るためのハイパーパラメータのチューニングが含まれることが多い。
    • 複雑さ:1項目あたりの計算コストは高いが、限られた数の候補(上位50~200位など)にのみ適用される。

応用と実例

リランカーは、最新のAIアプリケーションの多くに不可欠である:

  • ウェブ検索エンジン以下のような企業 GoogleMicrosoft Bingのような企業は、単純なキーワードのマッチングを超えたニュアンスの要素を考慮し、ユーザーに提示される検索結果の上位を絞り込む上で、リランカーが重要な役割を果たす多段階のランキングシステムを採用している。これは情報検索研究の核心部分である。
  • Eコマース・プラットフォーム: アマゾンのようなサイトでは、リランカーを使って商品の推奨や検索結果を絞り込み、ユーザーの行動や商品の特徴の複雑なパターンに基づいて、ユーザーが購入する可能性の高い商品を表示している。このことは、Amazon Scienceなどのリサーチで詳しく説明されている。
  • 検索補強型生成(RAG): 大規模言語モデル(LLM)を使用するシステムでは、RAGはまずコンテキストを提供するために関連文書を検索する。その後、リランカーが検索された文書を絞り込み、最も関連性の高いコンテキストが LLM に渡されるようにすることで、より正確で情報に基づいた応答が生成されます。Cohere Rerank APIのようなサービスは、この目的のために特別に設計されています。
  • コンピュータビジョンの後処理:伝統的に「リランカー」とは呼ばれませんが、以下のような物体検出モデルで使用される非最大抑制(NMS)のようなテクニックもあります。 Ultralytics YOLOのような物体検出モデルで使用される非最大抑制(NMS)のような技術は、同様の哲学を共有しています。NMSは、信頼度スコアとオーバーラップ(IoU)に基づいて、予測されたバウンディングボックスの初期セットを精製し、最も可能性の高い検出を維持し、冗長なものを抑制します。このようなモデルのトレーニングのヒントや 性能ベンチマークを調べることができます。このようなモデルのトレーニングには、データセットと実験を管理するためのUltralytics HUBのようなプラットフォームがよく利用されます。
すべて読む