术语表

Reranker

利用重新anker 提高搜索准确性!了解先进的模型如何完善初始结果,以获得最佳相关性和用户满意度。

重选器是多级信息系统中使用的一种复杂模型,用于完善和改进初始候选名单的排序。可以将其视为质量控制专家。被称为检索器的初级系统会快速收集大量潜在的相关项目,而检索器则会对这一较小的、预先过滤过的项目集进行更详细的计算密集型分析。其目标是对这些条目进行重新排序,将最相关的条目放在最前面,从而提高最终输出的精确度和实用性。通过这两步流程,系统可以在速度和准确性之间取得平衡,从而高效地提供高质量的结果。

Rerankers 如何工作

重新排名通常涉及现代搜索和推荐系统中常见的两阶段架构:

  1. 第一阶段检索:快速但不太精确的模型(检索器)会扫描庞大的数据库或索引,以快速找到大量候选项。对于搜索引擎来说,这可能涉及查找包含特定关键词的所有文档。在计算机视觉中,这可能是一个初始模型,为物体生成无数潜在的边界框。这里的首要任务是高召回率--确保不遗漏任何相关项目。
  2. 第二阶段重新排名:然后将初始候选集(如前 100 个搜索结果)传递给重新排序器。这通常是一个更复杂、更强大的模型,如基于 Transformer 的神经网络。重检索器会更详细地检查候选结果,考虑微妙的上下文、语义关系以及第一阶段检索器为追求速度而忽略的复杂特征。然后,它会为每个条目计算出新的、更精确的相关性得分,并相应地对列表重新排序。这种对精确性的关注确保了最高质量的结果。

这种方法的计算效率很高,因为昂贵的重排模型只处理全部数据中的一小部分,而这些数据已经被速度更快的检索器过滤过了。

重新排名者与第一阶段检索者

重要的是要区分重试者和第一阶段检索者。

  • 第一阶段寻回犬:优化速度和召回能力。它的任务是快速筛选海量数据,并创建一个广泛、包容的候选列表。它使用较简单的评分方法,如关键词匹配或基本嵌入
  • Reranker:针对精确性和相关性进行了优化。它从检索器中获取可管理的列表,并应用深入的上下文感知分析来生成最终的高精度排名。它的运行速度较慢,资源密集度较高,但数据集要小得多。

从本质上讲,寻回者撒下一张大网,而寻回者则仔细检查捕获的鱼,以找到获奖的鱼。

应用与实例

在许多先进的人工智能应用中,重新排名器都是一个关键组件:

  • 网络搜索引擎: 谷歌微软必应等公司使用多阶段排名系统,其中重链器发挥着至关重要的作用。在初始检索获取数千个网页后,复杂的重排序器会分析用户意图、内容质量和来源权威性等因素,以呈现最相关的结果。这是现代信息检索研究的核心部分。
  • 电子商务平台:亚马逊这样的网站会使用 reranker 来完善产品搜索结果和推荐。最初的搜索可能会显示所有的 "跑步鞋",但reeranker 会分析用户评论、购买历史和品牌受欢迎程度,向用户展示他们最有可能购买的商品。亚马逊科学等机构的研究对此进行了详细说明。
  • 检索增强生成(RAG):在使用大型语言模型(LLM)的系统中,RAG首先从知识库中检索相关文档。然后,重排器会对这些文档进行筛选,以确保将事实最准确、上下文最相关的信息传递给LLM,从而显著提高生成响应的质量。Cohere Rerank API等服务就是专门为此目的而设计的。
  • 计算机视觉中的类比:虽然后处理技术(如Ultralytics YOLO物体检测模型中使用的非最大值抑制(NMS))在传统上并不被称为 "reerankers",但其核心理念是相同的。物体检测器首先会提出大量具有不同置信度的潜在边界框。然后,NMS 根据得分和重叠度(IoU) 评估这些候选框,抑制多余或置信度较低的框,只保留最有可能的检测结果,从而起到重新筛选的作用。这一完善步骤对于实现干净准确的最终预测至关重要。您可以探索性能基准,了解此类模型的模型训练技巧,这些模型通常是在Ultralytics HUB 等平台上训练和管理的。

加入 Ultralytics 社区

加入人工智能的未来。与全球创新者联系、合作和成长

立即加入
链接复制到剪贴板