敬请关注 YOLO Vision 2025!
2025年9月25日
英国夏令时 10:00 - 18:00
混合活动
Yolo Vision 2024
词汇表

重排序器

使用重排序器提高搜索准确性! 了解高级模型如何优化初始结果,以获得最佳相关性和用户满意度。

重排序器是一种复杂的模型,用于多阶段信息系统中,以优化和改进初始候选列表的排序。可以将其视为质量控制专家。虽然主要系统(称为检索器)快速收集大量潜在相关项目,但重排序器对这个较小的、预过滤的集合执行更详细和计算密集型的分析。其目标是重新排序这些项目,将最相关的项目放在最顶部,从而提高最终输出的精确性和实用性。这种两步过程使系统能够平衡速度和准确性,从而高效地提供高质量的结果。

重排序器的工作原理

重排序通常涉及一个两阶段架构,这在现代 搜索 和推荐系统中很常见:

  1. 第一阶段检索: 一种快速但不太精确的模型(检索器)扫描海量数据库或索引,以快速找到大量的候选项目。对于搜索引擎,这可能涉及查找包含特定关键字的所有文档。在计算机视觉中,这可能是一个初始模型,它为对象生成许多潜在的边界框。这里的首要任务是高召回率——确保不会遗漏任何相关项目。
  2. 第二阶段重排序: 然后,将初始候选集(例如,前 100 个搜索结果)传递给重排序器。这通常是一个更复杂、更强大的模型,例如基于 Transformer 的神经网络。重排序器更详细地检查候选对象,考虑细微的上下文、语义关系和第一阶段检索器为了速度而忽略的复杂特征。然后,它为每个项目计算一个新的、更准确的相关性得分,并相应地重新排序列表。这种对精度的关注确保了最高质量的顶级结果。

这种方法在计算上是高效的,因为代价高昂的重新排序模型仅处理总数据的一小部分,而这些数据已经通过更快的检索器进行了过滤。

重排序器与第一阶段检索器

区分重排序器和第一阶段检索器非常重要。

  • 第一阶段检索器: 针对速度和召回率进行了优化。它的工作是快速筛选大量数据,并创建一个广泛的、包容性的候选列表。它使用更简单的评分方法,例如关键字匹配或基本嵌入
  • 重排序器: 针对精度和相关性进行了优化。它从检索器获取可管理的列表,并应用深度、上下文感知的分析来生成最终的、高度准确的排名。它速度较慢且资源密集,但在小得多的数据集上运行。

本质上,检索器撒下了一张大网,而重排序器则仔细检查捕获物,以找到珍贵的鱼。

应用和示例

重排序器是许多最先进的 AI 应用程序中的关键组件:

  • Web搜索引擎: GoogleMicrosoft Bing等公司使用多阶段排名系统,其中重排序器起着至关重要的作用。在初始检索获取数千个页面后,复杂的重排序器会分析用户意图、内容质量和来源权威性等因素,以呈现最相关的结果。这是现代信息检索研究的核心部分。
  • 电子商务平台:Amazon 这样的网站使用重排序器来优化产品搜索结果和推荐。初始搜索可能会调出所有“跑鞋”,但重排序器会分析用户评论、购买历史和品牌受欢迎程度,以向用户展示他们最有可能购买的商品。这在 Amazon Science 等机构的研究中有详细说明。
  • 检索增强生成(RAG):在使用大型语言模型(LLM)的系统中,RAG首先从知识库中检索相关文档。然后,重新排序器会筛选这些文档,以确保将最准确和上下文相关的信息传递给LLM,从而显着提高生成响应的质量。诸如Cohere Rerank API之类的服务专门为此目的而设计。
  • 计算机视觉中的类比: 虽然传统上不称为“重排序器”,但 非极大值抑制 (NMS) 等后处理技术(用于 目标检测 模型,如 Ultralytics YOLO)具有相同的核心理念。 目标检测器首先提出大量具有不同置信度分数的潜在边界框。 然后,NMS 通过根据这些候选框的分数和重叠 (IoU) 评估这些候选框来充当重排序器,抑制冗余或置信度较低的框,仅保留最可能的检测结果。 此细化步骤对于实现清晰准确的最终预测至关重要。 您可以探索 性能基准 并查找此类模型的 模型训练技巧,这些模型通常在 Ultralytics HUB 等平台上进行训练和管理。

加入 Ultralytics 社区

加入人工智能的未来。与全球创新者联系、协作和共同成长

立即加入
链接已复制到剪贴板