深圳Yolo 视觉
深圳
立即加入
词汇表

重排序器

了解重排序器如何优化搜索结果和目标 detect 以实现最大精度。了解 Ultralytics YOLO26 如何使用这些模型来优化 AI 准确性。

重排序器是一种复杂的机器学习模型,旨在精炼和重新排序候选项目列表——例如搜索结果、文档段落或目标检测——以最大限度地提高它们与特定查询或上下文的相关性。在多阶段系统中,初始的“检索器”首先从海量数据集中快速收集大量潜在有用项目。然后,重排序器作为第二阶段介入,对这个较小的候选列表进行深入、计算密集型分析,以识别绝对最佳匹配。通过仅对少数选定候选者进行大量计算,系统可以在不牺牲实时应用所需速度的情况下实现高准确性

Reranker的工作原理

重排序通常在两阶段管道中运行,这在现代语义搜索和推荐引擎中很常见。

  • 第一阶段检索:轻量级模型扫描整个数据库,以检索大量候选对象(例如,前100个文档)。此阶段优先考虑召回率,以确保不遗漏任何相关项,通常使用近似最近邻搜索等快速算法。
  • 第二阶段重排序:重排序器处理检索到的候选结果。与可能使用简单向量相似度的检索器不同,重排序器通常采用交叉编码器或强大的Transformer架构。它检查查询与候选项目之间的完整交互,捕捉简单模型可能遗漏的细微差别和上下文。输出是一个重新排序的列表,其中最相关的项目显示在顶部。

Reranker与Retriever对比

尽管这两个组件都旨在查找相关数据,但它们在机器学习 (ML)工作流中服务于不同的目的。

  • 检索器旨在实现可扩展性。它们将数据压缩成固定大小的嵌入向量,使其能够在几毫秒内搜索数百万个项目。然而,这种压缩可能会丢失细粒度信息。
  • 重排序器旨在实现精确性。它们在整个数据库上运行速度太慢,但在小规模子集上却非常有效。它们提供“第二意见”,纠正快速检索步骤中出现的错误。

实际应用

Reranker在各种高性能AI系统中至关重要,弥合了广泛搜索与精确理解之间的鸿沟。

检索增强生成 (RAG)

检索增强生成 (RAG) 中,一个 LLM 根据外部数据回答问题。如果检索步骤将不相关的文档传递给LLM,模型可能会产生幻觉或提供不正确的答案。重排序器(reranker)作为质量过滤器,确保只有最相关的文本块被发送到生成器。这提高了响应的事实准确性,并减少了 上下文窗口 的使用。

目标检测与非极大值抑制

计算机视觉 中,在推理过程中使用了一种与重排序(reranking)类似的概念。像 YOLO26 这样的模型会为图像中的目标生成数千个候选 边界框。一个称为 非极大值抑制 (NMS) 的过程充当重排序器。它根据 置信度 分数对边界框进行排序,并使用 交并比 (IoU) 消除冗余、重叠的预测。这确保最终输出只包含每个目标的最佳 detect。

以下 python 示例展示了 NMS 参数如何在推理过程中作为重排序过滤器发挥作用 ultralytics.

from ultralytics import YOLO

# Load the state-of-the-art YOLO26 model
model = YOLO("yolo26n.pt")

# Run inference with NMS settings acting as the 'reranker'
# 'iou' controls the overlap threshold for suppressing duplicate candidates
# 'conf' sets the minimum confidence score required to be considered
results = model.predict("https://ultralytics.com/images/bus.jpg", iou=0.5, conf=0.25)

# Show the filtered, high-relevance detections
results[0].show()

电子商务个性化

亚马逊 这样的主要在线零售商使用重排序器来定制搜索结果。如果用户搜索“运动鞋”,检索器会找到数千双鞋。重排序器会根据用户的购买历史、当前趋势和利润率对这些商品进行排序,将用户最有可能购买的商品放在页面顶部。

优化重排序工作流

实现重排序器需要在准确性提升与计算成本之间取得平衡。对于使用 Ultralytics Platform 训练和部署模型的开发者来说,理解模型复杂性与推理速度之间的权衡至关重要。虽然复杂的重排序器能改善结果,但会增加延迟。像 模型量化知识蒸馏 这样的技术可以帮助加速重排序模型,以便在边缘设备上部署。

要进一步探索优化推理管道,请阅读我们关于 超参数调优模型导出 以实现最大性能的指南。

让我们一起共建AI的未来!

开启您的机器学习未来之旅