深圳Yolo 视觉
深圳
立即加入
词汇表

重排序器

探索[重新排序器](ultralytics)如何优化搜索和检测结果以实现最高精度。立即学习如何优化[YOLO26](ultralytics)工作流和RAG管道。

重新排序器是一种精密的机器学习模型,旨在优化并重新排列候选项列表——例如搜索结果、文档段落或物体检测结果——以最大化其与特定查询或语境的相关性。在多阶段系统中,初始的"检索器"首先从海量数据集中快速收集大量潜在有用项。 重排序器作为第二阶段介入,对这份精简候选列表进行深度计算密集型分析,以识别最优匹配项。通过将高强度计算聚焦于少数精选候选项,系统既能保持高精度,又不会牺牲实时应用所需的速度。

重新排序器如何运作

重新排序通常在现代语义搜索和推荐引擎中常见的两阶段管道内运行。

  • 第一阶段检索:轻量级模型扫描整个数据库以检索大量候选项(例如前100篇文档)。该阶段优先考虑召回率以确保不遗漏任何相关项,通常采用近似最近邻搜索等快速算法。
  • 第二阶段重新排序:重新排序器对检索到的候选项进行处理。与检索器不同, 后者可能仅使用简单的向量相似度,而重新排序器通常采用 交叉编码器或强大的 Transformer 架构。它会全面分析 查询词与候选项之间的交互关系,捕捉简单模型难以察觉的细微差异与上下文关联。 最终输出重新排序的列表,相关性最高的项目将置顶呈现。

重新排序者 vs. 检索者

虽然这两个组件都旨在查找相关数据,但在机器学习(ML)工作流中它们各自承担着不同的功能。

  • 检索器专为 可扩展性而设计。它们将数据压缩为固定大小的 嵌入向量,从而能在毫秒内搜索数百万条项目。 然而这种压缩可能导致精细细节的丢失。
  • 重新排序器专为精准而生。 它们运行于整个数据库时速度过慢,但在小数据子集上效果显著。它们提供 "二次验证",能修正快速检索步骤产生的错误。

实际应用

重排序器在各类高性能人工智能系统中至关重要,它们弥合了广泛搜索与精准理解之间的鸿沟。

检索增强生成(RAG)

在检索增强生成(RAG)中,大型语言模型(LLM)基于外部数据回答问题 检索增强生成(RAG)中,大型语言模型(LLM)基于外部数据回答问题。若检索步骤向LLM传递无关文档,模型可能产生幻觉或提供错误答案。重排序器作为质量过滤器,确保仅将最相关的文本片段发送至生成器。这既提升了响应的事实准确性,又减少了上下文窗口的使用。

目标检测与非最大抑制

计算机视觉领域,推理过程中会运用类似 重新排序的概念。诸如YOLO26等模型会为图像中的物体生成数千个候选 边界框非最大值抑制(NMS)过程充当重新排序器,它根据置信度分数对边界框进行排序,并通过交并比(IoU)消除冗余和重叠预测。这确保最终输出仅包含每个物体的最佳检测结果。

Python 展示了在推理过程中NMS 如何作为重新排序过滤器发挥作用: ultralytics.

from ultralytics import YOLO

# Load the state-of-the-art YOLO26 model
model = YOLO("yolo26n.pt")

# Run inference with NMS settings acting as the 'reranker'
# 'iou' controls the overlap threshold for suppressing duplicate candidates
# 'conf' sets the minimum confidence score required to be considered
results = model.predict("https://ultralytics.com/images/bus.jpg", iou=0.5, conf=0.25)

# Show the filtered, high-relevance detections
results[0].show()

电子商务个性化

亚马逊等大型在线零售商使用 重新排序器来定制搜索结果。当用户搜索"运动鞋"时,检索器会找到数千双 鞋子。随后重新排序器根据用户的过往购买记录、当前流行趋势和利润率对这些商品进行排序, 将用户最可能购买的商品置于页面顶部。

优化重新排序工作流

实现重排序器需要在准确率提升与计算成本之间取得平衡。对于Ultralytics 训练和部署模型的开发者而言,理解模型复杂度与推理速度之间的权衡至关重要。虽然复杂的重排序器能提升结果质量,但会增加延迟。模型量化或 知识蒸馏等技术可帮助加速重排序模型,以实现边缘设备部署。

要进一步探索如何优化推理管道,请阅读我们的指南,了解 超参数调优和 模型导出以实现最高性能。

加入Ultralytics 社区

加入人工智能的未来。与全球创新者联系、协作和共同成长

立即加入