Agentic RAG
探索代理式 RAG(Agentic RAG)以通过自主推理增强 AI。了解 Ultralytics YOLO26 和 Ultralytics Platform 如何提供智能检索和视觉能力。
Agentic Retrieval-Augmented Generation (Agentic RAG) 是一种先进的 人工智能 (AI) 架构,它通过集成自主 AI 智能体 来增强传统检索系统。标准的 RAG 流水线按线性的“检索并生成”序列运行,而 Agentic RAG 则赋予 大语言模型 (LLM) 作为智能编排器的能力。该智能体可以独立分析用户的提示,确定是否需要外部信息,制定多个搜索查询,评估检索到的数据,并反复优化其研究过程,直到汇总出全面且准确的答案。通过利用 函数调用和工具使用 功能,这些系统能够跨各种数据库、API 和分析工具动态路由查询,从而在处理复杂的、多步骤问题时显著减少 LLM 中的幻觉。
Link to this sectionAgentic RAG 系统的工作原理#
Agentic RAG 的核心创新在于其循环和推理的能力。领先的 智能体 AI 框架 将此过程构建为动态的、自主的工作流:
- 查询规划和路由:智能体将复杂问题分解为更小、可管理的子任务,并将每个任务路由到最合适的工具或 向量数据库。
- 迭代检索:与静态检索不同,智能体会审查抓取的文档。如果上下文不足,它会重新制定搜索策略并再次进行查询。
- 工具集成:智能体可以编写并执行代码、进行数学运算或触发 机器学习 (ML) 模型来即时合成新数据。
Link to this sectionAgentic RAG 与标准 RAG 的对比#
为了实现稳健的生成式流水线,区分 Agentic RAG 与其基础概念至关重要:
- 标准检索增强生成 (RAG):单次运行。它根据语义相似度抓取文档并生成响应。在处理需要跨多个步骤合成不同数据源的复杂逻辑时,它往往力不从心。
- Agentic RAG:引入了决策制定和循环机制。智能体会评估检索质量,并可以在最终生成之前触发后续搜索或调用不同的工具。
- 多模态 RAG:专注于检索多样化的数据类型(图像、文本、视频)。Agentic RAG 可以控制多模态 RAG 流水线,决定何时搜索视觉数据库,何时搜索文本文档。
Link to this section实际应用#
Agentic RAG 正在通过自动化模拟人类分析推理的深度研究和复杂故障排除任务,从而改变各行各业。
- 企业知识合成:在企业环境中,智能体可能会收到一个提示,要求“总结我们第三季度的表现,并将其与我们主要竞争对手的最新财报进行对比”。智能体会自主查询内部财务数据库,对竞争对手的备案文件进行实时网络搜索,使用计算器工具分析数字,并起草一份详尽的简报。
- 自主质量检测:在制造业中,智能体的任务可以是识别装配故障的根本原因。它可以触发 计算机视觉 (CV) 模型来检查实时摄像头画面,查询历史维护日志,并基于视觉和文本证据合成诊断报告。
Link to this section将视觉 AI 集成到 Agentic 工作流中#
对于与物理世界交互的 Agentic RAG 系统而言,视觉模型是强大的感官工具。例如,智能体可以使用 Ultralytics YOLO26 动态地从图像或视频流中检索视觉上下文,以回答用户查询。开发人员可以使用 Ultralytics Platform 管理这些自定义视觉工具的数据标注和训练。
以下 Python 示例演示了 AI 智能体如何以编程方式调用 YOLO26,从图像中提取结构化观察结果,为其下一步推理步骤收集事实依据。
from ultralytics import YOLO
# Initialize YOLO26 for the agent's visual retrieval tool
model = YOLO("yolo26n.pt")
# The agent invokes the model on an image to gather visual facts
results = model("https://ultralytics.com/images/bus.jpg")
# The agent parses the detected objects to formulate its next query or action
visual_context = [model.names[int(c)] for c in results[0].boxes.cls]
print(f"Agent Observation: I currently see {', '.join(visual_context)}.")通过将功能强大的视觉模型连接到推理引擎,Agentic RAG 弥合了静态知识检索与动态现实世界 空间智能 之间的鸿沟。若要深入了解自主系统不断演进的格局,Stanford AI Index Report 提供了对智能体能力的全面追踪。






