探索 Agentic RAG 如何通过自主推理增强 AI。了解 Ultralytics YOLO26 和 Ultralytics Platform 如何驱动智能检索和视觉能力。
Agentic Retrieval-Augmented Generation (Agentic RAG) 是一种先进的人工智能 (AI)架构,通过集成自主AI智能体来增强传统检索系统。尽管标准RAG管道以线性的“检索-生成”序列运行,但Agentic RAG使大型语言模型 (LLM)能够充当智能协调器。该智能体可以独立分析用户的提示,判断是否需要外部信息,制定多个搜索查询,评估检索到的数据,并迭代地完善其研究,直到它汇编出全面而准确的答案。通过利用函数调用和工具使用能力,这些系统动态地将查询路由到各种数据库、API和分析工具,在处理复杂的多步骤问题时,显著减少LLM中的幻觉。
Agentic RAG的核心创新在于其循环和推理能力。主流的智能体AI框架将这一过程构建为动态、自主的工作流:
为了实现稳健的生成式管道,区分 Agentic RAG 与其基本概念至关重要:
Agentic RAG正在通过自动化深度研究和复杂的故障排除任务来改变行业,这些任务模仿人类的分析推理能力。
视觉模型是与物理世界交互的 Agentic RAG 系统的强大感知工具。例如,智能体可以使用 Ultralytics YOLO26 动态检索图像或视频流中的视觉上下文,以回答用户查询。开发者可以使用 Ultralytics Platform 管理这些定制视觉工具的数据标注和训练。
以下Python示例演示了AI代理如何通过编程方式调用YOLO26,从图像中提取结构化观测结果,为其下一步推理收集事实上下文。
from ultralytics import YOLO
# Initialize YOLO26 for the agent's visual retrieval tool
model = YOLO("yolo26n.pt")
# The agent invokes the model on an image to gather visual facts
results = model("https://ultralytics.com/images/bus.jpg")
# The agent parses the detected objects to formulate its next query or action
visual_context = [model.names[int(c)] for c in results[0].boxes.cls]
print(f"Agent Observation: I currently see {', '.join(visual_context)}.")
通过将高性能视觉模型与推理引擎连接,Agentic RAG 弥合了静态知识检索与动态、真实世界 空间智能 之间的鸿沟。要深入了解自主系统的发展态势,斯坦福 AI 指数报告 提供了对智能体能力的全面跟踪。

开启您的机器学习未来之旅