ReAct Prompting
探索 ReAct 提示词,构建自主 AI 智能体。了解推理和行动如何与大语言模型 (LLMs) 以及像 Ultralytics YOLO26 这样的视觉工具协同工作。
ReAct (推理与行动) 提示工程是一种先进的 提示工程 范式,它使 大语言模型 (LLMs) 能够动态地将分步推理过程与任务特定的行动交织在一起。该技术首次在 2022 年具有影响力的学术论文 “ReAct: Synergizing Reasoning and Acting in Language Models” 中提出,它将静态语言模型转化为交互式的 AI 智能体。通过明确地对问题进行思考并执行行动以检索外部信息,ReAct 框架显著提高了复杂 人工智能 工作流程中的事实准确性和决策能力。
Link to this section推理与行动的机制#
在传统的交互中,模型完全基于其内部知识生成响应,这往往会导致 LLM 中的幻觉。ReAct 架构通过使用由“思考”、“行动”和“观察”组成的连续循环,将 AI 与外部环境联系起来,从而解决了这个问题。
当面对查询时,模型首先生成一个“思考”来概述其策略。然后,它会触发一个“行动”,例如查询搜索引擎、与数据库交互,或通过称为 函数调用 的概念调用视觉 API。环境会返回一个提供事实数据的“观察”。模型评估此新信息,更新其推理,并迭代该循环,直到得出最终答案。Prompt Engineering Guide on ReAct 中详细介绍了这种方法,它反映了人类解决问题的方式,并建立了高度透明和可控的智能体行为。
Link to this section实际应用#
ReAct 提示工程在需要迭代问题解决和多步骤工具使用的场景中表现出色,这使其成为现代 智能体 AI 系统 的基础。
- 自动化客户支持智能体: 在企业环境中,IT 服务台智能体使用 ReAct 来解决用户问题。如果用户报告网络中断,智能体将推断需要检查服务器状态。它通过 ping 诊断 API 执行行动,观察结果,然后根据检索到的事实升级工单或提供故障排除指南,从而简化了传统的 检索增强生成 (RAG) 流程。
- 动态视觉分析: 计算机视觉 系统利用 ReAct 进行复杂的视觉问答。负责库存管理的机器人智能体可能会观察货架,推断需要清点特定物品,通过调用 目标检测 模型执行行动,并使用返回的 BBox 数据来完成清点。这种协同作用弥合了基于文本的推理与空间理解之间的鸿沟。
Link to this section利用计算机视觉实现 ReAct#
对于使用 Python 的开发者来说,ReAct 智能体通常协调感知模型来与物理世界交互。以下概念性代码演示了 ReAct 推理循环如何无缝部署 Ultralytics YOLO26 模型作为外部工具来观察环境并进行报告。
from ultralytics import YOLO
def vision_tool(image_path: str) -> str:
"""Action tool for a ReAct agent to detect objects in an image."""
model = YOLO("yolo26n.pt") # Load highly efficient YOLO26 nano model
results = model(image_path)
# Format the observation for the LLM's reasoning loop
detected_classes = [model.names[int(c)] for c in results[0].boxes.cls]
return f"Observation: Found {len(detected_classes)} objects: {', '.join(detected_classes)}"
# Simulated ReAct agent executing an action
agent_observation = vision_tool("https://ultralytics.com/images/bus.jpg")
print(agent_observation)利用 Ultralytics Platform 可以全面简化这些视觉工具的数据集管理和实验跟踪,该平台为现代 AI 部署提供了全面的解决方案。有兴趣从头构建这些智能体的人也可以研究 官方 ReAct 仓库 中的基础逻辑。
Link to this section区分相关概念#
为了设计稳健的多模态架构(正如最近的 学术对齐研究 所探索的那样),区分 ReAct 与相关工程模式至关重要:
- 与 思维链提示工程 的对比: 思维链 (CoT) 鼓励模型逐步思考,但完全依赖静态的内部知识。ReAct 通过注入在推理过程中收集新鲜外部观察结果的动态“行动”来扩展 CoT。
- 与 提示链 的对比: 提示链涉及硬编码一系列独立的 LLM 调用,其中一个步骤的输出会自动输入到下一步。ReAct 是一种更自主的范式,其中单个智能体根据持续的观察动态决定采取“哪些”工具或顺序行动,而不是遵循死板的链式脚本。
通过将逻辑推导与 多模态模型 等专业外部工具的执行相结合,ReAct 提示工程能够开发出能力极强且通用的 AI 系统。






