ReAct Prompting

探索 ReAct 提示词，构建自主 AI 智能体。了解推理和行动如何与大语言模型 (LLMs) 以及像 Ultralytics YOLO26 这样的视觉工具协同工作。

ReAct (推理与行动) 提示工程是一种先进的提示工程范式，它使大语言模型 (LLMs) 能够动态地将分步推理过程与任务特定的行动交织在一起。该技术首次在 2022 年具有影响力的学术论文 “ReAct: Synergizing Reasoning and Acting in Language Models” 中提出，它将静态语言模型转化为交互式的 AI 智能体。通过明确地对问题进行思考并执行行动以检索外部信息，ReAct 框架显著提高了复杂人工智能工作流程中的事实准确性和决策能力。

Link to this section推理与行动的机制#

在传统的交互中，模型完全基于其内部知识生成响应，这往往会导致 LLM 中的幻觉。ReAct 架构通过使用由“思考”、“行动”和“观察”组成的连续循环，将 AI 与外部环境联系起来，从而解决了这个问题。

当面对查询时，模型首先生成一个“思考”来概述其策略。然后，它会触发一个“行动”，例如查询搜索引擎、与数据库交互，或通过称为函数调用的概念调用视觉 API。环境会返回一个提供事实数据的“观察”。模型评估此新信息，更新其推理，并迭代该循环，直到得出最终答案。Prompt Engineering Guide on ReAct 中详细介绍了这种方法，它反映了人类解决问题的方式，并建立了高度透明和可控的智能体行为。

Link to this section实际应用#

ReAct 提示工程在需要迭代问题解决和多步骤工具使用的场景中表现出色，这使其成为现代智能体 AI 系统的基础。

自动化客户支持智能体： 在企业环境中，IT 服务台智能体使用 ReAct 来解决用户问题。如果用户报告网络中断，智能体将推断需要检查服务器状态。它通过 ping 诊断 API 执行行动，观察结果，然后根据检索到的事实升级工单或提供故障排除指南，从而简化了传统的检索增强生成 (RAG) 流程。
动态视觉分析： 计算机视觉系统利用 ReAct 进行复杂的视觉问答。负责库存管理的机器人智能体可能会观察货架，推断需要清点特定物品，通过调用目标检测模型执行行动，并使用返回的 BBox 数据来完成清点。这种协同作用弥合了基于文本的推理与空间理解之间的鸿沟。

Link to this section利用计算机视觉实现 ReAct#

对于使用 Python 的开发者来说，ReAct 智能体通常协调感知模型来与物理世界交互。以下概念性代码演示了 ReAct 推理循环如何无缝部署 Ultralytics YOLO26 模型作为外部工具来观察环境并进行报告。

from ultralytics import YOLO


def vision_tool(image_path: str) -> str:
    """Action tool for a ReAct agent to detect objects in an image."""
    model = YOLO("yolo26n.pt")  # Load highly efficient YOLO26 nano model
    results = model(image_path)

    # Format the observation for the LLM's reasoning loop
    detected_classes = [model.names[int(c)] for c in results[0].boxes.cls]
    return f"Observation: Found {len(detected_classes)} objects: {', '.join(detected_classes)}"


# Simulated ReAct agent executing an action
agent_observation = vision_tool("https://ultralytics.com/images/bus.jpg")
print(agent_observation)

利用 Ultralytics Platform 可以全面简化这些视觉工具的数据集管理和实验跟踪，该平台为现代 AI 部署提供了全面的解决方案。有兴趣从头构建这些智能体的人也可以研究官方 ReAct 仓库中的基础逻辑。

Link to this section区分相关概念#

为了设计稳健的多模态架构（正如最近的学术对齐研究所探索的那样），区分 ReAct 与相关工程模式至关重要：

与思维链提示工程的对比： 思维链 (CoT) 鼓励模型逐步思考，但完全依赖静态的内部知识。ReAct 通过注入在推理过程中收集新鲜外部观察结果的动态“行动”来扩展 CoT。
与提示链的对比： 提示链涉及硬编码一系列独立的 LLM 调用，其中一个步骤的输出会自动输入到下一步。ReAct 是一种更自主的范式，其中单个智能体根据持续的观察动态决定采取“哪些”工具或顺序行动，而不是遵循死板的链式脚本。

通过将逻辑推导与多模态模型等专业外部工具的执行相结合，ReAct 提示工程能够开发出能力极强且通用的 AI 系统。