敬请关注 YOLO Vision 2025!
2025年9月25日
英国夏令时 10:00 - 18:00
混合活动
Yolo Vision 2024
词汇表

思维链提示

通过思维链提示来提升 AI 推理能力!增强复杂、多步骤任务的准确性、透明度和上下文保留能力。

Chain-of-Thought (CoT) prompting(思维链提示)是一种先进的 提示工程 技术,旨在提高 大型语言模型 (LLM) 的推理能力。CoT prompting 不是要求模型直接给出答案,而是鼓励模型生成一系列中间的、连贯的步骤,从而得出最终结论。这种方法通过将复杂问题分解为更小、更易于管理的部分来模仿人类解决问题的过程,从而显着提高需要算术、常识和符号推理的任务的性能。这个核心思想由 Google AI 的一篇研究论文 提出,该论文表明这种方法有助于模型得出更准确和可靠的答案。

这种技术不仅提高了模型输出的准确性,还提供了一个了解其“思考过程”的窗口,使结果更易于解释和信任。这是朝着开发更具可解释性 AI (XAI)迈出的关键一步。通过跟踪模型的思维链,开发人员可以更好地理解结论是如何得出的,并识别其逻辑中存在的潜在错误,这对于调试和改进AI 系统至关重要。

思维链提示(Chain-of-Thought Prompting)的工作原理

实现 CoT 提示主要有两种方法,每种方法都适用于不同的场景:

  • Zero-Shot CoT: 这是最简单的方法,其中将诸如“让我们逐步思考”之类的简单短语添加到问题的末尾。此指令促使模型阐明其推理过程,而无需任何先前的示例。这是 零样本学习 的强大应用,允许模型对其以前未见过的任务执行复杂的推理。
  • Few-Shot CoT: 这种方法包括在提示本身中向模型提供一些示例。每个示例都包含一个问题、一个详细的逐步推理过程(思维链)和最终答案。通过查看这些示例,模型学习在遇到新的类似问题时遵循所需的推理模式。这种利用少样本学习的方法,对于高度复杂或特定领域的问题,通常比零样本 CoT 更有效。

实际应用

CoT 提示在需要复杂问题解决的各个行业中都有实际应用。

  1. 数学和科学问题解决: 一个经典的用例是解决多步骤数学文字问题。可以提示 LLM 分解问题、识别变量、制定必要的步骤、执行计算并得出最终答案,与直接答案提示相比,显着减少了错误。 DeepMind 等组织对此进行了深入探讨。
  2. 复杂的客户支持和诊断: 技术支持角色中的 AI 驱动的聊天机器人可以使用 CoT 来处理复杂的用户问题。机器人可以推理问题,而不是给出通用的回复:“首先,我将确认用户的设备和软件版本。接下来,我将检查与此版本相关的已知问题。然后,我将询问具体的错误消息。最后,我将根据此信息提供一个逐步的解决方案。”这种结构化的方法可以提供更有用和准确的支持。

与相关概念的比较

CoT 提示与自然语言处理 (NLP)机器学习 (ML)中的其他技术相关,但又有所不同。

  • Prompt 链接(Prompt Chaining):Prompt 链接将复杂的任务分解为一系列更简单、相互连接的 prompt,其中一个 prompt 的输出成为下一个 prompt 的输入。这通常需要外部编排(例如,使用 LangChain 等框架)。相比之下,CoT 旨在在单个 prompt-response 交互中引出整个推理过程。
  • 检索增强生成 (RAG): RAG 是一种技术,模型首先从外部知识库检索相关信息,然后再生成响应。RAG 可以是链式思维过程的一个组成部分(例如,一个步骤可能是“在数据库中搜索 X”),但 CoT 描述的是推理本身的整体结构。了解更多关于RAG 系统如何工作
  • Prompt Enrichment(提示丰富): 指在将用户初始提示发送给 AI 之前,向其添加上下文或详细信息。它增强的是单个提示,而不是创建定义 CoT(思维链)的顺序的、逐步的推理过程。

CoT 提示代表着朝着构建更强大和可解释的人工智能 (AI)系统迈出的重要一步。在开发复杂的 AI 模型时,理解和利用此类技术可能是有益的。诸如Ultralytics HUB之类的平台可以帮助管理各种模型的训练部署自洽性等技术可以通过对多个推理路径进行采样并选择最一致的答案来进一步增强 CoT。随着模型变得越来越复杂,从 LLM 到计算机视觉模型(如Ultralytics YOLO11),结构化推理的原则将变得越来越重要。

加入 Ultralytics 社区

加入人工智能的未来。与全球创新者联系、协作和共同成长

立即加入
链接已复制到剪贴板