术语表

思维链提示

通过思维链提示提高人工智能推理能力!提高复杂、多步骤任务的准确性、透明度和上下文保持率。

思维链(CoT)提示是一种先进的提示工程技术,旨在提高大型语言模型(LLM)的推理能力。CoT 提示不是要求模型直接给出答案,而是鼓励模型生成一系列中间的、连贯的步骤,从而得出最终结论。这种方法通过将复杂的问题分解成较小的、可处理的部分来模拟人类解决问题的过程,从而大大提高了需要算术、常识和符号推理的任务的处理能力。谷歌人工智能公司在一篇研究论文中介绍了这一核心思想,证明这种方法有助于模型得出更准确、更可靠的答案。

这种技术不仅提高了模型输出的准确性,还为了解模型的 "思维过程 "提供了一个窗口,从而使结果更具可解释性和可信度。这是开发更多可解释人工智能(XAI)的关键一步。通过跟踪模型的思维链,开发人员可以更好地理解结论是如何得出的,并识别其逻辑中的潜在错误,这对于调试和完善人工智能系统至关重要。

思维链提示如何发挥作用

实施 CoT 提示有两种主要方法,分别适用于不同的场景:

  • Zero-Shot CoT:这是最简单的方法,即在问题的末尾添加一个简单的短语,如 "让我们逐步思考"。这条指令会促使模型在不需要任何先例的情况下阐明其推理过程。这是零点学习的一个强大应用,它允许模型对其从未见过的任务进行复杂的推理。
  • 少量提示:这种方法是在提示本身中为模型提供几个例子。每个例子都包括一个问题、一个详细的逐步推理过程(思维链)和最终答案。通过查看这些示例,模型可以学会在遇到新的类似问题时遵循所需的推理模式。对于高度复杂或特定领域的问题,这种利用少量学习的方法通常比零次 CoT 更为有效。

实际应用

CoT 提示在需要解决复杂问题的各行各业都有实际应用。

  1. 数学和科学问题的解决:一个典型的使用案例是解决多步骤数学文字问题。LLM可以在提示下分解问题、确定变量、制定必要步骤、执行计算并得出最终答案,与直接回答提示相比,可显著减少错误。DeepMind 等机构对此进行了深入探讨。
  2. 复杂的客户支持和诊断:由人工智能驱动的技术支持聊天机器人可以使用 CoT 处理复杂的用户问题。与一般的回复不同,机器人可以对问题进行推理:"首先,我会确认用户的设备和软件版本。接下来,我会检查与该版本相关的已知问题。然后,我会询问具体的错误信息。最后,我会根据这些信息提供逐步的解决方案"。这种结构化的方法可以提供更有用、更准确的支持。

与相关概念的比较

CoT 提示与自然语言处理(NLP)机器学习(ML)中的其他技术相关,但又有所不同。

  • 提示链提示链将复杂的任务分解为一系列更简单、相互关联的提示,其中一个提示的输出将成为下一个提示的输入。这通常需要外部协调(如使用LangChain 等框架)。相比之下,CoT 的目标是在单个提示-响应交互中引出整个推理过程。
  • 检索增强生成(RAG)RAG 是一种技术,在生成响应之前,模型首先从外部知识库中检索相关信息。RAG 可以是思维链流程的一个组成部分(例如,其中一步可能是 "在数据库中搜索 X"),但 CoT 描述的是推理本身的整体结构。进一步了解RAG 系统的工作原理
  • 丰富提示这包括在将用户的初始提示发送给人工智能之前,为其添加上下文或细节。它可以增强单个提示,但不会创建定义 CoT 的有序、逐步的推理过程。

CoT提示技术是朝着构建能力更强、可解释性更高的人工智能(AI)系统迈出的重要一步。在开发复杂的人工智能模型时,了解和利用此类技术将大有裨益。Ultralytics HUB等平台可以帮助管理各种模型的训练部署自一致性(Self-Consistency)等技术可以通过对多种推理路径进行采样并选择最一致的答案来进一步增强CoT。随着模型变得越来越复杂,从 LLM 到Ultralytics YOLO11计算机视觉模型,结构化推理的原则将变得越来越重要。

加入 Ultralytics 社区

加入人工智能的未来。与全球创新者联系、合作和成长

立即加入
链接复制到剪贴板