术语表

思维链提示

通过思维链提示提高人工智能推理能力!提高复杂、多步骤任务的准确性、透明度和上下文保持率。

使用Ultralytics HUB 对YOLO 模型进行简单培训

了解更多

思维链(CoT)提示是一种先进的技术,主要用于大型语言模型(LLM),以提高其执行复杂推理任务的能力。CoT 不只要求最终答案,而是鼓励模型生成中间步骤或 "思维链",从逻辑上得出解决方案。这种方法模仿了人类解决问题的过程,帮助模型更有效地解决需要算术、常识或符号推理的问题,往往能显著提高准确性。这项技术在Google 人工智能的研究中得到了特别强调。

思维链提示如何发挥作用

CoT 提示通过向人工智能模型明确展示如何破解难题来引导它。主要有两种变体:

  1. 少量示例(CoT):提示包括几个例子(镜头),每个例子包括一个问题、一个详细的逐步推理过程(思维链)和最终答案。模型从这些示例中学习,将类似的推理过程应用到实际问题中。这是一种应用于推理路径的少量学习形式。
  2. 零射 CoT:这种更简单的方法不需要提供例子。取而代之的是,在问题后附加一个简单的指令,如 "让我们逐步思考"。这一提示鼓励模型在提供最终答案前阐明其推理过程。它充分利用了模型在大量预训练过程中学到的固有能力。

通过将推理步骤外部化,CoT 使模型的推理过程更加透明,也更容易调试出推理可能出错的地方。这与标准提示形成了鲜明对比,标准提示通常要求直接回答问题,在需要多个逻辑步骤的任务中可能会失败。

优势和应用

CoT 提示的主要优势在于,它能够增强 LLM 的推理能力,以完成标准提示难以完成的复杂任务。主要优势包括

  • 提高性能:显著提高数学文字题、逻辑谜题和多步骤问题解答等任务的准确性。
  • 增强透明度:生成的思维链可让人深入了解模型的推理过程,有助于实现可解释的人工智能(XAI)
  • 更好地处理复杂性:使模型能够处理需要将问题分解成更小、更易于管理的步骤的问题。

真实世界的例子

  1. 复杂的客户支持:使用 CoT 的人工智能聊天机器人可以处理复杂的客户问题,如排除多部分技术问题或解释复杂的账单查询。CoT 提示会引导人工智能首先识别核心问题,然后回忆相关政策或技术步骤,必要时检查用户历史记录,最后为客户制定逐步解决计划。这比直接猜测解决方案更有效。Salesforce Einstein等平台在客户服务中也采用了类似的推理方法。
  2. 数据分析和解释:当收到一个数据集和一个复杂的查询(例如,"根据这份报告找出导致上季度销售额下降的关键因素")时,使用 CoT 的 LLM 可以概述其分析计划:首先,确定相关数据点;其次,执行必要的计算或比较;第三,综合结果;最后,提出结论。这种结构化方法提高了人工智能产生的数据分析见解的可靠性。

医疗图像分析支持或金融建模等需要可靠和复杂决策的领域,CoT 尤为重要,它补充了由以下模型驱动的计算机视觉 (CV)等领域的进步 Ultralytics YOLO.

与相关概念的比较

CoT 提示与自然语言处理(NLP)机器学习(ML)中的其他技术相关,但又有所不同:

  • 提示工程这是一种为人工智能模型设计有效输入(提示)的广泛实践。CoT是一种特定的高级提示工程技术,重点在于激发推理。其他技术可能侧重于清晰度、语境提供(提示丰富化)或格式规范。
  • 提示链提示链是指将复杂的任务分解为一系列更简单、相互关联的提示,其中一个提示的输出将成为下一个提示的输入。这通常需要外部协调(如使用LangChain 等框架)。相比之下,CoT 的目标是在单个提示-响应交互中引出整个推理过程。
  • 零点学习Zero-shot Learning):这是指模型在没有任何示例的情况下执行未明确训练的任务的能力。零镜头 CoT 就是这方面的具体应用,它使用通用指令("让我们逐步思考")来触发推理。然而,与纯粹的零点学习不同的是,CoT 通常在提供特定任务推理示例的少点学习环境中表现更好。

CoT提示是朝着构建能力更强、可解释性更高的人工智能(AI)系统迈出的重要一步。在开发复杂的人工智能模型时,了解和利用此类技术将大有裨益,并有可能利用Ultralytics HUB等平台来管理培训部署自一致性(Self-Consistency)等技术可以通过对多种推理路径进行采样并选择最一致的答案来进一步增强 CoT。

阅读全部