深圳Yolo 视觉
深圳
立即加入
词汇表

思维链提示

通过思维链提示来提升 AI 推理能力!增强复杂、多步骤任务的准确性、透明度和上下文保留能力。

思维链 (CoT) 提示是提示工程中的一项复杂技术,旨在提高 提示工程中的一项复杂技术,旨在提高 推理能力。 大型语言模型(LLM)的推理能力。而不是 而不是要求人工智能模型对复杂的查询立即给出答案,CoT 提示会指示模型将问题分解成一系列中间的 问题分解成一系列中间逻辑步骤。这种方法模仿了人类解决问题的过程、 让模型在得出最终结论之前进行 "大声思考"。通过生成一系列 推理步骤,模型就能在需要算术、常识推理和符号逻辑的任务中显著提高性能。 推理和符号逻辑。这种方法由 Google 大脑的研究人员推广了这种方法、 谷歌大脑的研究人员推广了这种方法,证明了结构化的思维过程能带来更可靠、更准确的 人工智能(AI)输出。

思维链机制

CoT 的有效性在于它能够将复杂的任务分解为易于管理的组成部分。这不仅 这不仅有助于模型保持连贯性,还能让人清楚地了解答案是如何得出的,这是可解释人工智能(XAI)的一个关键因素。 可解释人工智能(XAI)的关键因素。有两种主要方法 实施这一策略:

  • Zero-Shot CoT:这包括在提示语末尾添加一个触发短语,如 "让我们逐步思考"。 这样的触发短语。正如有关 的研究中所描述的那样,这种简单的指令可以激活模型的推理能力,而不需要具体的例子。 推理能力,而不需要具体的例子。 零点学习来处理新任务。
  • 寥寥数语 CoT:在这种情况下,提示包括几个问题示例,并配上其 逐步解决。这利用了 少量学习,即模型从提供的上下文中学习推理模式,并将其应用到新的输入中。 推理模式,并将其应用于新的输入。

实际应用

思维链提示正在改变开发人员在各个领域构建应用程序的方式,尤其是在精度和逻辑性至关重要的领域。 尤其是在精确度和逻辑性至关重要的领域。

  1. 复杂数据分析:在金融或 在金融或数据分析等领域,CoT 用于指导模型 进行多阶段计算。例如,分析师可能会提示人工智能 "首先提取第一季度的收入数据,然后使用消费物价指数对通货膨胀进行调整,最后比较增长率"。 第一季度的收入数据,然后使用 CPI 指数对通货膨胀进行调整,最后将增长率与上一财年进行比较"。 "。这种结构化的方法可以减少直接回答式提示中常见的计算错误。
  2. 代码生成和调试:开发人员使用 CoT 生成健壮的代码,用于 计算机视觉 任务。用户可能不会简单地 用户可能会要求模型概述加载数据集、配置模型架构和执行训练循环的逻辑。 架构和执行训练循环的逻辑。这样就能确保为诸如 ultralytics 逻辑合理,句法正确。

代码示例

虽然 CoT 是一种基于文本的技术,但它经常被用于为机器学习工作流生成正确的Python 代码。 工作流程生成正确的 Pyon 代码。下面的示例演示了如何在Python 中构造一个提示字符串,以诱导出一步步的 解决方案 YOLO11来detect 物体的逐步解决方案。

# Example of a Chain-of-Thought prompt structure for generating YOLO11 code
prompt = """
Task: Write a Python script to detect objects in a video stream using YOLO11.

Chain of Thought:
1. Import the YOLO class from the ultralytics package.
2. Load the pre-trained 'yolo11n.pt' model weights.
3. Define the source as '0' for the webcam or a video file path.
4. Run the predict() method with show=True to visualize results in real-time.

Now, generate the Python code based on these steps.
"""

print(f"Sending the following prompt to LLM:\n{prompt}")

与相关概念的比较

重要的是要将思维链提示与其他 机器学习 (ML)技术:

  • 提示连锁:CoT 发生在单个提示-响应周期内,而提示链则是将任务分解为一系列独立的 API 调用。 其中一个提示的输出将成为下一个提示的输入。CoT 侧重于内部 推理,而链则侧重于工作流的协调。
  • 检索-增强生成(RAG):RAG 包括获取外部数据,以便在生成答案之前为模型知识奠定基础。CoT 可以 与 RAG 结合(例如,"首先检索文档,然后推理其内容"),但 CoT 具体指的是推理结构,而不是数据检索机制。
  • 提示调整:这是一种 参数高效微调(PEFT) 在训练过程中优化连续软提示(向量)的方法。相比之下,CoT 是一种离散的自然语言提示策略。 语言提示策略 而 CoT 是一种离散的自然语言提示策略,在推理时应用,无需改变模型 权重。

通过集成 "思维链 "提示功能,开发人员可以释放生成式人工智能的全部潜能。 生成式人工智能的全部潜力,确保模型不仅能提供答案,还能证明其解决方案的逻辑正确性。 答案,还能证明其解决方案的逻辑正确性。这对于在关键环境中部署可靠的 这对于在关键环境中部署可靠的人工智能代理至关重要。

加入Ultralytics 社区

加入人工智能的未来。与全球创新者联系、协作和共同成长

立即加入