术语表

及时工程

掌握提示工程的艺术,指导 LLM 等人工智能模型在内容、客户服务等方面实现精确、高质量的输出。

提示工程是一门设计有效输入(提示)的艺术和科学,用于引导人工智能(AI)模型,尤其是大型语言模型(LLM),生成所需的输出结果。这就好比一个熟练的人工智能交流者,知道该说什么以及如何说才能得到最好的回应。这种做法至关重要,因为人工智能模型输出的性能、相关性和质量对查询的方式非常敏感。有效的提示工程能让用户在各种任务中充分发挥强大基础模型的潜力。

及时工程的工作原理

提示工程的核心是构建输入,为模型提供清晰充分的语境。一个简单的问题可以产生一个基本的答案,而一个精心设计的提示则可以控制语气、格式和复杂程度。高级提示的主要组成部分包括

  • 指令:明确而具体的指令,告诉模型要完成什么任务(例如,"用三个要点概括下面的文章")。
  • 背景:提供相关背景信息或数据,供模型在作出响应时参考。
  • 角色:为人工智能指定一个角色,这将影响输出结果的语气和风格(例如,"扮演金融分析专家")。
  • 格式:指定所需的输出结构,如列表、JSON对象或特定的书写风格。
  • 实例:包括所需的输入和输出格式的示例,这种技术被称为 "少量学习",有助于引导模型做出响应。有关这些技术的综合资源,请参阅《提示指南》

实际应用

  1. 客户支持自动化:为确保品牌一致性和准确性,公司可以使用提示工程来指导其支持聊天机器人。提示可以指示人工智能采用友好和乐于助人的语气,使用内部知识库回答产品问题,并为何时将对话升级到人工座席制定明确的协议。这样可以控制人工智能的行为,防止它提供错误信息或以非品牌方式与客户互动。

  2. 创意内容生成:在MidjourneyOpenAI 的 DALL-E 3文本到图像模型中,提示是主要的创作工具。像 "一张汽车图片 "这样的简单提示会产生一个普通的结果。然而,"一辆 20 世纪 60 年代的老式红色跑车在日落时分飞驰在沿海高速公路上,逼真的风格,电影般的灯光,8K 分辨率 "这样详细的提示则提供了关于主题、场景、风格和质量的具体说明,从而生成了高度定制且视觉效果极佳的图像。

计算机视觉的相关性

虽然提示工程起源于自然语言处理(NLP),但它与计算机视觉(CV)的关系日益密切。这得益于可同时处理文本和图像的多模式模型的发展。CLIP等模型和YOLO-World等开放式词汇检测器可以执行基于任意文本描述的物体检测等任务。对于这些模型来说,制作有效的文本提示(例如,"检测所有'自行车',但忽略'摩托车'")是一种提示工程,对于指导这些视觉语言模型至关重要。Ultralytics HUB等平台可促进与各种模型的交互,通过接口定义任务可受益于提示工程原则。

快速工程与相关概念

必须将及时工程与其他机器学习概念区分开来:

  • 微调:这包括通过在新的数据集上继续训练来更新模型的权重。相比之下,即时工程并不改变模型本身,而是在推理时指导现有模型的行为。
  • 提示调整:提示调整是一种参数高效微调(PEFT)方法,包括学习一小套 "软提示 "嵌入,并将其添加到输入内容中。它通过训练自动创建提示,而提示工程则是手工制作基于文本的 "硬提示 "的过程。
  • 思维链 (CoT) 提示:CoT 是一种特定的提示工程技术,即在提示中添加类似 "逐步思考 "的指令。这可以鼓励模型将复杂的问题分解为中间推理步骤,往往能获得更准确的结果,谷歌人工智能研究论文原文对此进行了详细阐述。
  • 提示连锁:这种技术将复杂的任务分解为多个连续的提示,其中一个步骤的输出是下一个步骤的输入。提示工程是有效设计每个单独提示的更广泛实践。像LangChain这样的框架就是为协调这样的链而设计的。
  • 检索-增强生成(RAG):RAG 是一种通过首先从外部知识库检索相关数据来增强提示的系统。提示工程在 RAG 系统中至关重要,它可以正确地制定初始搜索查询和将用户问题与检索信息相结合的最终提示。

加入 Ultralytics 社区

加入人工智能的未来。与全球创新者联系、合作和成长

立即加入
链接复制到剪贴板