深圳Yolo 视觉
深圳
立即加入
词汇表

提示工程

掌握提示工程的艺术,指导 LLM 等 AI 模型,在内容、客户服务等领域实现精确、高质量的输出。

提示工程是对输入文本(即提示)进行结构化和优化的战略过程,以有效地 引导 人工智能 (AI)模型 生成特定的高质量输出。虽然最初是由 大型语言模型(LLM),如 GPT-4 等大型语言模型(LLM)的兴起而得到普及,但这一学科已发展成为与各种生成系统交互的关键技能。 与各种生成系统交互的关键技能。它包括理解模型如何解释语言的细微差别、 语境和指令,从而弥合人类意图与机器执行之间的差距。通过精心选词 格式限制并提供上下文,用户就能显著提高人工智能生成式响应的准确性和相关性,而无需修改其内容。 生成式人工智能响应的准确性和相关性。 模型的基本参数。

有效提示的机制

提示工程的核心原理是,人工智能模型对输入的措辞和结构非常敏感。 输入。精心设计的提示语通常包含旨在减少歧义的特定组件。其中包括 明确的指令、相关背景信息(上下文)和输出规范,如格式--例如,以 JS 格式请求响应。 例如,要求以JSON或列表形式作出回应。 高级技术包括少量学习、 用户在提示中提供所需的输入输出对的示例,以指导模型的推理。 另一种强大的方法是 思维链提示 这种方法鼓励模型将复杂问题分解成中间推理步骤,从而提高逻辑繁重任务的性能。 谷歌研究 Google 研究 出版物中详细介绍的。

在计算机视觉中的相关性

提示工程通常与文本生成相关联,但在计算机视觉(CV)领域却越来越重要。 计算机视觉(CV)。现代 多模式模型和开放词汇检测器、 例如YOLO,允许用户使用自然语言而不是预先定义的类 ID 目标,而不是使用预定义的类别 ID。在这种情况下,"提示 "是对物体的文本 例如,"红色头盔 "与 "头盔")。这种功能通常被称为 零镜头学习,使模型能够detect 只需处理文本提示和视觉特征之间的语义关系。 和视觉特征之间的语义关系。

下面的示例演示了如何使用 ultralytics 包,为 物体检测:

from ultralytics import YOLO

# Load a YOLO-World model capable of interpreting text prompts
model = YOLO("yolo-world.pt")

# Use prompt engineering to define custom classes without retraining
# The model aligns these text descriptions with visual features
model.set_classes(["person in safety vest", "forklift", "cardboard box"])

# Run inference on an image to detect the prompted objects
results = model.predict("warehouse.jpg")

实际应用

及时工程的实用性横跨各行各业,提高了自动化和创造力:

  • 自动生成内容:在营销和媒体领域,专业人员使用详细的提示来指导 文字图片生成器,如 Midjourney稳定扩散。描述照明、艺术风格和构图的具体提示 照明、艺术风格和构图的具体提示,可让设计师快速创建视觉资产原型,从而节省时间。 节省时间。
  • 智能客户支持:公司部署 由 LLM 支持的聊天机器人来处理客户咨询。 工程师会精心设计 "系统提示",确定机器人的角色(例如,"您是一位乐于助人的技术支持助理"),设定界限以防产生幻觉,并指示人工智能从对话框中检索答案。 例如,"您是一位乐于助人的技术支持助理"),设置界限以防止幻觉,并指示人工智能从特定的知识库中检索答案。 特定知识库中获取答案。

区分相关概念

必须将提示工程与机器学习领域的类似术语区分开来:

  • 提示工程与提示调整 提示工程涉及人工制作自然语言查询。相比之下,提示调整是一种 在训练阶段学习软嵌入(数字向量 嵌入(数字向量),以优化模型输入。 以优化模型输入,这通常是人类用户看不到的。
  • 及时工程与微调 微调 模型权重。 提示工程不会改变模型本身;它只是在实时推理过程中优化输入。 实时推理
  • 及时工程与 RAG RAG 检索-增强生成(RAG)是一种系统架构,它通过获取外部数据来确定模型的 响应。提示工程是 RAG使用的一种技术,用于正确格式化检索到的数据,并将其 将其提交给 LLM 进行处理。

加入Ultralytics 社区

加入人工智能的未来。与全球创新者联系、协作和共同成长

立即加入