掌握提示工程的艺术,指导 LLM 等 AI 模型,在内容、客户服务等领域实现精确、高质量的输出。
提示工程是对输入文本(即提示)进行结构化和优化的战略过程,以有效地 引导 人工智能 (AI)模型 生成特定的高质量输出。虽然最初是由 大型语言模型(LLM),如 GPT-4 等大型语言模型(LLM)的兴起而得到普及,但这一学科已发展成为与各种生成系统交互的关键技能。 与各种生成系统交互的关键技能。它包括理解模型如何解释语言的细微差别、 语境和指令,从而弥合人类意图与机器执行之间的差距。通过精心选词 格式限制并提供上下文,用户就能显著提高人工智能生成式响应的准确性和相关性,而无需修改其内容。 生成式人工智能响应的准确性和相关性。 模型的基本参数。
提示工程的核心原理是,人工智能模型对输入的措辞和结构非常敏感。 输入。精心设计的提示语通常包含旨在减少歧义的特定组件。其中包括 明确的指令、相关背景信息(上下文)和输出规范,如格式--例如,以 JS 格式请求响应。 例如,要求以JSON或列表形式作出回应。 高级技术包括少量学习、 用户在提示中提供所需的输入输出对的示例,以指导模型的推理。 另一种强大的方法是 思维链提示 这种方法鼓励模型将复杂问题分解成中间推理步骤,从而提高逻辑繁重任务的性能。 谷歌研究 Google 研究 出版物中详细介绍的。
提示工程通常与文本生成相关联,但在计算机视觉(CV)领域却越来越重要。 计算机视觉(CV)。现代 多模式模型和开放词汇检测器、 例如YOLO,允许用户使用自然语言而不是预先定义的类 ID 目标,而不是使用预定义的类别 ID。在这种情况下,"提示 "是对物体的文本 例如,"红色头盔 "与 "头盔")。这种功能通常被称为 零镜头学习,使模型能够detect 只需处理文本提示和视觉特征之间的语义关系。 和视觉特征之间的语义关系。
下面的示例演示了如何使用
ultralytics 包,为
物体检测:
from ultralytics import YOLO
# Load a YOLO-World model capable of interpreting text prompts
model = YOLO("yolo-world.pt")
# Use prompt engineering to define custom classes without retraining
# The model aligns these text descriptions with visual features
model.set_classes(["person in safety vest", "forklift", "cardboard box"])
# Run inference on an image to detect the prompted objects
results = model.predict("warehouse.jpg")
及时工程的实用性横跨各行各业,提高了自动化和创造力:
必须将提示工程与机器学习领域的类似术语区分开来: