掌握提示工程的艺术,指导 LLM 等人工智能模型在内容、客户服务等方面实现精确、高质量的输出。
提示工程是一门艺术和科学,它通过精心设计有效的输入(提示)来引导人工智能(AI)模型,尤其是大型语言模型(LLM),从而生成所需的输出结果。这包括了解这些模型如何解释指令,并反复设计清晰、具体并提供足够上下文的提示,以获得准确、相关和有用的响应。随着人工智能模型越来越多地集成到各种工具和工作流程中,掌握提示工程对于最大限度地发挥它们的潜力以及确保在从简单的问题解答到复杂的创意文本生成等任务中的可靠性能至关重要。
有效的提示工程通常是一个反复的过程。首先要分析任务需求,了解目标人工智能模型的能力和局限性。然后,工程师设计初始提示,进行测试,评估输出结果,并根据结果完善提示。这种改进可能包括添加更具体的指令、提供示例(少量学习)、定义所需的输出格式(如JSON)、设置限制或调整语气。关键技术通常借鉴自然语言处理 (NLP)的原理,需要仔细考虑措辞如何影响模型的行为,并受其训练数据和架构的影响,例如著名的《注意力就是你所需要的一切》论文中描述的Transformer模型。
提示工程通常采用几种策略:
及时的工程设计是成功部署许多人工智能应用的基础:
将及时工程与相关术语区分开来是很有用的:
这些技术虽然各不相同,但可以相互补充。例如,在使用微调模型进行处理之前,精心设计的基础提示可能会自动使用检索到的数据进行丰富。像LangChain这样的框架通常会整合这些不同的方法。
与 NLP 相比,提示工程在计算机视觉(CV)领域的地位一直不太突出,但随着多模态模型和可提示视觉系统的兴起,提示工程正变得越来越重要。CLIP、YOLO-World 或YOLOE等模型可以根据文本描述执行物体检测或图像分割等任务。制作有效的文本提示(例如,"检测所有'红色汽车',但忽略'卡车'")是一种提示工程,对于指导这些视觉语言模型至关重要。Ultralytics HUB等平台可促进与各种模型(包括YOLOv8和YOLO11 等Ultralytics YOLO模型)的交互,通过接口定义任务可受益于提示工程原则,尤其是当模型获得更多交互能力时。