及时充实
通过及时强化掌握人工智能!使用上下文、清晰的说明和示例来增强大型语言模型的输出,从而获得精确的结果。
提示丰富化是指在将用户的初始提示发送给人工智能模型 (尤其是大语言模型(LLM))之前,以编程方式为其添加相关上下文或信息的自动化过程。其目的是将简单或含糊的用户查询转化为详细、具体且能感知上下文的指令。这一预处理步骤可以帮助人工智能模型更好地理解用户的意图,从而在不改变模型本身的情况下,大大提高响应的准确性、个性化和实用性。
即时充实如何运作
提示丰富功能是一个智能中间件层。当用户提交查询时,自动系统会截获该查询。然后,该系统会从各种来源收集上下文数据,如用户配置文件、对话历史、会话数据(如设备类型或位置)或外部数据库。然后,它将这些信息动态地注入到原始提示中。由此产生的 "丰富 "提示现在包含了用户的查询和添加的上下文,最后被传递给 LLM 进行处理。这提高了模型执行复杂自然语言理解(NLU)任务的能力。
实际应用
- 个性化客户支持:用户与电子商务聊天机器人互动,输入 "我的包裹在哪里?提示丰富化系统可以自动从客户关系管理数据库中获取用户的账户详情及其最近的订单号。发送给模型的提示就变成了"客户 ID 98765 正在询问其最新订单 #ABC-12345 的状态。用户的原始查询:'我的包裹在哪里?我的包裹在哪里?这样,人工智能驱动的客服人员就可以提供即时、具体的更新信息,而不是询问澄清信息。
- 更智能的内容推荐:流媒体服务的用户说:"推荐一部电影"。这对于一个好的推荐来说太模糊了。丰富流程可以利用用户的观看历史、他们所陈述的类型偏好和一天中的时间等数据来增强这一提示。最终的提示可能是这样的"用户最近喜欢科幻惊悚片和历史剧。现在是星期六晚上。请推荐一部符合这些条件的电影"。这样,推荐系统就会给出更相关的建议,并通过个性化改善用户体验。
提示丰富与相关概念
重要的是要将及时充实与类似术语区分开来:
- 及时工程:这是一门设计有效提示的广泛学科。提示丰富化是提示工程中一种特定的自动化技术,其重点是为用户输入添加动态上下文。
- 检索-增强生成(RAG):Retrieval-Augmented Generation (RAG):RAG 是一种功能强大的特定提示增强类型。它专门从外部知识库中检索事实信息,为模型的输出提供基础,防止产生幻觉。虽然 RAG 是一种丰富形式,但丰富也可以使用其他上下文来源,如用户会话数据,这些数据不属于静态知识库的一部分。
- 提示连锁:这种技术将任务分解为一连串相互关联的多个提示,其中一个提示的输出为下一个提示提供信息。相比之下,"丰富"则是在处理前修改单个提示。提示丰富步骤可以是一个更大的链条的一部分,通常作为初始步骤。其他技术,如 "思维链"(CoT)提示技术,侧重于在单次交互中改进推理。
- 提示调整:这是一种模型训练方法。作为一种参数高效微调(PEFT)技术,它通过训练一小组新参数来调整模型的行为。提示充实是一种推理时技术,可操作输入查询,但不会改变模型的权重。
虽然这种方法在自然语言处理(NLP)中最为常见,但其核心思想适用于所有机器学习领域。在计算机视觉领域,类似的概念可能涉及在图像中添加元数据(如位置、时间),以提高Ultralytics YOLO11等模型在物体检测任务中的性能。像Ultralytics HUB这样的MLOps 平台提供了强大的模型部署所需的基础设施,在这些平台上,可以使用LangChain或LlamaIndex等丰富和框架来实现复杂的输入管道。