遇见 YOLO26: 下一代视觉 AI。
Ultralytics
返回 Ultralytics 词汇表

Prompt Compression

探索提示词压缩如何优化 AI 效率。立即通过 Ultralytics YOLO26 学习如何减少 LLM Token 使用量、降低成本并提升推理速度。

提示词压缩是一种先进的优化技术,旨在减少提供给 大型语言模型 (LLMs)多模态模型 的输入文本的长度与复杂度。通过以算法方式剔除冗余词汇、无关上下文和停用词,同时保留核心语义,提示词压缩使 AI 系统能够更高效地处理信息。这种方法对于最小化计算成本、减少 推理延迟 以及防止模型超过其最大 上下文窗口 变得越来越关键。

Link to this section提示词压缩的工作原理#

在架构层面,提示词压缩通常利用较小的专用模型或信息论算法来评估给定提示词中每个 Token 的重要性。Token 合并与基于熵的剪枝 等技术可以识别并移除对整体语义贡献极小的 Token。这确保了最终输入仅包含最密集的信息。

来自权威机构的最新研究强调,高度压缩的提示词在处理复杂推理任务时仍能保持性能,同时显著降低 Token 消耗。对于将 AI 集成到可扩展应用中的开发者而言,遵循 OpenAI 的提示词优化指南 并利用压缩框架是高效部署的标准最佳实践。

Link to this section实际应用#

提示词压缩在需要快速处理大量文本或视觉数据的场景中具有直接价值:

  • 检索增强生成 (RAG) 在企业搜索应用中,RAG 流水线通常会检索数十份长文档来回答用户的单个查询。提示词压缩算法会压缩这些检索到的文档,在将其输入生成模型之前将其提炼为简洁的事实摘要。这防止了 Token 溢出并加速了 实时推理
  • 自动 AI 代理 代理和 聊天机器人 必须保持用户交互的长期记忆。与其将整个对话历史记录输入到每个新查询中,压缩技术会总结较早的对话轮次,确保代理在不产生指数级计算成本的情况下保持上下文感知能力。

Link to this section提示词压缩与相关技术的对比#

为了构建健壮的 机器学习运维 (MLOps) 流水线,区分提示词压缩与相关概念非常重要:

  • 提示词缓存 的区别: 缓存存储了先前处理过的文本的内部计算状态,以避免重新计算。而压缩则是在任何处理发生之前,主动修改并缩短输入文本本身。
  • 提示词工程 的区别: 提示词工程是人工设计有效指令的技艺。压缩则是对这些指令的自动化、算法化缩减。
  • 提示词增强 的区别: 增强通过添加外部上下文来扩充提示词,而压缩则会减少它。它们通常结合使用:系统可能会使用数据库结果来增强提示词,然后在推理之前压缩最终的有效载荷。

Link to this section在计算机视觉中的实现#

计算机视觉 (CV) 中,当使用接受文本查询来识别对象的开放词汇模型时,提示词压缩原则同样适用。保持类描述的简洁性可以确保更快的文本编码并减少内存开销。

对于速度至关重要的固定类别生产环境,开发者通常会从文本提示模型过渡到高度优化的固定架构模型,例如 Ultralytics YOLO26。你可以使用 Ultralytics 平台 高效管理数据集并训练这些最先进的模型。

from ultralytics import YOLO

# Load an open-vocabulary YOLO-World model
model = YOLO("yolov8s-world.pt")

# Principle of prompt compression: Use concise, distilled class names
# instead of lengthy, complex descriptions for faster text encoding
compressed_prompts = ["helmet", "vest", "forklift"]
model.set_classes(compressed_prompts)

# Run inference with the optimized class list
results = model.predict("https://ultralytics.com/images/bus.jpg")
results[0].show()

Explore solutions

Real-time AI tailored to your operation

农业中的 AI

利用 Ultralytics YOLO 模型将视觉 AI 引入智慧农业。为农作物监测、牲畜追踪和精准农业提供支持,实现更高、更智能的产量。

了解详情
Real-time AI that works with your operation

汽车领域的 AI

利用 Ultralytics YOLO 模型将计算机视觉应用于汽车领域。视觉 AI 能提升道路安全、驾驶辅助和车辆自动化水平,从而打造更智能的道路。

了解详情
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗解决方案。医疗保健中的视觉 AI 可加速医学影像处理、实现更智能的诊断并改善患者监护。

了解详情
Real-time AI that works with your team

零售业中的AI

利用Ultralytics YOLO模型重塑零售业。视觉AI助力库存追踪、货架监控、排队管理和更智能的客户洞察。

了解详情
Real-time AI that works with your team

机器人领域的 AI

利用 Ultralytics YOLO 模型为更智能的机器提供动力。机器人领域的视觉 AI 可驱动自主导航、感知、物体跟踪和实时控制。

了解详情
Real-time AI that works with your team

制造业中的 AI

利用 Ultralytics YOLO 模型优化制造业。视觉 AI 助力质量控制、缺陷检测、PPE 合规性监控以及装配线自动化。

了解详情
Real-time AI that works with your team

物流中的 AI

利用 Ultralytics YOLO 模型简化物流。视觉 AI 支持包裹检测、分类、车辆追踪和实时仓库安全监控。

了解详情
Real-time AI tailored to your operation

农业中的 AI

利用 Ultralytics YOLO 模型将视觉 AI 引入智慧农业。为农作物监测、牲畜追踪和精准农业提供支持,实现更高、更智能的产量。

了解详情
Real-time AI that works with your operation

汽车领域的 AI

利用 Ultralytics YOLO 模型将计算机视觉应用于汽车领域。视觉 AI 能提升道路安全、驾驶辅助和车辆自动化水平,从而打造更智能的道路。

了解详情
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗解决方案。医疗保健中的视觉 AI 可加速医学影像处理、实现更智能的诊断并改善患者监护。

了解详情
Real-time AI that works with your team

零售业中的AI

利用Ultralytics YOLO模型重塑零售业。视觉AI助力库存追踪、货架监控、排队管理和更智能的客户洞察。

了解详情
Real-time AI that works with your team

机器人领域的 AI

利用 Ultralytics YOLO 模型为更智能的机器提供动力。机器人领域的视觉 AI 可驱动自主导航、感知、物体跟踪和实时控制。

了解详情
Real-time AI that works with your team

制造业中的 AI

利用 Ultralytics YOLO 模型优化制造业。视觉 AI 助力质量控制、缺陷检测、PPE 合规性监控以及装配线自动化。

了解详情
Real-time AI that works with your team

物流中的 AI

利用 Ultralytics YOLO 模型简化物流。视觉 AI 支持包裹检测、分类、车辆追踪和实时仓库安全监控。

了解详情
Real-time AI tailored to your operation

农业中的 AI

利用 Ultralytics YOLO 模型将视觉 AI 引入智慧农业。为农作物监测、牲畜追踪和精准农业提供支持,实现更高、更智能的产量。

了解详情
Real-time AI that works with your operation

汽车领域的 AI

利用 Ultralytics YOLO 模型将计算机视觉应用于汽车领域。视觉 AI 能提升道路安全、驾驶辅助和车辆自动化水平,从而打造更智能的道路。

了解详情
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗解决方案。医疗保健中的视觉 AI 可加速医学影像处理、实现更智能的诊断并改善患者监护。

了解详情
Real-time AI that works with your team

零售业中的AI

利用Ultralytics YOLO模型重塑零售业。视觉AI助力库存追踪、货架监控、排队管理和更智能的客户洞察。

了解详情
Real-time AI that works with your team

机器人领域的 AI

利用 Ultralytics YOLO 模型为更智能的机器提供动力。机器人领域的视觉 AI 可驱动自主导航、感知、物体跟踪和实时控制。

了解详情
Real-time AI that works with your team

制造业中的 AI

利用 Ultralytics YOLO 模型优化制造业。视觉 AI 助力质量控制、缺陷检测、PPE 合规性监控以及装配线自动化。

了解详情
Real-time AI that works with your team

物流中的 AI

利用 Ultralytics YOLO 模型简化物流。视觉 AI 支持包裹检测、分类、车辆追踪和实时仓库安全监控。

了解详情

让我们一起构建 AI 的未来!

开启你的机器学习未来之旅