遇见 YOLO26: 下一代视觉 AI。
Ultralytics
返回 Ultralytics 词汇表

GGUF

探索用于本地 LLM 推理的高效格式 GGUF。了解它如何让 AI 在消费级硬件上运行,并与全新的 Ultralytics Platform 集成。

GPT-Generated Unified Format (GGUF) is a highly efficient binary file format developed specifically for storing and running Large Language Models (LLMs) and other artificial intelligence architectures. Originally introduced by the open-source llama.cpp framework, GGUF enables rapid real-time inference on standard consumer hardware, including standard CPUs and Apple Silicon. By drastically reducing memory requirements through model quantization, this format makes complex generative AI accessible without requiring expensive enterprise-grade GPUs.

Link to this sectionGGUF 与 GGML 的比较#

在研究 GGUF 文件是什么时,从业者经常将其与前身 GGML 进行比较。虽然 GGML 为将语言模型引入边缘设备奠定了基础,但它在向后兼容性方面存在困难。主要区别在于,GGUF 通过为元数据利用键值结构解决了这个问题,从而确保在添加新模型功能时,旧的应用程序不会崩溃。这种结构优势允许在各种环境中平滑地进行模型部署,就像工程师评估不同的模型部署选项以确保生产系统稳定性一样。

Link to this section实际应用#

GGUF 已迅速成为本地 AI 开发的标准。以下是它在当今被利用的两种具体方式:

  • 使用 Ollama 进行本地 LLM 执行: 一个广泛的用例是将 GGUF 与 Ollama 结合使用,这是一款简化本地运行开放权重模型的轻量级应用程序。通过加载 GGUF 模型,开发者可以构建完全离线运行的隐私优先对话代理,这对安全的边缘计算应用非常有益。
  • 通过 ComfyUI 进行图像生成: 在视觉 AI 领域,社区已大量采用用于 GGUF 的 ComfyUI UNet 加载器来运行大型扩散模型。这一创新使创作者能够在显存较低的消费级硬件上生成高质量图像,无缝弥合了文本驱动的机器学习模型与构建在 PyTorchTensorFlow 等结构化库之上的视觉生成流水线之间的差距。

Link to this section技术实现与代码示例#

Loading and interacting with a GGUF file programmatically is straightforward using the llama-cpp-python library. Similar to how you would initialize a state-of-the-art computer vision model like Ultralytics YOLO26 using a dedicated inference engine, GGUF models can be loaded directly into memory for immediate task execution.

from llama_cpp import Llama

# Load a quantized GGUF model for local CPU or GPU inference
llm = Llama(model_path="./model-q4_k_m.gguf", n_ctx=2048)

# Generate a response based on a prompt
output = llm("What is edge AI?", max_tokens=32)

# Print the generated text
print(output["choices"][0]["text"])

Link to this section未来展望与优化#

OpenAIAnthropic 的前沿研究到开源开发者社区,整个 AI 行业都在不断突破推理效率的极限。对于那些同时处理文本和视觉模态的工作者来说,高效地管理这些经过深度优化的模型至关重要。使用像 Ultralytics Platform 这样的端到端 MLOps 系统,可以确保开发者处理从自动数据集标注和云端训练到最终部署阶段的所有流程,从而最大限度地发挥现代边缘 AI 应用的性能。

若想了解这些语言架构在大规模下如何运作的更多基础技术背景,请考虑阅读 大语言模型的 Wikipedia 页面 或探索官方 vLLM 文档 中概述的高级服务机制。

Explore solutions

Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。
了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。
了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。
了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。
了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。
了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。
了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。
了解更多
Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。
了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。
了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。
了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。
了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。
了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。
了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。
了解更多
Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。
了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。
了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。
了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。
了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。
了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。
了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。
了解更多

让我们一起构建 AI 的未来!

开启你的机器学习未来之旅