遇见 YOLO26: 下一代视觉 AI。
Ultralytics
返回 Ultralytics 词汇表

QLoRA

了解 QLoRA (Quantized Low-Rank Adaptation) 如何通过 4-bit 量化技术在消费级 GPU 上实现高效的 LLM 微调,从而节省 GPU 显存。

QLoRA (Quantized Low-Rank Adaptation) is an advanced optimization technique used in deep learning designed to make the fine-tuning of massive large language models (LLMs) highly efficient. First introduced in a widely cited research paper on arXiv, QLoRA drastically reduces the GPU memory requirements needed to update models containing billions of parameters.

By leveraging aggressive model quantization down to 4-bit precision, developers can now optimize powerful foundation models originally created by organizations like OpenAI or Anthropic using standard consumer-grade GPUs. This breakthrough democratizes access to state-of-the-art generative AI without demanding expensive, enterprise-level server clusters.

Link to this sectionQLoRA 的工作原理#

QLoRA 的核心创新在于其节省内存的技术,这些技术主要建立在 PyTorch 量化方法的基础概念之上。它引入了一种名为 4-bit NormalFloat (NF4) 的新型数据类型,该类型经过数学优化,可在不严重降低网络预测能力的前提下处理正态分布的模型权重。

Additionally, QLoRA employs a strategy known as Double Quantization, a technique recognized in broader machine learning research that quantizes the quantization constants themselves, further stripping away unnecessary memory usage. While the massive pre-trained base model remains frozen in a compressed 4-bit state, tiny trainable adapters are inserted into the network layers. When backpropagation occurs during neural network training, gradients are passed through the frozen 4-bit weights to update only these small, highly efficient adapters.

Link to this sectionQLoRA 与 LoRA:理解两者区别#

在探索参数高效微调 (PEFT) 时,用户经常会好奇 QLoRA 与传统的 LoRA (Low-Rank Adaptation) 有何不同。标准的 LoRA 会冻结原始模型权重,并训练低秩矩阵以使模型适应新数据,但通常会将基础模型保留在 16-bit 或 32-bit 精度下。QLoRA 在此基础上更进了一步,在应用 LoRA 适配器之前将基础模型压缩至 4-bit 精度。这极大地缩小了内存占用,使 650 亿参数的模型能够运行在单个 48GB GPU 上——这在标准 LoRA 中是数学上不可能实现的。

Link to this section实际应用#

  • 企业级聊天机器人和助手 各大公司经常使用 QLoRA 在专有业务数据上微调像 Meta's Llama 3 这样的开源模型。这使组织能够构建高度准确、特定领域的 AI 助手,在本地、安全的云计算基础设施上运行,而无需承担高昂的硬件成本。
  • 边缘 AI 部署 随着基于文本的模型通过视觉-语言模型 (VLMs) 扩展到视觉领域,QLoRA 使开发者能够为硬件受限的环境定制大规模多模态架构。这些轻量级优化被 Google AI 的研究团队广泛使用,旨在将先进的推理能力引入手机和远程传感器中。

Link to this section计算机视觉中的高效训练#

QLoRA 的底层哲学——在最小化硬件需求的同时最大化数学精度——在现代计算机视觉 (CV) 工作流程中是通用的。例如,Ultralytics YOLO26 天生就被设计为能够高效学习并即时部署到低功耗边缘设备上。使用复杂视觉数据集的开发者可以利用 Ultralytics Platform 进行无缝的云端训练,该平台本身就能处理内存优化和批量大小调整。

以下是一个实际示例,展示了如何使用自动混合精度 (AMP) 来训练高效的视觉模型,这是一个与 QLoRA 的内存节省目标密切相关的概念:

from ultralytics import YOLO

# Load the highly efficient Ultralytics YOLO26 nano model
model = YOLO("yolo26n.pt")

# Train the model utilizing mixed-precision (amp) to save GPU memory
# Similar to QLoRA, this optimizes hardware resources during training runs
results = model.train(data="coco8.yaml", epochs=10, imgsz=640, amp=True)

通过依赖强大的数据处理和自动梯度缩放算法,模型训练速度更快,且能轻松适配标准 GPU,从而加速了在企业生产环境中成功部署计算机视觉模型的进程。

Explore solutions

Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。

了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。

了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。

了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。

了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。

了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。

了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。

了解更多
Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。

了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。

了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。

了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。

了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。

了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。

了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。

了解更多
Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。

了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。

了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。

了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。

了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。

了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。

了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。

了解更多

让我们一起构建 AI 的未来!

开启你的机器学习未来之旅