Встречай YOLO26: ИИ компьютерного зрения нового поколения.
Ultralytics
Назад к глоссарию Ultralytics

QLoRA

Узнай, как QLoRA (Quantized Low-Rank Adaptation) позволяет эффективно дообучать LLM на потребительских GPU с помощью 4-битной квантования для экономии памяти GPU.

QLoRA (Quantized Low-Rank Adaptation) — это передовой метод оптимизации, используемый в deep learning и предназначенный для высокоэффективной fine-tuning массивных large language models (LLMs). Впервые представленный в широко цитируемой научной статье на arXiv, QLoRA радикально снижает требования к видеопамяти GPU, необходимые для обновления моделей с миллиардами параметров.

Используя агрессивную model quantization до 4-битной точности, ты теперь можешь оптимизировать мощные базовые модели, изначально созданные такими организациями, как OpenAI или Anthropic, с помощью стандартных consumer-grade GPUs. Этот прорыв делает современные технологии generative AI доступными без необходимости в дорогостоящих серверных кластерах корпоративного уровня.

Link to this sectionКак работает QLoRA#

Основная инновация QLoRA заключается в методах экономии памяти, которые в первую очередь опираются на фундаментальные концепции, используемые в PyTorch quantization methodologies. Он вводит новый тип данных под названием 4-bit NormalFloat (NF4), который математически оптимизирован для обработки весов моделей с нормальным распределением без существенного снижения предсказательной способности сети.

Additionally, QLoRA employs a strategy known as Double Quantization, a technique recognized in broader machine learning research that quantizes the quantization constants themselves, further stripping away unnecessary memory usage. While the massive pre-trained base model remains frozen in a compressed 4-bit state, tiny trainable adapters are inserted into the network layers. When backpropagation occurs during neural network training, gradients are passed through the frozen 4-bit weights to update only these small, highly efficient adapters.

Link to this sectionQLoRA против LoRA: понимание различий#

Исследуя parameter-efficient fine-tuning (PEFT), пользователи часто задаются вопросом, чем QLoRA отличается от традиционного LoRA (Low-Rank Adaptation). Стандартный LoRA замораживает исходные веса модели и обучает матрицы низкого ранга для адаптации модели к новым данным. Однако обычно он сохраняет базовую модель в 16-битной или 32-битной точности. QLoRA делает важный шаг вперед, сжимая базовую модель до 4-битной точности перед применением адаптеров LoRA. Это радикально уменьшает объем занимаемой памяти, позволяя модели с 65 миллиардами параметров поместиться на одном GPU с 48 ГБ памяти — подвиг, математически невозможный при использовании стандартного LoRA.

Link to this sectionРеальные приложения#

  • Enterprise Chatbots and Assistants: Компании регулярно используют QLoRA для дообучения моделей с открытым исходным кодом, таких как Meta's Llama 3, на собственных бизнес-данных. Это позволяет организациям создавать высокоточные, специализированные AI-ассистенты, которые работают на локальной, безопасной инфраструктуре cloud computing без огромных затрат на оборудование.
  • Edge AI Deployments: Поскольку текстовые модели расширяются в визуальные домены через vision-language models (VLMs), QLoRA позволяет разработчикам адаптировать массивные мультимодальные архитектуры для сред с ограниченными аппаратными ресурсами. Эти легковесные оптимизации активно используются исследовательскими группами Google AI для внедрения передовых возможностей логического вывода на мобильные телефоны и удаленные датчики.

Link to this sectionЭффективное обучение в компьютерном зрении#

Философия QLoRA — максимизация математической точности при минимизации требований к оборудованию — разделяется во всех современных рабочих процессах computer vision (CV). Например, Ultralytics YOLO26 изначально разработан для эффективного обучения и мгновенного развертывания на маломощных edge-устройствах. Разработчики, работающие со сложными наборами данных визуальной информации, могут использовать Ultralytics Platform для бесшовного cloud training, которое по своей сути управляет оптимизацией памяти и размером пакета.

Ниже приведен практический пример того, как ты можешь обучить эффективную модель компьютерного зрения, используя Automatic Mixed Precision (AMP) — концепцию, тесно связанную с целями экономии памяти в QLoRA:

from ultralytics import YOLO

# Load the highly efficient Ultralytics YOLO26 nano model
model = YOLO("yolo26n.pt")

# Train the model utilizing mixed-precision (amp) to save GPU memory
# Similar to QLoRA, this optimizes hardware resources during training runs
results = model.train(data="coco8.yaml", epochs=10, imgsz=640, amp=True)

Благодаря надежной обработке данных и automatic gradient scaling algorithms, модели обучаются быстрее и легко помещаются на стандартные GPU, ускоряя путь к успешному deploying computer vision models в корпоративных производственных средах.

Explore solutions

Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.

Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.

Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.

Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.

Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.

Узнать больше
Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.

Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.

Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.

Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.

Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.

Узнать больше
Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.

Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.

Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.

Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.

Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.

Узнать больше

Давай строить будущее ИИ вместе!

Начни свой путь в будущее машинного обучения