Découvre YOLO26 : l'IA de vision de nouvelle génération.
Ultralytics
Retour au glossaire Ultralytics

QLoRA

Découvre comment QLoRA (Quantized Low-Rank Adaptation) permet un fine-tuning efficace des LLM sur des GPU grand public en utilisant la quantification 4 bits pour économiser la mémoire GPU.

QLoRA (Quantized Low-Rank Adaptation) est une technique d'optimisation avancée utilisée en deep learning conçue pour rendre le fine-tuning de large language models (LLMs) massifs très efficace. Introduite pour la première fois dans un research paper on arXiv largement cité, QLoRA réduit considérablement les besoins en mémoire GPU nécessaires pour mettre à jour des modèles contenant des milliards de paramètres.

En exploitant une model quantization agressive jusqu'à une précision de 4 bits, tu peux désormais optimiser de puissants modèles de base créés à l'origine par des organisations comme OpenAI ou Anthropic en utilisant des consumer-grade GPUs standard. Cette percée démocratise l'accès à l'generative AI de pointe sans nécessiter de clusters de serveurs coûteux au niveau de l'entreprise.

Link to this sectionComment fonctionne QLoRA#

L'innovation principale de QLoRA réside dans ses techniques d'économie de mémoire, principalement basées sur les concepts fondamentaux trouvés dans les PyTorch quantization methodologies. Elle introduit un nouveau type de données appelé 4-bit NormalFloat (NF4), qui est mathématiquement optimisé pour gérer des poids de modèle normalement distribués sans dégrader fortement les capacités prédictives du réseau.

De plus, QLoRA utilise une stratégie appelée Double Quantization, une technique reconnue dans la machine learning research plus large qui quantifie les constantes de quantification elles-mêmes, réduisant encore plus l'utilisation inutile de la mémoire. Alors que le modèle de base pré-entraîné massif reste gelé dans un état compressé de 4 bits, de minuscules adaptateurs entraînables sont insérés dans les couches du réseau. Lorsque la backpropagation se produit pendant le neural network training, les gradients sont transmis à travers les poids gelés en 4 bits pour ne mettre à jour que ces petits adaptateurs très efficaces.

Link to this sectionQLoRA vs. LoRA : Comprendre les différences#

Lors de l'exploration du parameter-efficient fine-tuning (PEFT), les utilisateurs se demandent souvent en quoi QLoRA diffère du LoRA (Low-Rank Adaptation) traditionnel. Le LoRA standard gèle les poids du modèle original et entraîne des matrices de bas rang pour adapter le modèle aux nouvelles données. Cependant, il conserve généralement le modèle de base en précision 16 bits ou 32 bits. QLoRA va encore plus loin en compressant le modèle de base en précision 4 bits avant d'appliquer les adaptateurs LoRA. Cela réduit considérablement l'empreinte mémoire, permettant à un modèle de 65 milliards de paramètres de tenir sur un seul GPU de 48 Go — un exploit mathématiquement impossible avec le LoRA standard.

Link to this sectionApplications concrètes#

  • Enterprise Chatbots and Assistants : Les entreprises utilisent régulièrement QLoRA pour affiner des modèles open-source comme Meta's Llama 3 sur des données commerciales propriétaires. Cela permet aux organisations de créer des assistants IA spécialisés et très précis qui fonctionnent sur une infrastructure de cloud computing locale et sécurisée sans coûts matériels exorbitants.
  • Edge AI Deployments : À mesure que les modèles textuels s'étendent aux domaines visuels via les vision-language models (VLMs), QLoRA permet aux développeurs d'adapter des architectures multimodales massives pour des environnements aux ressources matérielles limitées. Ces optimisations légères sont largement utilisées par les équipes de recherche de Google AI pour apporter des capacités de raisonnement avancées aux téléphones portables et aux capteurs distants.

Link to this sectionEntraînement efficace en computer vision#

La philosophie sous-jacente de QLoRA — maximiser la précision mathématique tout en minimisant les exigences matérielles — est partagée dans les flux de travail modernes de computer vision (CV). Par exemple, Ultralytics YOLO26 est conçu nativement pour apprendre efficacement et se déployer instantanément sur des appareils de périphérie (edge) à faible consommation. Les développeurs travaillant avec des jeux de données de vision complexes peuvent tirer parti de l'Ultralytics Platform pour un cloud training fluide, qui gère intrinsèquement l'optimisation de la mémoire et la taille des lots (batch sizing).

Voici un exemple pratique de la façon dont tu peux entraîner un modèle de vision efficace en utilisant l'Automatic Mixed Precision (AMP), un concept étroitement lié aux objectifs d'économie de mémoire de QLoRA :

from ultralytics import YOLO

# Load the highly efficient Ultralytics YOLO26 nano model
model = YOLO("yolo26n.pt")

# Train the model utilizing mixed-precision (amp) to save GPU memory
# Similar to QLoRA, this optimizes hardware resources during training runs
results = model.train(data="coco8.yaml", epochs=10, imgsz=640, amp=True)

En s'appuyant sur une gestion robuste des données et des automatic gradient scaling algorithms, les modèles s'entraînent plus rapidement et tiennent facilement sur des GPU standard, accélérant ainsi la voie vers le deploying computer vision models réussi dans les environnements de production d'entreprise.

Explore solutions

Real-time AI that works with your team

IA dans la robotique

Équipe tes machines plus intelligentes avec les modèles Ultralytics YOLO. La vision par IA dans la robotique propulse la navigation autonome, la perception, le suivi d'objets et le contrôle en temps réel.

En savoir plus
Real-time AI that works with your team

IA dans la logistique

Simplifie la logistique avec les modèles Ultralytics YOLO. La vision par IA permet l'inspection des colis, le tri, le suivi des véhicules et la surveillance de la sécurité des entrepôts en temps réel.

En savoir plus
Real-time AI that works with your team

IA dans le commerce de détail

Réinvente le commerce de détail avec les modèles Ultralytics YOLO. La vision par IA alimente le suivi des stocks, la surveillance des étagères, la gestion des files d'attente et des informations plus intelligentes sur les clients.

En savoir plus
Real-time AI that works with your team

IA dans la santé

Construis des solutions de santé avec les modèles Ultralytics YOLO. L'IA de vision dans la santé permet une imagerie médicale plus rapide, des diagnostics plus intelligents et une surveillance des patients.

En savoir plus
Real-time AI that works with your team

IA dans la fabrication

Optimise la fabrication avec les modèles Ultralytics YOLO. La vision par IA favorise le contrôle qualité, la détection des défauts, la conformité aux EPI et l'automatisation des chaînes de montage.

En savoir plus
Real-time AI that works with your operation

IA dans l'automobile

Applique la vision par ordinateur dans l'automobile avec les modèles Ultralytics YOLO. L'IA de vision améliore la sécurité routière, l'assistance à la conduite et l'automatisation des véhicules pour des routes plus intelligentes.

En savoir plus
Real-time AI tailored to your operation

IA en agriculture

Intègre l'IA de vision à l'agriculture intelligente avec les modèles Ultralytics YOLO. Optimise la surveillance des cultures, le suivi du bétail et l'agriculture de précision pour des rendements plus élevés et plus intelligents.

En savoir plus
Real-time AI that works with your team

IA dans la robotique

Équipe tes machines plus intelligentes avec les modèles Ultralytics YOLO. La vision par IA dans la robotique propulse la navigation autonome, la perception, le suivi d'objets et le contrôle en temps réel.

En savoir plus
Real-time AI that works with your team

IA dans la logistique

Simplifie la logistique avec les modèles Ultralytics YOLO. La vision par IA permet l'inspection des colis, le tri, le suivi des véhicules et la surveillance de la sécurité des entrepôts en temps réel.

En savoir plus
Real-time AI that works with your team

IA dans le commerce de détail

Réinvente le commerce de détail avec les modèles Ultralytics YOLO. La vision par IA alimente le suivi des stocks, la surveillance des étagères, la gestion des files d'attente et des informations plus intelligentes sur les clients.

En savoir plus
Real-time AI that works with your team

IA dans la santé

Construis des solutions de santé avec les modèles Ultralytics YOLO. L'IA de vision dans la santé permet une imagerie médicale plus rapide, des diagnostics plus intelligents et une surveillance des patients.

En savoir plus
Real-time AI that works with your team

IA dans la fabrication

Optimise la fabrication avec les modèles Ultralytics YOLO. La vision par IA favorise le contrôle qualité, la détection des défauts, la conformité aux EPI et l'automatisation des chaînes de montage.

En savoir plus
Real-time AI that works with your operation

IA dans l'automobile

Applique la vision par ordinateur dans l'automobile avec les modèles Ultralytics YOLO. L'IA de vision améliore la sécurité routière, l'assistance à la conduite et l'automatisation des véhicules pour des routes plus intelligentes.

En savoir plus
Real-time AI tailored to your operation

IA en agriculture

Intègre l'IA de vision à l'agriculture intelligente avec les modèles Ultralytics YOLO. Optimise la surveillance des cultures, le suivi du bétail et l'agriculture de précision pour des rendements plus élevés et plus intelligents.

En savoir plus
Real-time AI that works with your team

IA dans la robotique

Équipe tes machines plus intelligentes avec les modèles Ultralytics YOLO. La vision par IA dans la robotique propulse la navigation autonome, la perception, le suivi d'objets et le contrôle en temps réel.

En savoir plus
Real-time AI that works with your team

IA dans la logistique

Simplifie la logistique avec les modèles Ultralytics YOLO. La vision par IA permet l'inspection des colis, le tri, le suivi des véhicules et la surveillance de la sécurité des entrepôts en temps réel.

En savoir plus
Real-time AI that works with your team

IA dans le commerce de détail

Réinvente le commerce de détail avec les modèles Ultralytics YOLO. La vision par IA alimente le suivi des stocks, la surveillance des étagères, la gestion des files d'attente et des informations plus intelligentes sur les clients.

En savoir plus
Real-time AI that works with your team

IA dans la santé

Construis des solutions de santé avec les modèles Ultralytics YOLO. L'IA de vision dans la santé permet une imagerie médicale plus rapide, des diagnostics plus intelligents et une surveillance des patients.

En savoir plus
Real-time AI that works with your team

IA dans la fabrication

Optimise la fabrication avec les modèles Ultralytics YOLO. La vision par IA favorise le contrôle qualité, la détection des défauts, la conformité aux EPI et l'automatisation des chaînes de montage.

En savoir plus
Real-time AI that works with your operation

IA dans l'automobile

Applique la vision par ordinateur dans l'automobile avec les modèles Ultralytics YOLO. L'IA de vision améliore la sécurité routière, l'assistance à la conduite et l'automatisation des véhicules pour des routes plus intelligentes.

En savoir plus
Real-time AI tailored to your operation

IA en agriculture

Intègre l'IA de vision à l'agriculture intelligente avec les modèles Ultralytics YOLO. Optimise la surveillance des cultures, le suivi du bétail et l'agriculture de précision pour des rendements plus élevés et plus intelligents.

En savoir plus

Construisons ensemble le futur de l'IA !

Commence ton aventure avec le futur de l'apprentissage automatique