Découvre YOLO26 : l'IA de vision de nouvelle génération.
Ultralytics
Retour au glossaire Ultralytics

Quantization-Aware Training (QAT)

Apprends comment l'entraînement conscient de la quantification (QAT) optimise les modèles Ultralytics YOLO26 pour le déploiement en périphérie. Découvre comment maintenir une haute précision avec la précision INT8.

L'entraînement conscient de la quantification (QAT, ou Quantization-Aware Training) est une technique spécialisée utilisée durant la phase d'entraînement des modèles de machine learning pour les préparer à des environnements de plus basse précision. Dans les flux de travail standard de deep learning, les modèles fonctionnent généralement avec des nombres à virgule flottante 32 bits haute précision (FP32). Bien que cette précision offre une excellente exactitude, elle peut être coûteuse en calcul et gourmande en mémoire, surtout sur les appareils de périphérie (edge devices). La QAT simule les effets de la quantification — la réduction de la précision vers des formats tels que les entiers 8 bits (INT8) — pendant que le modèle est encore en cours d'entraînement. En introduisant ces erreurs de quantification durant le processus d'apprentissage, le modèle apprend à adapter ses poids et à récupérer efficacement l'exactitude qui pourrait autrement être perdue lors de la conversion après l'entraînement.

Link to this sectionPourquoi la QAT est importante pour le déploiement en périphérie#

Le déploiement de modèles de vision par ordinateur sur des appareils aux ressources limitées nécessite souvent un équilibre entre vitesse et performance. Les méthodes de quantification standard, connues sous le nom de quantification après entraînement (PTQ), appliquent la réduction de précision uniquement une fois que le modèle est entièrement entraîné. Bien que la PTQ soit rapide, elle peut parfois dégrader l'exactitude de modèles sensibles car les poids du réseau de neurones sont modifiés de manière significative sans possibilité de s'ajuster.

La QAT résout ce problème en permettant au modèle de « s'entraîner » à être quantifié. Durant la passe avant (forward pass) de l'entraînement, les poids et les activations sont simulés comme des valeurs de basse précision. Cela permet au processus de descente de gradient de mettre à jour les paramètres du modèle de manière à minimiser la perte spécifiquement pour l'état quantifié. Le résultat est un modèle robuste qui conserve une haute exactitude même lorsqu'il est déployé sur du matériel comme des microcontrôleurs ou des processeurs mobiles.

Link to this sectionDifférencier la QAT de la quantification après entraînement (PTQ)#

Il est utile de distinguer la QAT de la quantification de modèle, plus spécifiquement de la quantification après entraînement (PTQ) :

  • Quantification après entraînement (PTQ) : Le modèle est entraîné normalement en FP32. Une fois l'entraînement terminé, les poids sont convertis en INT8. C'est plus rapide et ne nécessite aucun réentraînement, mais cela peut entraîner une perte d'exactitude plus importante pour les architectures complexes.
  • Entraînement conscient de la quantification (QAT) : Le processus de quantification est émulé durant l'étape de fine-tuning. Le modèle ajuste ses paramètres internes pour s'adapter au bruit introduit par la plus basse précision, ce qui produit généralement une meilleure exactitude que la PTQ.

Link to this sectionApplications concrètes#

La QAT est essentielle pour les secteurs où l'inférence en temps réel sur du matériel de périphérie est critique.

  • Drones autonomes : Dans les opérations de drones IA, l'autonomie de la batterie et la puissance de traitement embarquée sont sévèrement limitées. Les drones utilisant des modèles optimisés via la QAT peuvent détecter des obstacles ou suivre des objets avec une haute précision tout en utilisant des accélérateurs INT8, ce qui prolonge significativement les temps de vol par rapport aux modèles FP32.
  • Caméras de commerce intelligent : Les supermarchés utilisent la vision par ordinateur dans le commerce de détail pour surveiller l'inventaire en rayon ou gérer les files d'attente aux caisses. Ces systèmes fonctionnent souvent sur des passerelles de périphérie à basse consommation. La QAT garantit que les modèles de détection d'objets fonctionnant sur ces appareils conservent l'exactitude nécessaire pour distinguer des produits similaires sans nécessiter une connectivité cloud coûteuse.

Link to this sectionImplémenter la QAT avec Ultralytics#

La plateforme Ultralytics et l'écosystème YOLO prennent en charge l'exportation de modèles vers des formats quantifiés. Bien que la QAT soit une procédure d'entraînement complexe, les frameworks modernes facilitent la préparation des modèles pour l'inférence quantifiée.

Voici un exemple de la façon dont tu pourrais exporter un modèle YOLO26 entraîné vers un format TFLite quantifié INT8, qui utilise les principes de la quantification pour un déploiement efficace en périphérie.

from ultralytics import YOLO

# Load a trained YOLO26 model
model = YOLO("yolo26n.pt")

# Export the model to TFLite format with INT8 quantization
# This prepares the model for efficient execution on edge devices
model.export(format="tflite", int8=True)

Link to this sectionIntégration avec les écosystèmes de périphérie#

Les modèles optimisés via des techniques de quantification sont conçus pour fonctionner sur des moteurs d'inférence spécialisés. Les modèles entraînés par QAT sont fréquemment déployés en utilisant ONNX Runtime pour une compatibilité multiplateforme ou OpenVINO pour une optimisation sur le matériel Intel. Cela garantit que, que la cible soit un Raspberry Pi ou une Edge TPU dédiée, le modèle fonctionne avec la meilleure efficacité et vitesse possibles.

Link to this sectionConcepts clés liés à la QAT#

Pour bien comprendre la QAT, il est utile d'être familier avec plusieurs concepts de machine learning associés :

  • Précision : Fait référence au niveau de détail utilisé pour représenter les nombres. La demi-précision (FP16) et l'INT8 sont des cibles courantes pour la quantification.
  • Calibration : Le processus consistant à déterminer la plage des valeurs d'activation dynamiques (min/max) pour mapper efficacement les nombres à virgule flottante vers des entiers. C'est une étape cruciale dans le déploiement de modèles YOLO quantifiés.
  • Latence d'inférence : L'un des principaux avantages de la QAT est la réduction de la latence d'inférence, permettant une prise de décision plus rapide dans les systèmes en temps réel.
  • Fine-tuning : La QAT est souvent réalisée comme une étape de fine-tuning sur un modèle pré-entraîné plutôt que par un entraînement à partir de zéro, ce qui permet d'économiser des ressources de calcul.

En intégrant l'entraînement conscient de la quantification dans le pipeline MLOps, les développeurs peuvent combler le fossé entre les modèles de recherche de haute précision et les applications d'IA en périphérie hautement efficaces et prêtes pour la production.

Explore solutions

Real-time AI that works with your team

IA dans la robotique

Équipe tes machines plus intelligentes avec les modèles Ultralytics YOLO. La vision par IA dans la robotique propulse la navigation autonome, la perception, le suivi d'objets et le contrôle en temps réel.

En savoir plus
Real-time AI that works with your team

IA dans la logistique

Simplifie la logistique avec les modèles Ultralytics YOLO. La vision par IA permet l'inspection des colis, le tri, le suivi des véhicules et la surveillance de la sécurité des entrepôts en temps réel.

En savoir plus
Real-time AI that works with your team

IA dans le commerce de détail

Réinvente le commerce de détail avec les modèles Ultralytics YOLO. La vision par IA alimente le suivi des stocks, la surveillance des étagères, la gestion des files d'attente et des informations plus intelligentes sur les clients.

En savoir plus
Real-time AI that works with your team

IA dans la santé

Construis des solutions de santé avec les modèles Ultralytics YOLO. L'IA de vision dans la santé permet une imagerie médicale plus rapide, des diagnostics plus intelligents et une surveillance des patients.

En savoir plus
Real-time AI that works with your team

IA dans la fabrication

Optimise la fabrication avec les modèles Ultralytics YOLO. La vision par IA favorise le contrôle qualité, la détection des défauts, la conformité aux EPI et l'automatisation des chaînes de montage.

En savoir plus
Real-time AI that works with your operation

IA dans l'automobile

Applique la vision par ordinateur dans l'automobile avec les modèles Ultralytics YOLO. L'IA de vision améliore la sécurité routière, l'assistance à la conduite et l'automatisation des véhicules pour des routes plus intelligentes.

En savoir plus
Real-time AI tailored to your operation

IA en agriculture

Intègre l'IA de vision à l'agriculture intelligente avec les modèles Ultralytics YOLO. Optimise la surveillance des cultures, le suivi du bétail et l'agriculture de précision pour des rendements plus élevés et plus intelligents.

En savoir plus
Real-time AI that works with your team

IA dans la robotique

Équipe tes machines plus intelligentes avec les modèles Ultralytics YOLO. La vision par IA dans la robotique propulse la navigation autonome, la perception, le suivi d'objets et le contrôle en temps réel.

En savoir plus
Real-time AI that works with your team

IA dans la logistique

Simplifie la logistique avec les modèles Ultralytics YOLO. La vision par IA permet l'inspection des colis, le tri, le suivi des véhicules et la surveillance de la sécurité des entrepôts en temps réel.

En savoir plus
Real-time AI that works with your team

IA dans le commerce de détail

Réinvente le commerce de détail avec les modèles Ultralytics YOLO. La vision par IA alimente le suivi des stocks, la surveillance des étagères, la gestion des files d'attente et des informations plus intelligentes sur les clients.

En savoir plus
Real-time AI that works with your team

IA dans la santé

Construis des solutions de santé avec les modèles Ultralytics YOLO. L'IA de vision dans la santé permet une imagerie médicale plus rapide, des diagnostics plus intelligents et une surveillance des patients.

En savoir plus
Real-time AI that works with your team

IA dans la fabrication

Optimise la fabrication avec les modèles Ultralytics YOLO. La vision par IA favorise le contrôle qualité, la détection des défauts, la conformité aux EPI et l'automatisation des chaînes de montage.

En savoir plus
Real-time AI that works with your operation

IA dans l'automobile

Applique la vision par ordinateur dans l'automobile avec les modèles Ultralytics YOLO. L'IA de vision améliore la sécurité routière, l'assistance à la conduite et l'automatisation des véhicules pour des routes plus intelligentes.

En savoir plus
Real-time AI tailored to your operation

IA en agriculture

Intègre l'IA de vision à l'agriculture intelligente avec les modèles Ultralytics YOLO. Optimise la surveillance des cultures, le suivi du bétail et l'agriculture de précision pour des rendements plus élevés et plus intelligents.

En savoir plus
Real-time AI that works with your team

IA dans la robotique

Équipe tes machines plus intelligentes avec les modèles Ultralytics YOLO. La vision par IA dans la robotique propulse la navigation autonome, la perception, le suivi d'objets et le contrôle en temps réel.

En savoir plus
Real-time AI that works with your team

IA dans la logistique

Simplifie la logistique avec les modèles Ultralytics YOLO. La vision par IA permet l'inspection des colis, le tri, le suivi des véhicules et la surveillance de la sécurité des entrepôts en temps réel.

En savoir plus
Real-time AI that works with your team

IA dans le commerce de détail

Réinvente le commerce de détail avec les modèles Ultralytics YOLO. La vision par IA alimente le suivi des stocks, la surveillance des étagères, la gestion des files d'attente et des informations plus intelligentes sur les clients.

En savoir plus
Real-time AI that works with your team

IA dans la santé

Construis des solutions de santé avec les modèles Ultralytics YOLO. L'IA de vision dans la santé permet une imagerie médicale plus rapide, des diagnostics plus intelligents et une surveillance des patients.

En savoir plus
Real-time AI that works with your team

IA dans la fabrication

Optimise la fabrication avec les modèles Ultralytics YOLO. La vision par IA favorise le contrôle qualité, la détection des défauts, la conformité aux EPI et l'automatisation des chaînes de montage.

En savoir plus
Real-time AI that works with your operation

IA dans l'automobile

Applique la vision par ordinateur dans l'automobile avec les modèles Ultralytics YOLO. L'IA de vision améliore la sécurité routière, l'assistance à la conduite et l'automatisation des véhicules pour des routes plus intelligentes.

En savoir plus
Real-time AI tailored to your operation

IA en agriculture

Intègre l'IA de vision à l'agriculture intelligente avec les modèles Ultralytics YOLO. Optimise la surveillance des cultures, le suivi du bétail et l'agriculture de précision pour des rendements plus élevés et plus intelligents.

En savoir plus

Construisons ensemble le futur de l'IA !

Commence ton aventure avec le futur de l'apprentissage automatique