Découvre YOLO26 : l'IA de vision de nouvelle génération.
Ultralytics
Retour au glossaire Ultralytics

Half-Precision

Apprends comment la demi-précision (FP16) accélère l'IA. Découvre comment optimiser Ultralytics YOLO26 pour une inférence plus rapide et une mémoire réduite sur les GPU et les périphériques edge.

La demi-précision, souvent notée FP16, est un format de données à virgule flottante qui occupe 16 bits de mémoire informatique, contrairement au format standard simple précision (FP32) qui en utilise 32. Dans le contexte de l'intelligence artificielle et de l'apprentissage automatique, la demi-précision est une technique d'optimisation cruciale utilisée pour accélérer l'entraînement et l'inférence des modèles tout en réduisant considérablement la consommation de mémoire. En stockant les valeurs numériques — telles que les poids du modèle et les gradients des réseaux de neurones — avec moins de bits, tu peux adapter des modèles plus volumineux sur des GPU (unités de traitement graphique) ou exécuter des modèles existants beaucoup plus rapidement. Ce gain d'efficacité est essentiel pour déployer des architectures modernes et complexes comme YOLO26 sur des appareils aux ressources limitées sans sacrifier une précision substantielle.

Link to this sectionLe fonctionnement des formats à virgule flottante#

Pour comprendre la demi-précision, il est utile de la comparer à la pleine précision. Un nombre standard à virgule flottante 32 bits (FP32) consacre plus de bits à l'exposant et à la mantisse, offrant une très large plage dynamique et une haute précision numérique. Cependant, les modèles d'apprentissage profond sont notoirement résilients aux petites erreurs numériques. Les réseaux de neurones peuvent souvent apprendre efficacement même avec la plage dynamique et la granularité réduites offertes par le format 16 bits.

Passer à la demi-précision divise par deux les besoins en bande passante mémoire. Cela permet d'utiliser des tailles de lot plus grandes pendant l'entraînement, ce qui peut stabiliser les mises à jour des gradients et accélérer le processus d'entraînement global. Les accélérateurs matériels modernes, tels que les Tensor Cores de NVIDIA, sont spécifiquement optimisés pour effectuer des multiplications de matrices en FP16 à des vitesses nettement supérieures au FP32.

Link to this sectionAvantages clés dans les workflows IA#

L'adoption de la demi-précision offre plusieurs avantages tangibles aux praticiens de l'IA :

  • Empreinte mémoire réduite : Les modèles nécessitent deux fois moins de VRAM (mémoire vidéo), ce qui te permet d'entraîner des réseaux plus grands ou d'utiliser des données d'entraînement de plus haute résolution sur le même matériel.
  • Inférence plus rapide : Pour les applications en temps réel, comme les véhicules autonomes ou l'analyse vidéo, le FP16 peut doubler le débit (images par seconde), réduisant la latence d'inférence.
  • Efficacité énergétique : Le traitement de moins de bits nécessite moins d'énergie, ce qui est crucial pour les appareils d'Edge AI et les téléphones mobiles où l'autonomie de la batterie est une contrainte.
  • Entraînement en précision mixte : De nombreux frameworks modernes utilisent la précision mixte, où le modèle conserve une copie maître des poids en FP32 pour la stabilité, mais effectue les calculs lourds en FP16. Cela offre le « meilleur des deux mondes » : vitesse et stabilité de convergence.

Link to this sectionApplications concrètes#

La demi-précision est omniprésente dans les systèmes d'IA en production. Voici deux exemples concrets :

  1. Détection d'objets en temps réel sur des appareils Edge : Imagine un système de caméra de sécurité utilisant Ultralytics YOLO26 pour détecter des intrus. Déployer le modèle en FP16 lui permet de fonctionner de manière fluide sur une puce embarquée comme un NVIDIA Jetson ou un Raspberry Pi AI Kit. La charge de calcul réduite garantit que le système peut traiter les flux vidéo en mode inférence en temps réel sans ralentissement, ce qui est vital pour des alertes rapides.

  2. Déploiement de grands modèles de langage (LLM) : Les modèles d'IA générative, tels que GPT-4 ou les variantes de Llama, possèdent des milliards de paramètres. Charger ces modèles en pleine précision (FP32) nécessiterait une quantité massive de mémoire serveur, souvent prohibitive en termes de coûts. En convertissant ces modèles en FP16 (ou même en formats inférieurs), les fournisseurs cloud peuvent proposer des modèles de fondation à des milliers d'utilisateurs simultanément, rendant des services comme les chatbots et la génération automatique de contenu économiquement viables.

Link to this sectionDemi-précision vs Quantification#

Bien que les deux techniques visent à réduire la taille des modèles, il est important de distinguer la « demi-précision » de la quantification de modèle.

  • Demi-précision (FP16) : Réduit la largeur des bits de 32 à 16 mais conserve les données sous forme de nombre à virgule flottante. Elle conserve une plage dynamique raisonnable et est souvent le choix par défaut pour l'entraînement GPU et l'inférence.
  • Quantification (INT8) : Convertit les nombres à virgule flottante en entiers (généralement 8 bits). Cela offre des gains de vitesse et de mémoire encore plus importants, mais peut parfois entraîner une baisse plus marquée de la précision si ce n'est pas fait avec soin (par exemple, via l'entraînement avec quantification). Le FP16 est généralement plus sûr pour préserver les performances du modèle, tandis que l'INT8 est utilisé pour une optimisation extrême.

Link to this sectionImplémenter la demi-précision avec Ultralytics#

La bibliothèque ultralytics permet d'utiliser facilement la demi-précision. Lors de la prédiction, le modèle peut basculer automatiquement en demi-précision si le matériel le prend en charge, ou cela peut être explicitement demandé.

Voici un exemple en Python montrant comment charger un modèle YOLO26 et effectuer une inférence en utilisant la demi-précision. Note que l'exécution avec half=True nécessite généralement un GPU compatible CUDA.

import torch
from ultralytics import YOLO

# Check if CUDA (GPU) is available, as FP16 is primarily for GPU acceleration
device = "cuda" if torch.cuda.is_available() else "cpu"

# Load the latest YOLO26n model
model = YOLO("yolo26n.pt")

# Run inference on an image with half-precision enabled
# The 'half=True' argument tells the engine to use FP16
results = model.predict("https://ultralytics.com/images/bus.jpg", device=device, half=True)

# Print the device and precision status
print(f"Inference device: {results[0].orig_img.shape}, Speed: {results[0].speed}")

Pour les utilisateurs gérant des jeux de données et des pipelines d'entraînement, la plateforme Ultralytics gère bon nombre de ces optimisations automatiquement dans le cloud, simplifiant la transition entre l'annotation et le déploiement de modèles optimisés.

Link to this sectionLectures complémentaires et ressources#

Pour en savoir plus sur les formats numériques et leur impact sur l'IA, consulte la documentation NVIDIA sur les performances de deep learning concernant les Tensor Cores. Pour une compréhension plus large de la manière dont ces optimisations s'intègrent dans le cycle de développement, lis des informations sur les opérations de machine learning (MLOps).

De plus, ceux qui s'intéressent aux compromis entre différentes stratégies d'optimisation pourraient se pencher sur l'élagage, qui supprime des connexions plutôt que de réduire la précision des bits, ou explorer la norme IEEE pour l'arithmétique à virgule flottante (IEEE 754) pour les spécifications techniques de l'arithmétique numérique. Comprendre ces fondamentaux aide à prendre des décisions éclairées lors de l'exportation de modèles vers des formats comme ONNX ou TensorRT pour les environnements de production.

Explore solutions

Real-time AI that works with your team

IA dans la robotique

Équipe tes machines plus intelligentes avec les modèles Ultralytics YOLO. La vision par IA dans la robotique propulse la navigation autonome, la perception, le suivi d'objets et le contrôle en temps réel.

En savoir plus
Real-time AI that works with your team

IA dans la logistique

Simplifie la logistique avec les modèles Ultralytics YOLO. La vision par IA permet l'inspection des colis, le tri, le suivi des véhicules et la surveillance de la sécurité des entrepôts en temps réel.

En savoir plus
Real-time AI that works with your team

IA dans le commerce de détail

Réinvente le commerce de détail avec les modèles Ultralytics YOLO. La vision par IA alimente le suivi des stocks, la surveillance des étagères, la gestion des files d'attente et des informations plus intelligentes sur les clients.

En savoir plus
Real-time AI that works with your team

IA dans la santé

Construis des solutions de santé avec les modèles Ultralytics YOLO. L'IA de vision dans la santé permet une imagerie médicale plus rapide, des diagnostics plus intelligents et une surveillance des patients.

En savoir plus
Real-time AI that works with your team

IA dans la fabrication

Optimise la fabrication avec les modèles Ultralytics YOLO. La vision par IA favorise le contrôle qualité, la détection des défauts, la conformité aux EPI et l'automatisation des chaînes de montage.

En savoir plus
Real-time AI that works with your operation

IA dans l'automobile

Applique la vision par ordinateur dans l'automobile avec les modèles Ultralytics YOLO. L'IA de vision améliore la sécurité routière, l'assistance à la conduite et l'automatisation des véhicules pour des routes plus intelligentes.

En savoir plus
Real-time AI tailored to your operation

IA en agriculture

Intègre l'IA de vision à l'agriculture intelligente avec les modèles Ultralytics YOLO. Optimise la surveillance des cultures, le suivi du bétail et l'agriculture de précision pour des rendements plus élevés et plus intelligents.

En savoir plus
Real-time AI that works with your team

IA dans la robotique

Équipe tes machines plus intelligentes avec les modèles Ultralytics YOLO. La vision par IA dans la robotique propulse la navigation autonome, la perception, le suivi d'objets et le contrôle en temps réel.

En savoir plus
Real-time AI that works with your team

IA dans la logistique

Simplifie la logistique avec les modèles Ultralytics YOLO. La vision par IA permet l'inspection des colis, le tri, le suivi des véhicules et la surveillance de la sécurité des entrepôts en temps réel.

En savoir plus
Real-time AI that works with your team

IA dans le commerce de détail

Réinvente le commerce de détail avec les modèles Ultralytics YOLO. La vision par IA alimente le suivi des stocks, la surveillance des étagères, la gestion des files d'attente et des informations plus intelligentes sur les clients.

En savoir plus
Real-time AI that works with your team

IA dans la santé

Construis des solutions de santé avec les modèles Ultralytics YOLO. L'IA de vision dans la santé permet une imagerie médicale plus rapide, des diagnostics plus intelligents et une surveillance des patients.

En savoir plus
Real-time AI that works with your team

IA dans la fabrication

Optimise la fabrication avec les modèles Ultralytics YOLO. La vision par IA favorise le contrôle qualité, la détection des défauts, la conformité aux EPI et l'automatisation des chaînes de montage.

En savoir plus
Real-time AI that works with your operation

IA dans l'automobile

Applique la vision par ordinateur dans l'automobile avec les modèles Ultralytics YOLO. L'IA de vision améliore la sécurité routière, l'assistance à la conduite et l'automatisation des véhicules pour des routes plus intelligentes.

En savoir plus
Real-time AI tailored to your operation

IA en agriculture

Intègre l'IA de vision à l'agriculture intelligente avec les modèles Ultralytics YOLO. Optimise la surveillance des cultures, le suivi du bétail et l'agriculture de précision pour des rendements plus élevés et plus intelligents.

En savoir plus
Real-time AI that works with your team

IA dans la robotique

Équipe tes machines plus intelligentes avec les modèles Ultralytics YOLO. La vision par IA dans la robotique propulse la navigation autonome, la perception, le suivi d'objets et le contrôle en temps réel.

En savoir plus
Real-time AI that works with your team

IA dans la logistique

Simplifie la logistique avec les modèles Ultralytics YOLO. La vision par IA permet l'inspection des colis, le tri, le suivi des véhicules et la surveillance de la sécurité des entrepôts en temps réel.

En savoir plus
Real-time AI that works with your team

IA dans le commerce de détail

Réinvente le commerce de détail avec les modèles Ultralytics YOLO. La vision par IA alimente le suivi des stocks, la surveillance des étagères, la gestion des files d'attente et des informations plus intelligentes sur les clients.

En savoir plus
Real-time AI that works with your team

IA dans la santé

Construis des solutions de santé avec les modèles Ultralytics YOLO. L'IA de vision dans la santé permet une imagerie médicale plus rapide, des diagnostics plus intelligents et une surveillance des patients.

En savoir plus
Real-time AI that works with your team

IA dans la fabrication

Optimise la fabrication avec les modèles Ultralytics YOLO. La vision par IA favorise le contrôle qualité, la détection des défauts, la conformité aux EPI et l'automatisation des chaînes de montage.

En savoir plus
Real-time AI that works with your operation

IA dans l'automobile

Applique la vision par ordinateur dans l'automobile avec les modèles Ultralytics YOLO. L'IA de vision améliore la sécurité routière, l'assistance à la conduite et l'automatisation des véhicules pour des routes plus intelligentes.

En savoir plus
Real-time AI tailored to your operation

IA en agriculture

Intègre l'IA de vision à l'agriculture intelligente avec les modèles Ultralytics YOLO. Optimise la surveillance des cultures, le suivi du bétail et l'agriculture de précision pour des rendements plus élevés et plus intelligents.

En savoir plus

Construisons ensemble le futur de l'IA !

Commence ton aventure avec le futur de l'apprentissage automatique