Connectez-vous à YOLO Vision 2025 !
25 septembre 2025
10:00 — 18:00, heure d'été britannique
Événement hybride
Yolo Vision 2024
Glossaire

Rétropropagation

Découvrez comment la rétropropagation entraîne les réseaux neuronaux, réduit les taux d'erreur et alimente efficacement les applications d'IA telles que la reconnaissance d'images et le NLP.

La rétropropagation, abréviation de "rétropropagation des erreurs", est l'algorithme fondamental utilisé pour entraîner les réseaux neuronaux artificiels. Elle fonctionne en calculant le gradient de la fonction de perte par rapport à chaque poids dans le réseau, ce qui permet au modèle d'apprendre de ses erreurs. Ce processus est la pierre angulaire de l'apprentissage profond moderne, permettant aux modèles de s'attaquer à des tâches complexes en ajustant itérativement leurs paramètres internes pour améliorer les performances. Le développement de la rétropropagation a été un moment charnière dans l'histoire de l'IA, transformant les réseaux neuronaux d'un concept théorique en outils puissants et pratiques.

Comment fonctionne la rétropropagation

Le processus de rétropropagation est essentiel à la boucle d'entraînement du modèle et peut être compris comme un cycle en deux phases qui se répète pour chaque lot de données :

  1. Passe avant (Forward Pass) : Les données d'entraînement sont introduites dans le réseau. Chaque neurone reçoit des entrées, les traite à l'aide de ses poids de modèle et d'une fonction d'activation, et transmet la sortie à la couche suivante. Cela continue jusqu'à ce que la couche finale produise une prédiction. La prédiction du modèle est ensuite comparée à la vérité terrain (les étiquettes correctes) à l'aide d'une fonction de perte, qui calcule un score d'erreur quantifiant l'erreur de la prédiction.

  2. Passe Ascendante : C'est là que commence la rétropropagation. Elle démarre à la couche finale et propage l'erreur vers l'arrière à travers le réseau, couche par couche. À chaque neurone, elle utilise le calcul différentiel (plus précisément, la règle de la chaîne) pour calculer la contribution des poids et des biais de ce neurone à l'erreur totale. Cette contribution est appelée le gradient. Les gradients indiquent efficacement au modèle comment ajuster chaque poids pour réduire l'erreur. Un algorithme d'optimisation utilise ensuite ces gradients pour mettre à jour les poids.

Ce cycle de passes avant et arrière est répété pour de nombreuses époques, permettant au modèle de minimiser progressivement son erreur et d'améliorer sa précision. Les frameworks comme PyTorch et TensorFlow disposent de moteurs de différenciation automatique hautement optimisés qui gèrent le calcul complexe de la rétropropagation en arrière-plan.

Rétropropagation vs. Concepts associés

Il est important de distinguer la rétropropagation des autres concepts associés dans le domaine de l'apprentissage automatique :

  • Algorithme d'optimisation : La rétropropagation est la méthode de calcul des gradients de la perte par rapport aux paramètres du modèle. Un algorithme d'optimisation, tel que la descente de gradient stochastique (SGD) ou l'optimiseur Adam, est le mécanisme qui utilise ces gradients pour mettre à jour les poids du modèle. Considérez la rétropropagation comme fournissant la carte et l'optimiseur comme conduisant la voiture.
  • Fonction de perte : Une fonction de perte mesure l'erreur entre les prédictions du modèle et les valeurs réelles. La rétropropagation utilise ce score d'erreur comme point de départ pour calculer les gradients. Le choix de la fonction de perte est essentiel, mais il s'agit d'un élément distinct de l'algorithme de rétropropagation lui-même.
  • Disparition et explosion des gradients : Ce sont des problèmes qui peuvent survenir lors de la rétropropagation dans les réseaux profonds. Un gradient qui s'annule se produit lorsque les gradients deviennent extrêmement petits, empêchant les premières couches d'apprendre. Inversement, une explosion de gradient se produit lorsque les gradients deviennent excessivement grands, entraînant une formation instable. Des techniques telles que l'initialisation prudente des poids, la normalisation et l'utilisation de fonctions d'activation telles que ReLU sont utilisées pour atténuer ces problèmes.

Applications concrètes

La rétropropagation est implicitement utilisée chaque fois qu'un modèle d'apprentissage profond subit un entraînement. Voici deux exemples concrets :

  1. Détection d'objets avec Ultralytics YOLO: Lors de l'entraînement d'un modèle Ultralytics YOLO (comme YOLO11) pour la détection d'objets sur un ensemble de données tel que COCO, la rétropropagation est utilisée à chaque itération d'entraînement. Une fois que le modèle a prédit les boîtes englobantes et les classes, la perte est calculée. La rétropropagation calcule les gradients pour tous les poids dans l'ensemble du backbone et de la tête de détection du modèle. Un optimiseur utilise ensuite ces gradients pour ajuster les poids, améliorant ainsi la capacité du modèle à localiser et à classer avec précision les objets. Les utilisateurs peuvent exploiter des plateformes comme Ultralytics HUB pour gérer ce processus d'entraînement, en bénéficiant d'implémentations efficaces de la rétropropagation. Ceci est crucial pour les applications allant des véhicules autonomes aux systèmes de sécurité.
  2. Modèles de Traitement du Langage Naturel: Les grands modèles de langage (LLM) comme BERT et les modèles GPT sont entraînés à l'aide de la rétropropagation. Par exemple, dans une tâche d'analyse des sentiments, le modèle prédit le sentiment d'un texte donné. La différence entre le sentiment prédit et l'étiquette réelle entraîne une valeur d'erreur. La rétropropagation calcule la contribution de chaque paramètre du vaste réseau à cette erreur. Les algorithmes d'optimisation mettent ensuite à jour ces paramètres, permettant au modèle de mieux comprendre les nuances linguistiques, le contexte et le sentiment au cours de l'entraînement. Les groupes de recherche universitaires comme le groupe Stanford NLP explorent et affinent continuellement ces techniques.

Rejoignez la communauté Ultralytics

Rejoignez le futur de l'IA. Connectez-vous, collaborez et évoluez avec des innovateurs mondiaux.

Rejoindre maintenant
Lien copié dans le presse-papiers