Découvre YOLO26 : l'IA de vision de nouvelle génération.
Ultralytics
Guides

Qu'est-ce que le surapprentissage en vision par ordinateur et comment l'éviter ?

Apprends ce qu'est le surapprentissage (overfitting) en vision par ordinateur et comment l'éviter en utilisant l'augmentation de données, la régularisation et les modèles pré-entraînés.

ABAbdelrahman Elgendy
6 min read
Le surapprentissage dans les modèles de vision par ordinateur et comment l'éviter

Les modèles de vision par ordinateur sont conçus pour reconnaître des motifs, détecter des objets et analyser des images. Cependant, leurs performances dépendent de leur capacité à généraliser à partir de données inédites. La généralisation est la capacité du modèle à bien fonctionner sur de nouvelles images, et pas seulement sur celles avec lesquelles il a été entraîné. Un problème courant lors de l'entraînement de ces modèles est le surapprentissage, où un modèle apprend trop de détails à partir de ses données d'entraînement, y compris du bruit inutile, au lieu d'identifier des motifs significatifs.

Lorsque cela se produit, le modèle obtient de bons résultats sur les données d'entraînement mais peine avec de nouvelles images. Par exemple, un modèle de détection d'objets entraîné uniquement sur des images haute résolution bien éclairées peut échouer lorsqu'il est confronté à des images floues ou ombragées dans des conditions réelles. Le surapprentissage limite l'adaptabilité d'un modèle, ce qui réduit son utilisation dans des applications concrètes telles que la conduite autonome, l'imagerie médicale et les systèmes de sécurité.

Dans cet article, nous allons explorer ce qu'est le surapprentissage, pourquoi il se produit et comment le prévenir. Nous examinerons également comment les modèles de vision par ordinateur comme Ultralytics YOLO11 aident à réduire le surapprentissage et à améliorer la généralisation.

Link to this sectionQu'est-ce que le surapprentissage ?#

Le surapprentissage se produit lorsqu'un modèle mémorise les données d'entraînement au lieu d'apprendre des motifs applicables de manière générale à de nouvelles entrées. Le modèle se concentre trop sur les données d'entraînement, si bien qu'il éprouve des difficultés avec de nouvelles images ou des situations qu'il n'a jamais rencontrées auparavant.

En vision par ordinateur, le surapprentissage peut affecter différentes tâches. Un modèle de classification entraîné uniquement sur des images lumineuses et nettes peut peiner dans des conditions de faible luminosité. Un modèle de détection d'objets qui apprend à partir d'images parfaites pourrait échouer dans des scènes encombrées ou désordonnées. De même, un modèle de segmentation d'instances peut fonctionner correctement dans des environnements contrôlés mais rencontrer des problèmes avec des ombres ou des objets superposés.

Cela devient un problème dans les applications d'IA réelles, où les modèles doivent être capables de généraliser au-delà des conditions d'entraînement contrôlées. Les voitures autonomes, par exemple, doivent être capables de détecter les piétons dans diverses conditions d'éclairage, de météo et d'environnement. Un modèle qui surapprend sur son ensemble d'entraînement ne fonctionnera pas de manière fiable dans de tels scénarios imprévisibles.

Link to this sectionQuand et pourquoi le surapprentissage se produit-il ?#

Le surapprentissage survient généralement en raison de jeux de données déséquilibrés, d'une complexité excessive du modèle et d'un surentraînement. Voici les causes principales :

  • Données d'entraînement limitées : Les petits jeux de données poussent les modèles à mémoriser des motifs plutôt qu'à les généraliser. Un modèle entraîné sur seulement 50 images d'oiseaux pourrait peiner à détecter des espèces d'oiseaux en dehors de ce jeu de données.
  • Modèles complexes avec trop de paramètres : Les réseaux profonds dotés de trop nombreuses couches et neurones ont tendance à mémoriser des détails précis plutôt que de se concentrer sur les caractéristiques essentielles.
  • Manque d'augmentation de données : Sans transformations telles que le recadrage, le retournement ou la rotation, un modèle risque d'apprendre uniquement à partir de ses images d'entraînement exactes.
  • Entraînement prolongé : Si un modèle parcourt les données d'entraînement trop souvent, ce que l'on appelle des époques, il mémorise des détails au lieu d'apprendre des motifs généraux, ce qui le rend moins adaptable.
  • Étiquettes incohérentes ou bruitées : Des données mal étiquetées amènent le modèle à apprendre les mauvais motifs. C'est courant dans les jeux de données étiquetés manuellement.

Une approche équilibrée entre la complexité du modèle, la qualité du jeu de données et les techniques d'entraînement garantit une meilleure généralisation.

Link to this sectionSurapprentissage vs sous-apprentissage#

Le surapprentissage et le sous-apprentissage sont deux problèmes totalement opposés dans l'apprentissage profond.

Comparaison entre sous-apprentissage, apprentissage optimal et surapprentissage dans les modèles de vision par ordinateur

Fig 1. Comparaison du sous-apprentissage, de l'apprentissage optimal et du surapprentissage dans les modèles de vision par ordinateur.

Le surapprentissage survient lorsqu'un modèle est trop complexe, ce qui le rend trop concentré sur les données d'entraînement. Au lieu d'apprendre des motifs généraux, il mémorise de petits détails, même ceux qui sont hors de propos comme le bruit de fond. Cela amène le modèle à bien fonctionner sur les données d'entraînement mais à peiner avec de nouvelles images, ce qui signifie qu'il n'a pas réellement appris à reconnaître des motifs applicables dans différentes situations.

Le sous-apprentissage survient lorsqu'un modèle est trop basique, si bien qu'il manque des motifs importants dans les données. Cela peut se produire lorsque le modèle a trop peu de couches, pas assez de temps d'entraînement, ou que les données sont limitées. En conséquence, il échoue à reconnaître des motifs importants et fait des prédictions inexactes. Cela conduit à de faibles performances tant sur les données d'entraînement que sur les données de test car le modèle n'a pas assez appris pour comprendre la tâche correctement.

Un modèle bien entraîné trouve l'équilibre entre complexité et généralisation. Il doit être assez complexe pour apprendre des motifs pertinents, mais pas au point de mémoriser les données au lieu de reconnaître les relations sous-jacentes.

Link to this sectionComment identifier le surapprentissage#

Voici quelques signes indiquant qu'un modèle est en surapprentissage :

  • Si la précision d'entraînement est significativement plus élevée que la précision de validation, le modèle est probablement en surapprentissage.
  • Un écart croissant entre la perte d'entraînement et la perte de validation est un autre indicateur fort.
  • Le modèle est trop confiant dans des réponses erronées, ce qui montre qu'il a mémorisé des détails au lieu de comprendre les motifs.

Pour s'assurer qu'un modèle généralise bien, il doit être testé sur des jeux de données diversifiés qui reflètent les conditions réelles.

Link to this sectionComment prévenir le surapprentissage en vision par ordinateur#

Le surapprentissage n'est pas inévitable et peut être évité. Avec les bonnes techniques, les modèles de vision par ordinateur peuvent apprendre des motifs généraux au lieu de mémoriser les données d'entraînement, ce qui les rend plus fiables dans les applications réelles.

Voici cinq stratégies clés pour prévenir le surapprentissage en vision par ordinateur.

Link to this sectionAugmentez la diversité des données avec l'augmentation et les données synthétiques#

La meilleure façon d'aider un modèle à bien fonctionner sur de nouvelles données est d'élargir le jeu de données en utilisant l'augmentation de données et des données synthétiques. Les données synthétiques sont générées par ordinateur plutôt que collectées à partir d'images réelles. Elles aident à combler les lacunes lorsqu'il n'y a pas assez de données réelles.

Combinaison de données réelles et synthétiques pour réduire le surapprentissage et améliorer la précision de détection

Fig 2. La combinaison de données réelles et synthétiques réduit le surapprentissage et améliore la précision de la détection d'objets.

L'augmentation de données modifie légèrement les images existantes en les retournant, en les faisant pivoter, en les recadrant ou en ajustant la luminosité, afin que le modèle ne se contente pas de mémoriser des détails mais apprenne à reconnaître des objets dans différentes situations.

Les données synthétiques sont utiles lorsque les images réelles sont difficiles à obtenir. Par exemple, les modèles de voitures autonomes peuvent s'entraîner sur des scènes de route générées par ordinateur pour apprendre à détecter des objets dans différentes conditions météorologiques et d'éclairage. Cela rend le modèle plus flexible et fiable sans nécessiter des milliers d'images réelles.

Link to this sectionOptimisez la complexité et l'architecture du modèle#

Un réseau neuronal profond, qui est un type de modèle d'apprentissage automatique possédant de nombreuses couches qui traitent les données au lieu d'une seule couche, n'est pas toujours meilleur. Lorsqu'un modèle a trop de couches ou de paramètres, il mémorise les données d'entraînement au lieu de reconnaître des motifs plus larges. Réduire la complexité inutile peut aider à prévenir le surapprentissage.

Pour y parvenir, une approche consiste à utiliser le pruning, qui supprime les neurones et connexions redondants, rendant le modèle plus léger et plus efficace.

Une autre consiste à simplifier l'architecture en réduisant le nombre de couches ou de neurones. Les modèles pré-entraînés comme YOLO11 sont conçus pour bien généraliser sur diverses tâches avec moins de paramètres, ce qui les rend plus résistants au surapprentissage que l'entraînement d'un modèle profond à partir de zéro.

Trouver le juste équilibre entre la profondeur du modèle et son efficacité l'aide à apprendre des motifs utiles sans simplement mémoriser les données d'entraînement.

Link to this sectionAppliquez des techniques de régularisation#

Les techniques de régularisation empêchent les modèles de devenir trop dépendants de caractéristiques spécifiques dans les données d'entraînement. Voici quelques techniques couramment utilisées :

  • Dropout désactive des parties aléatoires du modèle pendant l'entraînement afin qu'il apprenne à reconnaître différents motifs au lieu de trop compter sur quelques caractéristiques.
  • Weight decay (régularisation L2) décourage les valeurs de poids extrêmes, gardant la complexité du modèle sous contrôle.
  • Batch normalization aide à stabiliser l'entraînement en veillant à ce que le modèle soit moins sensible aux variations du jeu de données.

Ces techniques aident à maintenir la flexibilité et l'adaptabilité d'un modèle, réduisant le risque de surapprentissage tout en préservant la précision.

Link to this sectionSurveillez l'entraînement avec la validation et l'arrêt précoce#

Pour prévenir le surapprentissage, il est important de suivre la façon dont le modèle apprend et de s'assurer qu'il généralise bien à de nouvelles données. Voici quelques techniques pour y aider :

  • Arrêt précoce (Early stopping) : met fin automatiquement à l'entraînement lorsque le modèle cesse de s'améliorer, afin qu'il ne continue pas à apprendre des détails inutiles.
  • Validation croisée : divise les données en plusieurs parties et entraîne le modèle sur chacune d'entre elles. Cela l'aide à apprendre des motifs au lieu de mémoriser des images spécifiques.

Ces techniques aident le modèle à rester équilibré afin qu'il apprenne assez pour être précis sans devenir trop focalisé uniquement sur les données d'entraînement.

Link to this sectionUtilisez des modèles pré-entraînés et améliorez l'étiquetage des jeux de données#

Au lieu de s'entraîner à partir de zéro, l'utilisation de modèles pré-entraînés comme YOLO11 peut réduire le surapprentissage. YOLO11 est entraîné sur des jeux de données à grande échelle, ce qui lui permet de bien généraliser dans différentes conditions.

Modèles de vision par ordinateur pré-entraînés améliorant la précision et évitant le surapprentissage

Fig 3. Les modèles de vision par ordinateur pré-entraînés améliorent la précision et préviennent le surapprentissage.

Le réglage fin (fine-tuning) d'un modèle pré-entraîné l'aide à conserver ce qu'il sait déjà tout en apprenant de nouvelles tâches, de sorte qu'il ne se contente pas de mémoriser les données d'entraînement.

De plus, il est essentiel de garantir un étiquetage de haute qualité des jeux de données. Des données mal étiquetées ou déséquilibrées peuvent induire les modèles en erreur, les poussant à apprendre des motifs incorrects. Nettoyer les jeux de données, corriger les images mal étiquetées et équilibrer les classes améliorent la précision et réduisent le risque de surapprentissage. Une autre approche efficace est l'entraînement adversaire, où le modèle est exposé à des exemples légèrement modifiés ou plus difficiles conçus pour tester ses limites.

Link to this sectionPoints clés#

Le surapprentissage est un problème courant en vision par ordinateur. Un modèle peut bien fonctionner sur les données d'entraînement mais peiner avec des images du monde réel. Pour éviter cela, des techniques comme l'augmentation de données, la régularisation et l'utilisation de modèles pré-entraînés comme YOLO11 aident à améliorer la précision et l'adaptabilité.

En appliquant ces méthodes, les modèles d'IA peuvent rester fiables et bien performer dans différents environnements. À mesure que l'apprentissage profond progresse, s'assurer que les modèles généralisent correctement sera la clé du succès de l'IA dans le monde réel.

Rejoins notre communauté grandissante ! Explore notre dépôt GitHub pour en savoir plus sur l'IA. Prêt à démarrer tes propres projets de vision par ordinateur ? Découvre nos options de licence. Découvre l'IA de vision dans la conduite autonome et l'IA dans la santé en consultant nos pages de solutions !

Explore solutions

Real-time AI that works with your team

IA dans la robotique

Équipe tes machines plus intelligentes avec les modèles Ultralytics YOLO. La vision par IA dans la robotique propulse la navigation autonome, la perception, le suivi d'objets et le contrôle en temps réel.

En savoir plus
Real-time AI that works with your team

IA dans la logistique

Simplifie la logistique avec les modèles Ultralytics YOLO. La vision par IA permet l'inspection des colis, le tri, le suivi des véhicules et la surveillance de la sécurité des entrepôts en temps réel.

En savoir plus
Real-time AI that works with your team

IA dans le commerce de détail

Réinvente le commerce de détail avec les modèles Ultralytics YOLO. La vision par IA alimente le suivi des stocks, la surveillance des étagères, la gestion des files d'attente et des informations plus intelligentes sur les clients.

En savoir plus
Real-time AI that works with your team

IA dans la santé

Construis des solutions de santé avec les modèles Ultralytics YOLO. L'IA de vision dans la santé permet une imagerie médicale plus rapide, des diagnostics plus intelligents et une surveillance des patients.

En savoir plus
Real-time AI that works with your team

IA dans la fabrication

Optimise la fabrication avec les modèles Ultralytics YOLO. La vision par IA favorise le contrôle qualité, la détection des défauts, la conformité aux EPI et l'automatisation des chaînes de montage.

En savoir plus
Real-time AI that works with your operation

IA dans l'automobile

Applique la vision par ordinateur dans l'automobile avec les modèles Ultralytics YOLO. L'IA de vision améliore la sécurité routière, l'assistance à la conduite et l'automatisation des véhicules pour des routes plus intelligentes.

En savoir plus
Real-time AI tailored to your operation

IA en agriculture

Intègre l'IA de vision à l'agriculture intelligente avec les modèles Ultralytics YOLO. Optimise la surveillance des cultures, le suivi du bétail et l'agriculture de précision pour des rendements plus élevés et plus intelligents.

En savoir plus
Real-time AI that works with your team

IA dans la robotique

Équipe tes machines plus intelligentes avec les modèles Ultralytics YOLO. La vision par IA dans la robotique propulse la navigation autonome, la perception, le suivi d'objets et le contrôle en temps réel.

En savoir plus
Real-time AI that works with your team

IA dans la logistique

Simplifie la logistique avec les modèles Ultralytics YOLO. La vision par IA permet l'inspection des colis, le tri, le suivi des véhicules et la surveillance de la sécurité des entrepôts en temps réel.

En savoir plus
Real-time AI that works with your team

IA dans le commerce de détail

Réinvente le commerce de détail avec les modèles Ultralytics YOLO. La vision par IA alimente le suivi des stocks, la surveillance des étagères, la gestion des files d'attente et des informations plus intelligentes sur les clients.

En savoir plus
Real-time AI that works with your team

IA dans la santé

Construis des solutions de santé avec les modèles Ultralytics YOLO. L'IA de vision dans la santé permet une imagerie médicale plus rapide, des diagnostics plus intelligents et une surveillance des patients.

En savoir plus
Real-time AI that works with your team

IA dans la fabrication

Optimise la fabrication avec les modèles Ultralytics YOLO. La vision par IA favorise le contrôle qualité, la détection des défauts, la conformité aux EPI et l'automatisation des chaînes de montage.

En savoir plus
Real-time AI that works with your operation

IA dans l'automobile

Applique la vision par ordinateur dans l'automobile avec les modèles Ultralytics YOLO. L'IA de vision améliore la sécurité routière, l'assistance à la conduite et l'automatisation des véhicules pour des routes plus intelligentes.

En savoir plus
Real-time AI tailored to your operation

IA en agriculture

Intègre l'IA de vision à l'agriculture intelligente avec les modèles Ultralytics YOLO. Optimise la surveillance des cultures, le suivi du bétail et l'agriculture de précision pour des rendements plus élevés et plus intelligents.

En savoir plus
Real-time AI that works with your team

IA dans la robotique

Équipe tes machines plus intelligentes avec les modèles Ultralytics YOLO. La vision par IA dans la robotique propulse la navigation autonome, la perception, le suivi d'objets et le contrôle en temps réel.

En savoir plus
Real-time AI that works with your team

IA dans la logistique

Simplifie la logistique avec les modèles Ultralytics YOLO. La vision par IA permet l'inspection des colis, le tri, le suivi des véhicules et la surveillance de la sécurité des entrepôts en temps réel.

En savoir plus
Real-time AI that works with your team

IA dans le commerce de détail

Réinvente le commerce de détail avec les modèles Ultralytics YOLO. La vision par IA alimente le suivi des stocks, la surveillance des étagères, la gestion des files d'attente et des informations plus intelligentes sur les clients.

En savoir plus
Real-time AI that works with your team

IA dans la santé

Construis des solutions de santé avec les modèles Ultralytics YOLO. L'IA de vision dans la santé permet une imagerie médicale plus rapide, des diagnostics plus intelligents et une surveillance des patients.

En savoir plus
Real-time AI that works with your team

IA dans la fabrication

Optimise la fabrication avec les modèles Ultralytics YOLO. La vision par IA favorise le contrôle qualité, la détection des défauts, la conformité aux EPI et l'automatisation des chaînes de montage.

En savoir plus
Real-time AI that works with your operation

IA dans l'automobile

Applique la vision par ordinateur dans l'automobile avec les modèles Ultralytics YOLO. L'IA de vision améliore la sécurité routière, l'assistance à la conduite et l'automatisation des véhicules pour des routes plus intelligentes.

En savoir plus
Real-time AI tailored to your operation

IA en agriculture

Intègre l'IA de vision à l'agriculture intelligente avec les modèles Ultralytics YOLO. Optimise la surveillance des cultures, le suivi du bétail et l'agriculture de précision pour des rendements plus élevés et plus intelligents.

En savoir plus

Construisons ensemble le futur de l'IA !

Commence ton aventure avec le futur de l'apprentissage automatique