Améliorer la robustesse d'un modèle d'IA avec l'augmentation de données
Découvre comment l'ajout de variations réalistes aux données d'entraînement grâce à l'augmentation de données aide à améliorer la robustesse du modèle d'IA et ses performances en situation réelle.

Le test est une étape cruciale dans la création de toute solution technologique. Il montre aux équipes comment un système fonctionne réellement avant sa mise en ligne et leur permet de corriger les problèmes précocement. Cela est vrai dans de nombreux domaines, y compris l'IA, où les modèles doivent gérer des conditions réelles imprévisibles une fois déployés.
Par exemple, la vision par ordinateur est une branche de l'IA qui apprend aux machines à comprendre les images et les vidéos. Les modèles de vision par ordinateur tels qu'Ultralytics YOLO26 prennent en charge des tâches comme la détection d'objets, la segmentation d'instances et la classification d'images.
Ils peuvent être utilisés dans de nombreux secteurs pour des applications telles que la surveillance des patients, l'analyse du trafic, le paiement automatisé et l'inspection de la qualité dans la fabrication. Cependant, même avec des modèles avancés et des données d'entraînement de haute qualité, les solutions de vision par IA peuvent toujours rencontrer des difficultés face aux variations réelles telles que les changements d'éclairage, le mouvement ou les objets partiellement obstrués.
Cela arrive car les modèles apprennent à partir des exemples qui leur sont donnés pendant l'entraînement. S'ils n'ont jamais été confrontés à des conditions comme l'éblouissement, le flou de bougé ou une visibilité partielle, ils sont moins susceptibles de reconnaître correctement les objets dans ces scénarios.
Un moyen d'améliorer la robustesse du modèle est l'utilisation de l'augmentation de données. Au lieu de collecter de grandes quantités de nouvelles données, les ingénieurs peuvent apporter des modifications petites et significatives aux images existantes, comme ajuster l'éclairage, recadrer ou mélanger des images. Cela aide le modèle à apprendre à reconnaître les mêmes objets dans un éventail plus large de situations.
Dans cet article, nous explorerons comment l'augmentation de données améliore la robustesse des modèles et la fiabilité des systèmes de vision par IA lorsqu'ils sont déployés en dehors d'environnements contrôlés. Commençons !
Link to this sectionComment vérifier la robustesse d'un modèle#
Avant de nous plonger dans l'augmentation de données, discutons de la manière de savoir si un modèle de vision par ordinateur est réellement prêt pour une utilisation dans le monde réel.
Un modèle robuste continue de bien fonctionner même lorsque les conditions changent, plutôt que de ne fonctionner que sur des images propres et parfaitement annotées. Voici quelques facteurs pratiques à prendre en compte lors de l'évaluation de la robustesse d'un modèle IA :
- Changements d'éclairage : Les modèles peuvent se comporter différemment lorsqu'ils sont exposés à une lumière vive, une faible luminosité, un éblouissement ou des ombres, ce qui peut affecter la confiance avec laquelle les objets sont détectés.
- Occlusion partielle : Dans les scènes quotidiennes, les objets sont souvent bloqués par d'autres éléments ou ne sont que partiellement visibles. Un modèle plus robuste est capable de les reconnaître même avec des informations visuelles manquantes.
- Scènes encombrées : Les environnements avec de nombreux objets superposés peuvent rendre la détection plus complexe. Les modèles qui fonctionnent bien dans ces cas sont généralement plus fiables dans des contextes complexes.
De bons résultats sur des images propres et parfaitement capturées ne se traduisent pas toujours par une performance solide dans le monde réel. Des tests réguliers dans des conditions variées aident à montrer comment un modèle se comporte une fois déployé.
Link to this sectionQu'est-ce que l'augmentation de données ?#
L'apparence d'un objet sur une photo peut changer en fonction de l'éclairage, de l'angle, de la distance ou de l'arrière-plan. Lorsqu'un modèle de vision par ordinateur est entraîné, le jeu de données à partir duquel il apprend doit inclure ce type de variation pour qu'il puisse être performant dans des environnements imprévisibles.
L'augmentation de données étend un jeu de données d'entraînement en créant des exemples supplémentaires à partir des images dont tu disposes déjà. Cela est réalisé en appliquant des changements intentionnels tels que la rotation ou le retournement d'une image, l'ajustement de la luminosité ou le recadrage d'une partie de celle-ci.
Par exemple, imagine que tu n'aies qu'une seule photo d'un chat. Si tu fais pivoter l'image ou si tu changes sa luminosité, tu peux créer plusieurs nouvelles versions à partir de cette seule image. Chaque version semble légèrement différente, mais il s'agit toujours d'une photo du même chat. Ces variations aident à enseigner au modèle qu'un objet peut paraître différent tout en restant le même.

Fig 1. Un aperçu de l'augmentation d'une image de chat (Source)
Link to this sectionComment l'augmentation de données améliore la performance du modèle#
Pendant l'entraînement du modèle, l'augmentation de données peut être intégrée directement dans le pipeline d'entraînement. Au lieu de créer et de stocker manuellement de nouvelles copies d'images, des transformations aléatoires peuvent être appliquées à chaque chargement d'image.
Cela signifie que le modèle voit une version légèrement différente de l'image à chaque fois, qu'elle apparaisse plus lumineuse, retournée ou partiellement cachée. Des techniques comme l'effacement aléatoire peuvent même supprimer de petites zones de l'image pour simuler des situations réelles où un objet est bloqué ou seulement partiellement visible.

Fig 2. Exemples d'augmentation par effacement aléatoire (Source)
Voir de nombreuses versions différentes de la même image permet au modèle d'apprendre quelles caractéristiques sont importantes, plutôt que de dépendre d'un seul exemple parfait. Cette variété renforce la robustesse du modèle IA afin qu'il puisse fonctionner de manière plus fiable dans des conditions réelles.
Link to this sectionTechniques courantes d'augmentation de données#
Voici quelques techniques d'augmentation de données utilisées pour introduire de la variation dans les images d'entraînement :
- Transformations géométriques : Ces techniques modifient l'apparence spatiale d'un objet au sein d'une image. Faire pivoter, retourner, redimensionner, recadrer ou déplacer une image permet au modèle de comprendre comment un objet peut être vu sous différents angles ou distances.
- Ajustements de couleur et d'éclairage : L'éclairage réel est rarement constant. Les images peuvent être trop lumineuses, trop sombres ou légèrement décalées en couleur, selon l'environnement ou la caméra utilisée. L'ajustement de la luminosité, du contraste, de la teinte et de la saturation permet aux modèles de gérer ces changements visuels et d'être performants dans différentes scènes.
- Variations de la qualité d'image : Le flou ou le bruit visuel peuvent rendre les images peu claires. Ajouter du flou ou du bruit pendant l'entraînement aide le modèle à apprendre à faire face au flou de bougé, aux images en basse lumière ou aux résultats de caméra de moindre qualité, devenant ainsi moins sensible aux visuels imparfaits.
- Augmentations basées sur l'occlusion : Dans les environnements réels, les objets sont souvent partiellement bloqués par d'autres objets. C'est ce qu'on appelle les occlusions d'image. Cacher ou masquer de petites zones d'une image pendant l'entraînement aide le modèle à apprendre à détecter les objets même lorsqu'une partie seulement est visible.
- Augmentations multi-images : Ces techniques combinent des parties de plusieurs images en un seul exemple d'entraînement, ce qui peut augmenter le nombre d'objets en vue et améliorer la capacité du modèle à gérer des scènes complexes ou encombrées.

Fig 3. Exemple d'augmentation multi-images (Source)
Link to this sectionL'augmentation de données simplifiée avec le package Python Ultralytics#
Gérer des jeux de données, créer des variations d'images et écrire du code de transformation peut ajouter des étapes supplémentaires à la construction d'une application de vision par ordinateur. Le package Python Ultralytics aide à simplifier cela en fournissant une interface unique pour entraîner, exécuter et déployer des modèles Ultralytics YOLO tels que YOLO26. Dans le cadre de cet effort pour rationaliser les flux de travail d'entraînement, le package inclut une augmentation de données intégrée, testée par Ultralytics et optimisée pour les modèles YOLO.
Il prend également en charge des intégrations utiles qui éliminent le besoin d'outils séparés ou de code personnalisé. Plus précisément, pour l'augmentation de données, le package s'intègre avec Albumentations, une bibliothèque d'augmentation d'images largement utilisée. Cette intégration permet aux augmentations d'être appliquées automatiquement pendant l'entraînement, sans avoir besoin de scripts supplémentaires ou de code personnalisé.
Link to this sectionGérer les annotations et les jeux de données augmentés#
Un autre facteur qui affecte la robustesse du modèle est la qualité des annotations. Des étiquettes propres et précises, créées et gérées avec des outils d'annotation tels que Roboflow, aident le modèle à comprendre où se trouvent les objets et à quoi ils ressemblent.
Pendant l'entraînement, les augmentations de données telles que les retournements, les recadrages et les rotations sont appliquées dynamiquement, et les annotations sont automatiquement ajustées pour correspondre à ces changements. Lorsque les étiquettes sont précises, ce processus fonctionne sans problème et fournit au modèle de nombreux exemples réalistes de la même scène.
Si les annotations sont inexactes ou incohérentes, ces erreurs peuvent finir par être répétées à travers les images augmentées, ce qui peut rendre l'entraînement moins efficace. Commencer par des annotations précises empêche ces erreurs de se propager et contribue à une meilleure robustesse du modèle.
Link to this sectionAméliorer les applications de vision par IA avec l'augmentation de données#
Ensuite, passons en revue des exemples de la manière dont l'augmentation de données contribue à la robustesse des modèles IA dans des applications réelles.
Link to this sectionBooster la précision de la détection d'objets dans les environnements réels#
Les images synthétiques sont souvent utilisées pour entraîner des systèmes de détection d'objets lorsque les données réelles sont limitées, sensibles ou difficiles à collecter. Elles permettent aux équipes de générer rapidement des exemples de produits, d'environnements et d'angles de caméra sans avoir besoin de capturer chaque scénario dans la vie réelle.
Cependant, les jeux de données synthétiques peuvent parfois paraître trop propres par rapport aux séquences réelles, où l'éclairage change, les objets se chevauchent et les scènes incluent un encombrement d'arrière-plan. L'augmentation de données aide à combler cet écart en introduisant des variations réalistes, comme un éclairage différent, du bruit ou le placement des objets, afin que le modèle apprenne à gérer les types de conditions qu'il verra une fois déployé.
Par exemple, dans une étude récente, un modèle YOLO11 a été entraîné entièrement sur des images synthétiques, et l'augmentation de données a été ajoutée pour introduire une variation supplémentaire. Cela a joué un rôle dans l'apprentissage du modèle à reconnaître les objets de manière plus large. Il a été performant lorsqu'il a été testé sur des images réelles, même s'il n'avait jamais vu de données réelles pendant l'entraînement.
Link to this sectionRendre les solutions d'imagerie médicale plus fiables#
Les jeux de données d'imagerie médicale sont souvent limités, et les scans eux-mêmes peuvent varier en fonction du type d'équipement, des paramètres d'imagerie ou de l'environnement clinique. Les différences dans l'anatomie du patient, les angles, l'éclairage ou le bruit visuel peuvent rendre difficile pour les modèles de vision par ordinateur l'apprentissage de modèles qui se généralisent bien à travers les patients et les hôpitaux.
L'augmentation de données aide à résoudre ce problème en créant de multiples variations du même scan pendant l'entraînement, comme l'ajout de bruit, le léger déplacement de l'image ou l'application de petites distorsions. Ces changements rendent les données d'entraînement plus représentatives des conditions cliniques réelles.
Par exemple, dans une étude sur l'imagerie pédiatrique, les chercheurs ont utilisé YOLO11 pour la segmentation anatomique et l'ont entraîné sur des données médicales augmentées. Ils ont introduit des variations comme du bruit ajouté, de légers changements de position et de petites distorsions pour rendre les images plus réalistes.

Fig 4. Images médicales pédiatriques originales et augmentées (Source)
En apprenant à partir de ces variations, le modèle s'est concentré sur des caractéristiques anatomiques significatives plutôt que sur des différences de surface. Cela a rendu ses résultats de segmentation plus stables à travers différents scans et cas de patients.
Link to this sectionPoints clés#
Collecter des données diverses est difficile, mais l'augmentation de données permet aux modèles d'apprendre à partir d'une gamme plus large de conditions visuelles. Cela se traduit par une plus grande robustesse du modèle lors de la gestion des occlusions, des changements d'éclairage et des scènes encombrées. Globalement, cela les aide à fonctionner de manière plus fiable en dehors des environnements d'entraînement contrôlés.
Rejoins notre communauté et explore les dernières avancées en vision par IA sur notre dépôt GitHub. Visite nos pages de solutions pour apprendre comment des applications comme l'IA dans la fabrication et la vision par ordinateur dans la santé stimulent le progrès, et consulte nos options de licence pour propulser ta prochaine solution IA.






