Connectez-vous à YOLO Vision 2025 !
25 septembre 2025
10:00 — 18:00, heure d'été britannique
Événement hybride
Yolo Vision 2024

Utiliser les augmentations d'Albumentations pour diversifier vos données

Abirami Vina

5 min de lecture

17 février 2025

Découvrez comment utiliser Albumentations pour les augmentations lors de l’entraînement personnalisé d’Ultralytics YOLO11 afin d’améliorer les performances du modèle avec des données d’entraînement diversifiées.

Lors de la création d'une solution de vision par ordinateur, la collecte d'un ensemble diversifié d'images pour l'entraînement des modèles de Vision IA peut être un élément essentiel du processus. Cela nécessite souvent beaucoup de temps et d'argent, et parfois, les images collectées ne sont toujours pas assez variées pour que les modèles apprennent efficacement.

Par exemple, les modèles de vision artificielle comme Ultralytics YOLO11 peuvent être entraînés sur mesure sur des ensembles de données d'images pour diverses tâches de vision artificielle liées à différentes applications. La diversité des données est essentielle car elle aide le modèle à mieux se généraliser, lui permettant de reconnaître des objets et des motifs dans un large éventail de scénarios du monde réel.

Si vous avez du mal à obtenir des données diversifiées, les techniques d'augmentation des données d'image peuvent être une excellente solution. Des méthodes comme la rotation, le retournement et l'ajustement de la luminosité peuvent aider à augmenter la variété de votre ensemble de données, améliorant ainsi la capacité du modèle à gérer un éventail plus large de conditions.

C'est pourquoi Ultralytics prend en charge une intégration pour l'augmentation des données d'images. En utilisant Albumentations, un outil populaire qui offre une collection de transformations, vous pouvez créer des données visuelles diversifiées. Cette intégration simplifie le processus d'entraînement de YOLO11 en augmentant automatiquement les images d'entraînement, ce qui améliore les performances du modèle. 

Dans cet article, nous allons explorer comment vous pouvez utiliser l'intégration d'Albumentations, ses avantages et son impact sur l'entraînement du modèle.

Qu'est-ce qu'Albumentations ?

Les modèles de vision par ordinateur peuvent apprendre à partir d'un large éventail d'images de haute qualité pour reconnaître des objets dans différents environnements. La collecte de grands ensembles de données provenant de sources réelles peut être lente, coûteuse et inefficace. Pour rationaliser cette tâche, vous pouvez utiliser l'augmentation des données d'image pour créer de nouvelles variations d'images existantes, aidant ainsi les modèles à apprendre à partir de différents scénarios sans collecter davantage de données.

Plus précisément, vous pouvez exploiter Albumentations, une bibliothèque open source introduite pour l'augmentation efficace des données d'image en 2018. Elle prend en charge une variété d'opérations, allant de simples modifications géométriques comme les rotations et les retournements à des ajustements plus complexes tels que la luminosité, le contraste et l'ajout de bruit.

__wf_reserved_inherit
Fig 1. Exemples de différents types d'augmentations de données d'image.

Principales caractéristiques d'Albumentations

Albumentations est reconnu pour ses hautes performances, ce qui signifie qu'il peut traiter les images rapidement et efficacement. Construit sur des bibliothèques optimisées comme OpenCV et NumPy, il gère de grands ensembles de données avec un temps de traitement minimal, ce qui le rend idéal pour l'augmentation rapide des données pendant l'entraînement du modèle.

Voici quelques autres caractéristiques clés d'Albumentations :

  • Large éventail de transformations : Albumentations fournit plus de 70 types d'augmentations. Ces variations aident les modèles à apprendre à détecter les objets malgré les changements d'éclairage, d'angles ou d'arrière-plans.
  • Optimisé pour la vitesse : Il utilise des techniques d'optimisation avancées comme SIMD (Single Instruction, Multiple Data), qui traite plusieurs points de données à la fois pour accélérer l'augmentation d'image et gérer efficacement les grands ensembles de données.
  • Trois niveaux d’augmentations : Elle améliore les données de trois façons. Par exemple, les augmentations au niveau des pixels ajustent la luminosité et la couleur sans modifier les objets. Pendant ce temps, les augmentations au niveau spatial modifient le positionnement des objets tout en préservant les détails clés, et les augmentations au niveau du mélange mélangent des parties de différentes images pour créer de nouveaux échantillons.

Pourquoi devriez-vous utiliser l'intégration Albumentations ?

Vous vous demandez peut-être : il existe de nombreuses façons d'appliquer des augmentations à un ensemble de données, et vous pourriez même créer les vôtres à l'aide d'outils comme OpenCV. Alors, pourquoi choisir une intégration qui prend en charge une bibliothèque comme Albumentations ?

La création manuelle d'augmentations avec des outils comme OpenCV peut prendre beaucoup de temps et nécessite une certaine expertise. Il peut également être délicat d'affiner les transformations pour obtenir les meilleurs résultats. L'intégration d'Albumentations facilite ce processus. Elle offre de nombreuses transformations prêtes à l'emploi qui peuvent vous faire gagner du temps et des efforts lors de la préparation de votre ensemble de données.

Une autre raison de choisir l'intégration d'Albumentations est qu'elle fonctionne en douceur avec le pipeline d'entraînement de modèles d'Ultralytics. Elle facilite grandement l'entraînement personnalisé de YOLO11, car les augmentations sont automatiquement appliquées pendant l'entraînement. Elle simplifie le processus, de sorte que vous pouvez vous concentrer davantage sur l'amélioration de votre modèle plutôt que sur la gestion de la préparation des données. 

Démarrage avec l'intégration d'Albumentations

Il est intéressant de noter qu'il est plus facile qu'il n'y paraît d'utiliser les intégrations Albumentations pour entraîner YOLO11. Une fois les bonnes bibliothèques installées, l'intégration applique automatiquement les augmentations de données d'image pendant l'entraînement. Cela aide le modèle à apprendre à partir de différentes variations d'image en utilisant le même ensemble de données.

Ensuite, voyons comment installer et utiliser l'intégration Albumentations lors de la formation personnalisée de YOLO11.

Installation du package Python Ultralytics et d'Albumentations

Avant d'appliquer des augmentations, le paquet Python Ultralytics et Albumentations doivent être installés. L'intégration a été conçue pour que les deux bibliothèques fonctionnent ensemble de manière transparente par défaut, vous n'avez donc pas à vous soucier des configurations complexes.

L'ensemble du processus d'installation peut être réalisé en quelques minutes seulement avec une seule commande pip, qui est un outil de gestion de paquets pour l'installation de bibliothèques Python, comme le montre l'image ci-dessous. 

__wf_reserved_inherit
Fig 2. Installation d'Ultralytics et d'Albumentations.

Une fois Albumentations installé, le mode d'entraînement du modèle Ultralytics applique automatiquement des augmentations d'images pendant l'entraînement. Si Albumentations n'est pas installé, ces augmentations ne seront pas appliquées. Pour plus de détails, vous pouvez consulter la documentation officielle d'Ultralytics.

Entraînement de YOLO11 avec l'aide de l'intégration Albumentations

Essayons de mieux comprendre ce qui se passe sous le capot de l'intégration d'Albumentations. 

Voici un aperçu plus détaillé des augmentations appliquées pendant l'entraînement de YOLO11 :

  • Flou : Cette transformation ajoute un léger flou à une image. Elle aide le modèle à détecter les objets même lorsqu'ils sont flous.
  • Flou médian : Il réduit le bruit aléatoire tout en préservant les contours des objets dans une image. Cela facilite la détection des objets dans des environnements complexes par le modèle.
  • Niveaux de gris : En convertissant une image en noir et blanc, cette augmentation peut aider le modèle à se concentrer sur les formes et les textures au lieu des couleurs.
  • CLAHE (Égalisation adaptative de l'histogramme limitée par le contraste) : Cette augmentation améliore le contraste des images, en particulier dans les zones trop sombres ou difficiles à voir, comme dans des conditions de faible luminosité ou de brume. Cela rend les objets dans ces zones plus clairs et plus faciles à identifier pour le modèle.
__wf_reserved_inherit
Fig 3. Un exemple d'augmentation en niveaux de gris appliquée à une image de chat.

Applications de YOLO11 et de l'intégration Albumentations

Si vous effectuez un entraînement personnalisé de YOLO11 pour une application spécifique, l'intégration d'Albumentations peut vous aider à améliorer les performances du modèle en s'adaptant à diverses conditions. Examinons quelques applications concrètes et les défis que cette intégration peut résoudre.

Amélioration de l'imagerie médicale

L'IA de vision dans le secteur de la santé aide les médecins à analyser les images médicales avec plus de précision pour faciliter les diagnostics et améliorer les soins aux patients. En fait, environ un cinquième des organisations de soins de santé utilisent déjà des solutions d'IA. 

Cependant, la création de ces solutions de vision par ordinateur s'accompagne de son propre ensemble de défis. Les scans médicaux peuvent varier considérablement d'un hôpital à l'autre, en raison de facteurs tels que les différents équipements, les paramètres et même l'expérience des techniciens. Les variations de luminosité, de contraste et d'exposition peuvent affecter la cohérence et la précision des modèles d'IA de vision, ce qui rend difficile leur performance fiable dans différents environnements.

C'est là que l'intégration d'outils comme Albumentations devient essentielle. En générant de multiples versions augmentées du même scan, Albumentations permet au modèle d'apprendre à partir d'une variété de qualités d'image. Cela aide le modèle à devenir plus robuste, lui permettant de détecter les maladies avec précision, que les images soient de haute ou de basse qualité. 

__wf_reserved_inherit
Fig 4. Images radiographiques augmentées.

Améliorer la sécurité et la surveillance

Une autre application intéressante de la Vision IA se trouve dans la sécurité et la surveillance. La détection d'objets en temps réel peut aider les équipes de sécurité à identifier rapidement les menaces potentielles. 

Une préoccupation majeure liée à cette application est que les caméras de sécurité capturent des images dans diverses conditions d'éclairage tout au long de la journée, et ces conditions peuvent affecter considérablement la façon dont un modèle comprend ces images. Des facteurs tels que les environnements à faible luminosité, l'éblouissement ou une mauvaise visibilité peuvent rendre difficile pour les modèles de vision par ordinateur la détection d'objets ou la reconnaissance de menaces potentielles de manière cohérente.

L'intégration d'Albumentations permet d'appliquer des transformations pour imiter différentes conditions d'éclairage. Cela permet au modèle d'apprendre à détecter des objets dans des environnements lumineux et peu éclairés, ce qui le rend plus fiable et améliore les temps de réponse dans des conditions difficiles.

Redéfinir les flux de travail de vente au détail et l'expérience client

Un déversement dans l'allée d'un supermarché, un chien qui court dans un magasin ou un enfant qui fait tomber un présentoir de produits ne sont que quelques exemples d'événements quotidiens qui peuvent être des cas limites pour l'IA de vision dans les environnements de vente au détail. La vision par ordinateur est de plus en plus utilisée pour améliorer l'expérience client en suivant le comportement des acheteurs, en surveillant le trafic piétonnier et en identifiant les produits sur les étagères. Cependant, ces situations réelles peuvent être difficiles à comprendre et à traiter avec précision pour les systèmes d'IA.

Bien que tous les scénarios ne puissent pas être représentés dans un jeu de données de vision par ordinateur, l'intégration d'Albumentations aide en augmentant les données pour couvrir de nombreuses situations possibles, telles qu'un éclairage inattendu, des angles inhabituels ou des obstructions. Cela aide les modèles de vision par ordinateur à s'adapter à diverses conditions, améliorant ainsi leur capacité à gérer les cas limites et à faire des prédictions précises dans des environnements de vente au détail dynamiques.

Principaux points à retenir

La collecte de données diverses du monde réel pour l'entraînement des modèles peut être compliquée, mais Albumentations facilite la tâche en créant des variations d'images qui aident les modèles à s'adapter à différentes conditions. 

L'intégration d'Albumentations prise en charge par Ultralytics simplifie le processus d'application de ces augmentations lors de la formation personnalisée de YOLO11. Il en résulte une meilleure qualité des ensembles de données, ce qui profite à un large éventail d'industries en produisant des modèles de Vision IA plus précis et plus fiables.

Rejoignez notre communauté et explorez notre dépôt GitHub pour en savoir plus sur l'IA, et consultez nos options de licence pour démarrer vos projets de Vision IA. Intéressé par des innovations telles que l'IA dans l'industrie manufacturière ou la vision par ordinateur dans la conduite autonome ? Visitez nos pages de solutions pour en savoir plus. 

Construisons ensemble l'avenir
de l'IA !

Commencez votre parcours avec l'avenir de l'apprentissage automatique

Démarrer gratuitement
Lien copié dans le presse-papiers