Découvre YOLO26 : l'IA de vision de nouvelle génération.
Ultralytics
Intégrations

Utiliser les augmentations Albumentations pour diversifier tes données

Apprends à utiliser Albumentations pour les augmentations lors de l'entraînement personnalisé d'Ultralytics YOLO11 afin d'améliorer les performances du modèle avec des données d'entraînement diversifiées.

ABAbirami Vina
5 min read
Les augmentations de données Albumentations diversifiant les images d'entraînement YOLO11

Lors de la création d'une solution de computer vision, la collecte d'un ensemble diversifié d'images pour entraîner des modèles d'IA visuelle peut être une partie cruciale du processus. Cela demande souvent beaucoup de temps et d'argent, et parfois, les images collectées ne sont toujours pas assez variées pour que les modèles apprennent efficacement.

Par exemple, des modèles de computer vision comme Ultralytics YOLO11 peuvent être entraînés sur mesure sur des jeux de données d'images pour diverses tâches de computer vision liées à différentes applications. Des données diversifiées sont essentielles car elles aident le modèle à mieux généraliser, lui permettant de reconnaître des objets et des motifs dans un large éventail de scénarios réels.

Si tu as du mal avec un manque de données diversifiées, les techniques d'augmentation de données d'image peuvent être une excellente solution. Des méthodes comme la rotation, le retournement et l'ajustement de la luminosité peuvent aider à augmenter la variété de ton jeu de données, améliorant la capacité du modèle à gérer un éventail plus large de conditions.

C'est pourquoi Ultralytics prend en charge une intégration pour l'augmentation de données d'image. En utilisant Albumentations, un outil populaire qui offre une collection de transformations, tu peux créer des données visuelles diversifiées. Cette intégration simplifie le processus d'entraînement de YOLO11 en augmentant automatiquement les images d'entraînement, ce qui améliore les performances du modèle.

Dans cet article, nous explorerons comment tu peux utiliser l'intégration Albumentations, ses avantages et son impact sur l'entraînement du modèle.

Link to this sectionQu'est-ce qu'Albumentations ?#

Les modèles de computer vision peuvent apprendre à partir d'un large ensemble d'images de haute qualité pour reconnaître des objets dans différents environnements. La collecte de grands jeux de données à partir de sources réelles peut être lente, coûteuse et inefficace. Pour rationaliser cette tâche, tu peux utiliser l'augmentation de données d'image pour créer de nouvelles variations d'images existantes, aidant les modèles à apprendre à partir de différents scénarios sans collecter davantage de données.

Plus précisément, tu peux tirer parti d'Albumentations, une bibliothèque open-source introduite pour l'augmentation efficace des données d'image en 2018. Elle prend en charge une variété d'opérations, allant de simples changements géométriques comme les rotations et les retournements à des ajustements plus complexes tels que la luminosité, le contraste et l'ajout de bruit.

Exemples de différents types d'augmentations de données d'image

Fig 1. Exemples de différents types d'augmentations de données d'image.

Link to this sectionCaractéristiques principales d'Albumentations#

Albumentations est connu pour ses hautes performances, ce qui signifie qu'il peut traiter des images rapidement et efficacement. Construit sur des bibliothèques optimisées comme OpenCV et NumPy, il gère de grands jeux de données avec un temps de traitement minimal, ce qui le rend idéal pour une augmentation de données rapide pendant l'entraînement du modèle.

Voici quelques autres caractéristiques clés d'Albumentations :

  • Large éventail de transformations : Albumentations fournit plus de 70 types d'augmentations. Ces variations aident les modèles à apprendre à détecter des objets malgré les changements d'éclairage, d'angles ou d'arrière-plans.
  • Optimisé pour la vitesse : Il utilise des techniques d'optimisation avancées comme SIMD (Single Instruction, Multiple Data), qui traite plusieurs points de données à la fois pour accélérer l'augmentation des images et gérer efficacement les grands jeux de données.
  • Trois niveaux d'augmentations : Il améliore les données de trois manières. Par exemple, les augmentations au niveau des pixels ajustent la luminosité et la couleur sans modifier les objets. Pendant ce temps, les augmentations au niveau spatial modifient le positionnement des objets tout en préservant les détails clés, et les augmentations au niveau du mélange mélangent des parties de différentes images pour créer de nouveaux échantillons.

Link to this sectionPourquoi devrais-tu utiliser l'intégration Albumentations ?#

Tu te demandes peut-être : il existe de nombreuses façons d'appliquer des augmentations à un jeu de données, et tu pourrais même créer les tiennes en utilisant des outils comme OpenCV. Alors, pourquoi choisir une intégration qui prend en charge une bibliothèque comme Albumentations ?

Créer manuellement des augmentations avec des outils comme OpenCV peut prendre beaucoup de temps et nécessite une certaine expertise. Il peut également être délicat d'ajuster finement les transformations pour obtenir les meilleurs résultats. L'intégration Albumentations facilite ce processus. Elle offre de nombreuses transformations prêtes à l'emploi qui peuvent te faire gagner du temps et des efforts lors de la préparation de ton jeu de données.

Une autre raison de choisir l'intégration Albumentations est qu'elle fonctionne de manière transparente avec le pipeline d'entraînement de modèles d'Ultralytics. Elle facilite grandement l'entraînement sur mesure de YOLO11, car les augmentations sont appliquées automatiquement pendant l'entraînement. Cela simplifie le processus, afin que tu puisses te concentrer davantage sur l'amélioration de ton modèle plutôt que sur la gestion de la préparation des données.

Link to this sectionDémarrer avec l'intégration Albumentations#

Il est intéressant de noter que l'utilisation des intégrations Albumentations pour entraîner YOLO11 est plus simple qu'il n'y paraît. Une fois les bonnes bibliothèques configurées, l'intégration applique automatiquement des augmentations de données d'image pendant l'entraînement. Cela aide le modèle à apprendre à partir de différentes variations d'images en utilisant le même jeu de données.

Ensuite, voyons comment installer et utiliser l'intégration Albumentations lors de l'entraînement sur mesure de YOLO11.

Link to this sectionInstallation du package Python Ultralytics et d'Albumentations#

Avant d'appliquer des augmentations, le package Python Ultralytics et Albumentations doivent être installés. L'intégration a été conçue pour que les deux bibliothèques fonctionnent ensemble de manière transparente par défaut, tu n'as donc pas à t'inquiéter de configurations complexes.

L'ensemble du processus d'installation peut être complété en seulement quelques minutes avec une seule commande pip, qui est un outil de gestion de paquets pour installer des bibliothèques Python, comme montré dans l'image ci-dessous.

Installation d'Ultralytics et d'Albumentations avec pip

Fig 2. Installation d'Ultralytics et d'Albumentations.

Une fois qu'Albumentations est installé, le mode d'entraînement de modèles Ultralytics applique automatiquement les augmentations d'image pendant l'entraînement. Si Albumentations n'est pas installé, ces augmentations ne seront pas appliquées. Pour plus de détails, tu peux te référer à la documentation officielle d'Ultralytics.

Link to this sectionEntraîner YOLO11 avec l'aide de l'intégration Albumentations#

Comprenons mieux ce qui se passe sous le capot de l'intégration Albumentations.

Voici un aperçu plus détaillé des augmentations appliquées pendant l'entraînement de YOLO11 :

  • Flou : Cette transformation ajoute un léger flou à une image. Cela aide le modèle à détecter les objets même lorsqu'ils sont hors de mise au point.
  • Flou médian : Il réduit le bruit aléatoire tout en préservant les bords des objets dans une image. Cela facilite la détection des objets par le modèle dans des environnements complexes.
  • Niveaux de gris : En convertissant une image en noir et blanc, cette augmentation peut aider le modèle à se concentrer sur les formes et les textures au lieu des couleurs.
  • CLAHE (Contrast limited adaptive histogram equalization) : Cette augmentation renforce le contraste dans les images, en particulier dans les zones trop sombres ou difficiles à voir, comme dans des conditions de faible luminosité ou de brume. Cela rend les objets dans ces zones plus clairs et plus faciles à identifier pour le modèle.

Augmentation en niveaux de gris appliquée à une image de chat

Fig 3. Un exemple d'augmentation en niveaux de gris appliquée à l'image d'un chat.

Link to this sectionApplications de YOLO11 et de l'intégration Albumentations#

Si tu entraînes YOLO11 sur mesure pour une application spécifique, l'intégration Albumentations peut t'aider à améliorer les performances du modèle en l'adaptant à diverses conditions. Discutons de quelques applications réelles et des défis que cette intégration peut résoudre.

Link to this sectionAméliorer l'imagerie médicale#

La Vision AI dans le secteur de la santé aide les médecins à analyser les images médicales plus précisément pour aider aux diagnostics et améliorer les soins aux patients. En fait, environ un cinquième des organisations de santé utilisent déjà des solutions d'IA.

Cependant, la création de ces solutions de computer vision comporte son propre lot de défis. Les scans médicaux peuvent varier considérablement entre les hôpitaux, influencés par des facteurs tels que différents équipements, réglages et même l'expérience des techniciens. Les variations de luminosité, de contraste et d'exposition peuvent affecter la cohérence et la précision des modèles d'IA visuelle, rendant difficile leur fonctionnement fiable dans différents environnements.

C'est là que l'intégration d'outils comme Albumentations devient essentielle. En générant plusieurs versions augmentées du même scan, Albumentations permet au modèle d'apprendre à partir d'une variété de qualités d'image. Cela aide le modèle à devenir plus robuste, lui permettant de détecter les maladies avec précision à travers des images de haute et de basse qualité.

Images radiographiques augmentées

Fig 4. Images de radiographie augmentées.

Link to this sectionAméliorer la sécurité et la surveillance#

Une autre application intéressante de la Vision AI est la sécurité et la surveillance. La détection d'objets en temps réel peut aider les équipes de sécurité à identifier rapidement les menaces potentielles.

Une préoccupation majeure liée à cette application est que les caméras de sécurité capturent des images dans diverses conditions d'éclairage tout au long de la journée, et ces conditions peuvent affecter considérablement la façon dont un modèle comprend ces images. Des facteurs comme les environnements à faible luminosité, l'éblouissement ou une mauvaise visibilité peuvent rendre difficile la détection d'objets ou la reconnaissance cohérente de menaces potentielles par les modèles de computer vision.

L'intégration Albumentations aide en appliquant des transformations pour imiter différentes conditions d'éclairage. Cela permet au modèle d'apprendre à détecter des objets dans des environnements lumineux et à faible luminosité, le rendant plus fiable et améliorant les temps de réponse dans des conditions difficiles.

Link to this sectionRedéfinir les flux de travail de vente au détail et l'expérience client#

Un déversement dans l'allée d'un supermarché, un chien courant dans un magasin ou un enfant renversant un présentoir de produits ne sont que quelques exemples d'événements quotidiens qui peuvent être des cas limites pour la Vision AI dans les environnements de vente au détail. La computer vision est de plus en plus utilisée pour améliorer l'expérience client en suivant le comportement des acheteurs, en surveillant le trafic piétonnier et en identifiant les produits sur les étagères. Cependant, ces situations réelles peuvent être difficiles à comprendre et à traiter avec précision pour les systèmes d'IA.

Bien que chaque scénario ne puisse pas être représenté dans un jeu de données de computer vision, l'intégration Albumentations aide en augmentant les données pour couvrir de nombreuses situations possibles, telles qu'un éclairage inattendu, des angles inhabituels ou des obstructions. Cela aide les modèles de computer vision à s'adapter à diverses conditions, améliorant leur capacité à gérer les cas limites et à faire des prédictions précises dans des environnements de vente au détail dynamiques.

Link to this sectionPoints clés#

La collecte de données réelles diversifiées pour l'entraînement de modèles peut être compliquée, mais Albumentations la rend plus facile en créant des variations d'image qui aident les modèles à s'adapter à différentes conditions.

L'intégration Albumentations prise en charge par Ultralytics simplifie le processus d'application de ces augmentations lors de l'entraînement sur mesure de YOLO11. Cela se traduit par une meilleure qualité de jeu de données, ce qui profite à un large éventail d'industries en produisant des modèles de Vision AI plus précis et fiables.

Rejoins notre communauté et explore notre dépôt GitHub pour en savoir plus sur l'IA, et consulte nos options de licence pour lancer tes projets de Vision AI. Intéressé par des innovations comme l'IA dans la fabrication ou la computer vision dans la conduite autonome ? Visite nos pages de solutions pour en découvrir davantage.

Explore solutions

Real-time AI that works with your team

IA dans la robotique

Équipe tes machines plus intelligentes avec les modèles Ultralytics YOLO. La vision par IA dans la robotique propulse la navigation autonome, la perception, le suivi d'objets et le contrôle en temps réel.
En savoir plus
Real-time AI that works with your team

IA dans la logistique

Simplifie la logistique avec les modèles Ultralytics YOLO. La vision par IA permet l'inspection des colis, le tri, le suivi des véhicules et la surveillance de la sécurité des entrepôts en temps réel.
En savoir plus
Real-time AI that works with your team

IA dans le commerce de détail

Réinvente le commerce de détail avec les modèles Ultralytics YOLO. La vision par IA alimente le suivi des stocks, la surveillance des étagères, la gestion des files d'attente et des informations plus intelligentes sur les clients.
En savoir plus
Real-time AI that works with your team

IA dans la santé

Construis des solutions de santé avec les modèles Ultralytics YOLO. L'IA de vision dans la santé permet une imagerie médicale plus rapide, des diagnostics plus intelligents et une surveillance des patients.
En savoir plus
Real-time AI that works with your team

IA dans la fabrication

Optimise la fabrication avec les modèles Ultralytics YOLO. La vision par IA favorise le contrôle qualité, la détection des défauts, la conformité aux EPI et l'automatisation des chaînes de montage.
En savoir plus
Real-time AI that works with your operation

IA dans l'automobile

Applique la vision par ordinateur dans l'automobile avec les modèles Ultralytics YOLO. L'IA de vision améliore la sécurité routière, l'assistance à la conduite et l'automatisation des véhicules pour des routes plus intelligentes.
En savoir plus
Real-time AI tailored to your operation

IA en agriculture

Intègre l'IA de vision à l'agriculture intelligente avec les modèles Ultralytics YOLO. Optimise la surveillance des cultures, le suivi du bétail et l'agriculture de précision pour des rendements plus élevés et plus intelligents.
En savoir plus
Real-time AI that works with your team

IA dans la robotique

Équipe tes machines plus intelligentes avec les modèles Ultralytics YOLO. La vision par IA dans la robotique propulse la navigation autonome, la perception, le suivi d'objets et le contrôle en temps réel.
En savoir plus
Real-time AI that works with your team

IA dans la logistique

Simplifie la logistique avec les modèles Ultralytics YOLO. La vision par IA permet l'inspection des colis, le tri, le suivi des véhicules et la surveillance de la sécurité des entrepôts en temps réel.
En savoir plus
Real-time AI that works with your team

IA dans le commerce de détail

Réinvente le commerce de détail avec les modèles Ultralytics YOLO. La vision par IA alimente le suivi des stocks, la surveillance des étagères, la gestion des files d'attente et des informations plus intelligentes sur les clients.
En savoir plus
Real-time AI that works with your team

IA dans la santé

Construis des solutions de santé avec les modèles Ultralytics YOLO. L'IA de vision dans la santé permet une imagerie médicale plus rapide, des diagnostics plus intelligents et une surveillance des patients.
En savoir plus
Real-time AI that works with your team

IA dans la fabrication

Optimise la fabrication avec les modèles Ultralytics YOLO. La vision par IA favorise le contrôle qualité, la détection des défauts, la conformité aux EPI et l'automatisation des chaînes de montage.
En savoir plus
Real-time AI that works with your operation

IA dans l'automobile

Applique la vision par ordinateur dans l'automobile avec les modèles Ultralytics YOLO. L'IA de vision améliore la sécurité routière, l'assistance à la conduite et l'automatisation des véhicules pour des routes plus intelligentes.
En savoir plus
Real-time AI tailored to your operation

IA en agriculture

Intègre l'IA de vision à l'agriculture intelligente avec les modèles Ultralytics YOLO. Optimise la surveillance des cultures, le suivi du bétail et l'agriculture de précision pour des rendements plus élevés et plus intelligents.
En savoir plus
Real-time AI that works with your team

IA dans la robotique

Équipe tes machines plus intelligentes avec les modèles Ultralytics YOLO. La vision par IA dans la robotique propulse la navigation autonome, la perception, le suivi d'objets et le contrôle en temps réel.
En savoir plus
Real-time AI that works with your team

IA dans la logistique

Simplifie la logistique avec les modèles Ultralytics YOLO. La vision par IA permet l'inspection des colis, le tri, le suivi des véhicules et la surveillance de la sécurité des entrepôts en temps réel.
En savoir plus
Real-time AI that works with your team

IA dans le commerce de détail

Réinvente le commerce de détail avec les modèles Ultralytics YOLO. La vision par IA alimente le suivi des stocks, la surveillance des étagères, la gestion des files d'attente et des informations plus intelligentes sur les clients.
En savoir plus
Real-time AI that works with your team

IA dans la santé

Construis des solutions de santé avec les modèles Ultralytics YOLO. L'IA de vision dans la santé permet une imagerie médicale plus rapide, des diagnostics plus intelligents et une surveillance des patients.
En savoir plus
Real-time AI that works with your team

IA dans la fabrication

Optimise la fabrication avec les modèles Ultralytics YOLO. La vision par IA favorise le contrôle qualité, la détection des défauts, la conformité aux EPI et l'automatisation des chaînes de montage.
En savoir plus
Real-time AI that works with your operation

IA dans l'automobile

Applique la vision par ordinateur dans l'automobile avec les modèles Ultralytics YOLO. L'IA de vision améliore la sécurité routière, l'assistance à la conduite et l'automatisation des véhicules pour des routes plus intelligentes.
En savoir plus
Real-time AI tailored to your operation

IA en agriculture

Intègre l'IA de vision à l'agriculture intelligente avec les modèles Ultralytics YOLO. Optimise la surveillance des cultures, le suivi du bétail et l'agriculture de précision pour des rendements plus élevés et plus intelligents.
En savoir plus

Construisons ensemble le futur de l'IA !

Commence ton aventure avec le futur de l'apprentissage automatique