Augmentation de données
Améliorez vos modèles d'apprentissage automatique grâce à l'augmentation des données. Découvrez des techniques pour améliorer la précision, réduire le surapprentissage et améliorer la robustesse.
L'augmentation de données est une technique essentielle en apprentissage automatique (ML) utilisée pour augmenter artificiellement la taille et la diversité d'un ensemble de données d'entraînement. Ceci est réalisé en créant des versions modifiées, mais réalistes, d'échantillons de données existants. L'objectif principal est d'améliorer les performances et la robustesse des modèles d'IA, en particulier en vision par ordinateur (CV), en les exposant à une plus grande variété de conditions pendant l'entraînement. Cela permet d'éviter le surapprentissage, où un modèle apprend trop bien les données d'entraînement mais ne parvient pas à se généraliser à de nouvelles données non vues, ce qui conduit finalement à une plus grande précision du modèle.
Comment fonctionne l'augmentation de données
En vision par ordinateur, l'augmentation des données implique l'application d'une série de transformations aux images. Ces transformations sont conçues pour simuler les variations du monde réel qu'un modèle pourrait rencontrer après le déploiement. Les techniques courantes comprennent :
- Transformations géométriques : Elles modifient l'orientation spatiale d'une image. Les exemples incluent les rotations aléatoires, la mise à l'échelle, les translations (déplacement), le recadrage et le retournement (horizontal ou vertical). Ceux-ci enseignent au modèle à être invariant à la position et à l'orientation de l'objet.
- Transformations de l'espace colorimétrique : Elles modifient les propriétés de couleur d'une image. Les ajustements de la luminosité, du contraste, de la saturation et de la teinte rendent le modèle plus résistant aux changements des conditions d'éclairage.
- Techniques avancées : Les méthodes plus complexes impliquent de modifier le contenu de l'image de manière plus significative. Il peut s'agir d'ajouter du bruit aléatoire (comme du bruit gaussien), d'appliquer des effets de flou ou d'utiliser des méthodes telles que Mixup, qui crée de nouvelles images en combinant linéairement deux images existantes, et Cutout, qui supprime aléatoirement des régions d'une image. Vous pouvez en apprendre davantage sur ces méthodes dans Le guide ultime de l'augmentation des données.
De nombreux frameworks de deep learning, comme PyTorch et TensorFlow, fournissent des outils pour l'augmentation des données. Des bibliothèques spécialisées comme Albumentations offrent une vaste collection de techniques d'augmentation de haute performance et sont intégrées à des modèles comme Ultralytics YOLO11 pour diversifier les données d'entraînement de manière transparente.
Applications concrètes
L'augmentation de données est une pratique courante dans de nombreux domaines pour construire des systèmes d'IA plus fiables.
- IA dans le domaine de la santé : Dans l'analyse d'images médicales, les ensembles de données sont souvent petits en raison des réglementations sur la confidentialité des patients et de la rareté de certaines maladies. Pour entraîner un modèle de détection des tumeurs dans les scans, les techniques d'augmentation telles que la rotation, la mise à l'échelle et les changements de luminosité créent un ensemble plus diversifié d'exemples d'entraînement. Cela aide le modèle à identifier avec précision les anomalies, quelles que soient les variations de l'équipement d'imagerie ou du positionnement du patient, améliorant ainsi la fiabilité du diagnostic.
- IA pour l'automobile : Le développement de systèmes de détection d'objets robustes pour les véhicules autonomes nécessite des données provenant d'innombrables scénarios de conduite. Au lieu de collecter des données pour toutes les conditions possibles, l'augmentation peut simuler différentes conditions météorologiques (par exemple, en ajoutant de la pluie ou de la neige synthétiques), d'éclairage (jour, crépuscule, nuit) et d'occlusions (par exemple, un piéton partiellement caché par une autre voiture). Cela rend le système de perception du véhicule plus fiable dans des environnements réels imprévisibles.
D'autres applications importantes incluent l'IA dans la fabrication pour le contrôle de la qualité et l'IA dans l'agriculture pour la détection des maladies des cultures dans diverses conditions de terrain.
Augmentation de données vs. Concepts connexes
Il est important de distinguer l'augmentation des données des autres techniques liées aux données.
- Données synthétiques : Bien que les deux méthodes améliorent les ensembles de données, elles fonctionnent différemment. L'augmentation des données modifie les données réelles existantes. En revanche, la génération de données synthétiques crée des données artificielles entièrement nouvelles à partir de zéro en utilisant des simulations ou des modèles génératifs comme les GAN. Alors que l'augmentation élargit la variance autour des données observées, les données synthétiques peuvent créer des scénarios nouveaux non présents dans l'ensemble de données original, un concept exploré dans cet aperçu des données synthétiques en vision par ordinateur.
- Nettoyage des données : Le nettoyage des données fait partie du pipeline plus large de prétraitement des données qui se concentre sur l'identification et la correction des erreurs, des incohérences et des inexactitudes dans un ensemble de données. Son objectif est d'améliorer la qualité des données. L'augmentation des données, en revanche, vise à augmenter la quantité et la variété des données. Un ensemble de données propre est le point de départ idéal avant d'appliquer l'augmentation.
- Apprentissage par transfert : Cette technique consiste à utiliser un modèle pré-entraîné sur un grand ensemble de données de référence comme ImageNet, puis à l'affiner sur un ensemble de données plus petit et spécifique à une tâche. L'augmentation des données est souvent utilisée pendant la phase d'affinage pour améliorer davantage les performances et éviter le surapprentissage sur les nouvelles données.
Des plateformes comme Ultralytics HUB rationalisent l'ensemble du processus d'entraînement du modèle, en intégrant l'augmentation des données comme une étape clé pour aider les utilisateurs à construire des modèles d'IA de vision puissants et à la pointe de la technologie.