Yolo Vision Shenzhen
Shenzhen
Rejoindre maintenant
Glossaire

Augmentation de données

Améliorez vos modèles d'apprentissage automatique grâce à l'augmentation des données. Découvrez des techniques pour améliorer la précision, réduire le surapprentissage et améliorer la robustesse.

L'augmentation des données est une stratégie essentielle dans l' apprentissage automatique (ML) utilisée pour augmenter artificiellement la taille et la diversité d'un ensemble de données d'apprentissage sans avoir à collecter ou étiqueter de nouvelles données brutes. En appliquant diverses transformations aux échantillons existants, telles que la rotation d'une image, l' ajustement de sa luminosité ou l'ajout de bruit de fond, les développeurs peuvent créer des versions modifiées mais réalistes de leurs données. Ce processus est essentiel pour réduire le surajustement, un phénomène courant où un modèle mémorise des exemples d'entraînement spécifiques plutôt que d'apprendre des modèles généralisables. En fin de compte, une augmentation efficace conduit à une meilleure précision du modèle et garantit des performances robustes lorsque le système rencontre des données inédites dans des environnements réels.

Techniques et méthodes de base

Dans le domaine de la vision par ordinateur (CV), l'augmentation consiste à manipuler les images d'entrée afin de simuler différentes conditions environnementales. Ces transformations aident le modèle à devenir invariant aux changements d'orientation, d'éclairage et d'échelle.

  • Transformations géométriques : Elles modifient la disposition spatiale d'une image. Les opérations les plus courantes sont les suivantes la rotation aléatoire, le retournement horizontal, le recadrage et la mise à l'échelle. Par exemple, en utilisant transformations géométriquesOpenCV permet à un modèle de reconnaître un objet, qu'il soit à l'envers ou incliné.
  • Transformations photométriques : elles ajustent les valeurs des pixels pour modifier l'apparence visuelle sans changer la géométrie. Ajuster la luminosité, le contraste, la saturation ou ajouter du bruit gaussien aide le modèle à gérer des conditions d'éclairage variables.
  • Mélange avancé : Moderne détection d'objets modernes de détection d'objets utilisent souvent des techniques complexes telles que Mosaic, MixUp et CutMix. Ces méthodes combinent plusieurs images en un seul échantillon d'entraînement, encourageant le modèle à apprendre les relations contextuelles. Vous pouvez explorer la manière de les mettre en œuvre via l'outil Intégration d'Ultralytics Albumentations.

Applications concrètes

L'augmentation des données est indispensable dans les secteurs où les données de haute qualité sont rares, coûteuses à obtenir ou soumises à des restrictions légales .

  1. Imagerie médicale : En analyse d'images médicalesLa taille des ensembles de données est limitée par les lois sur la protection de la vie privée et la rareté de certaines pathologies. En ajoutant des rotations et des déformations élastiques aux radiographies ou aux IRM, les chercheurs peuvent former des modèles robustes pour l'analyse des images médicales. des rotations et des déformations élastiques, les chercheurs peuvent former des modèles robustes pour l'analyse des images médicales. détection des tumeursEn ajoutant des rotations et des déformations élastiques aux radiographies ou aux IRM, les chercheurs peuvent former des modèles robustes pour la détection des tumeurs.
  2. Conduite autonome : les voitures autonomes doivent évoluer dans des environnements imprévisibles. Il est impossible de collecter des données pour toutes les conditions météorologiques possibles. Les ingénieurs utilisent l'augmentation pour simuler des scénarios de pluie, de brouillard ou de faible luminosité sur des images prises par temps clair. Cela permet de préparer les véhicules autonomes à réagir en toute sécurité dans des conditions météorologiques défavorables, améliorant ainsi les normes de sécurité contrôlées par des organismes tels que la NHTSA.

Mise en œuvre de l'augmentation avec Ultralytics YOLO

Le ultralytics simplifie l'application des augmentations directement au sein de l'application entraînement du modèle pipeline. Vous pouvez ajuster les hyperparamètres pour contrôler l'intensité et la probabilité des transformations pour des modèles tels que YOLO26.

from ultralytics import YOLO

# Load the latest YOLO26 model
model = YOLO("yolo26n.pt")

# Train with custom augmentation parameters
# These arguments modify the training data on-the-fly
model.train(
    data="coco8.yaml",
    epochs=10,
    degrees=25.0,  # Random rotation up to +/- 25 degrees
    fliplr=0.5,  # 50% probability of flipping images horizontally
    mosaic=1.0,  # Use Mosaic augmentation (combining 4 images)
    mixup=0.1,  # Apply MixUp augmentation with 10% probability
)

Distinguer les concepts apparentés

Il est important de différencier l'augmentation des données des stratégies similaires utilisées dans le développement de l'IA:

  • vs. données synthétiques : L'augmentation modifie les données existantes du monde réel, données synthétiques sont générées entièrement à partir de zéro à l'aide de simulations informatiques ou de IA générative. L'augmentation ajoute de la variété à ce que vous avez ; les données synthétiques créent ce que vous n'avez pas.
  • vs. Prétraitement des données : Le prétraitement des données implique le nettoyage et le formatage des données (par exemple, redimensionnement, normalisation) afin de les rendre adaptées à un modèle. L'augmentation intervient après le prétraitement et vise à élargir la diversité de l'ensemble de données plutôt que de se limiter à son format.
  • vs. Apprentissage par transfert : L'apprentissage par transfert exploite les connaissances d'un modèle pré-entraîné (par exemple, entraîné sur ImageNet) pour résoudre une nouvelle tâche. Bien qu'ils soient souvent utilisés ensemble, l'apprentissage par transfert concerne la réutilisation des poids du modèle, tandis que l' augmentation concerne l'amélioration des données d'entrée.

Pour approfondir vos connaissances sur les bibliothèques d'augmentation modernes, consultez la documentation Albumentations fournit une liste exhaustive des transformations disponibles compatibles avec PyTorch et les Ultralytics .

Rejoindre la communauté Ultralytics

Rejoignez le futur de l'IA. Connectez-vous, collaborez et évoluez avec des innovateurs mondiaux.

Rejoindre maintenant