Data Augmentation

Explore comment l'augmentation de données améliore la robustesse du modèle et réduit le surapprentissage. Apprends des techniques clés pour améliorer les performances d'Ultralytics YOLO26 pour la vision par ordinateur.

L'augmentation de données est une technique critique en apprentissage automatique et en vision par ordinateur utilisée pour augmenter artificiellement la taille et la diversité d'un jeu de données d'entraînement en créant des versions modifiées de données existantes. Plutôt que de collecter et d'annoter des données entièrement nouvelles — ce qui peut être long et coûteux — l'augmentation applique diverses transformations aux échantillons originaux. Ces modifications aident les modèles d'apprentissage automatique à apprendre à reconnaître les motifs de manière plus robuste, en garantissant qu'ils fonctionnent bien même lorsqu'ils rencontrent des variations dans des environnements réels. En exposant les modèles à un plus large éventail de scénarios pendant l'entraînement, tu peux réduire efficacement le surapprentissage et améliorer la généralisation.

Link to this sectionPertinence dans l'IA moderne#

Dans le domaine de la vision par ordinateur, les modèles ont souvent du mal lorsqu'ils sont confrontés à des images qui diffèrent légèrement de leurs données d'entraînement. Les variations de luminosité, d'orientation ou d'encombrement de l'arrière-plan peuvent désorienter un modèle qui n'a pas vu assez de diversité. L'augmentation de données résout ce problème en simulant ces variations par programme. Par exemple, l'image d'un chat pourrait être tournée, retournée ou légèrement floutée pour apprendre au modèle que le sujet reste un « chat » indépendamment de ces changements.

Ce processus fait partie intégrante du succès des architectures modernes comme Ultralytics YOLO26, qui s'appuie sur des jeux de données riches et variés pour atteindre une haute précision dans des tâches telles que la détection d'objets et la segmentation d'image. En synthétisant de nouveaux exemples d'entraînement, l'augmentation permet aux modèles d'apprendre des caractéristiques invariantes — des caractéristiques qui ne changent pas malgré les altérations apportées à l'entrée.

Link to this sectionTechniques et méthodes courantes#

L'augmentation de données englobe un large éventail de techniques de transformation, allant de simples ajustements géométriques à des approches génératives complexes :

Transformations géométriques : Celles-ci incluent des opérations comme la rotation, la mise à l'échelle, le retournement, le recadrage et la translation (déplacement) des images. Elles représentent des changements dans le point de vue de la caméra ou la position de l'objet.
Ajustements de l'espace colorimétrique : Modifier la luminosité, le contraste, la saturation et la teinte aide les modèles à gérer différentes conditions d'éclairage ou capteurs de caméra.
Injection de bruit : L'ajout de bruit aléatoire (comme le bruit gaussien) peut rendre les modèles plus résilients aux données d'entrée granuleuses ou de faible qualité.
Mélange d'images : Des techniques comme MixUp ou Mosaic (populaire dans l'entraînement YOLO) combinent plusieurs images en un seul échantillon d'entraînement, forçant le modèle à apprendre le contexte et les relations entre les objets plus efficacement.
Approches génératives : Des méthodes avancées utilisent l'IA générative ou des modèles de diffusion pour créer des échantillons d'entraînement synthétiques entièrement nouveaux qui imitent les caractéristiques du jeu de données original.

Link to this sectionApplications concrètes#

L'impact pratique de l'augmentation de données s'étend à de nombreuses industries où la rareté des données ou la forte variabilité représente un défi.

Link to this sectionConduite autonome#

Dans le développement de véhicules autonomes, collecter des données pour chaque condition météorologique ou scénario d'éclairage possible est presque impossible. Les ingénieurs utilisent l'augmentation de données pour simuler la pluie, le brouillard, la neige ou l'éblouissement sur des images prises par temps clair. Cela garantit que le système de perception puisse détecter de manière fiable les piétons, les panneaux de signalisation et d'autres véhicules indépendamment des facteurs environnementaux, améliorant ainsi la sécurité et la fiabilité.

Link to this sectionImagerie médicale#

L'analyse d'images médicales souffre souvent de jeux de données limités en raison de problèmes de confidentialité et de la rareté de certaines pathologies. L'augmentation permet aux chercheurs d'élargir de petits jeux de données de radiographies ou d'IRM en appliquant des déformations élastiques, des rotations ou des changements d'intensité. Cela aide à entraîner des modèles de diagnostic robustes capables d'identifier des tumeurs ou des fractures avec une haute sensibilité, même lorsque le positionnement du patient ou la qualité du scan varie.

Link to this sectionDistinguer les concepts apparentés#

Il est important de différencier l'augmentation de données des Données synthétiques. Bien que les deux visent à augmenter la taille du jeu de données, les données synthétiques sont générées artificiellement à partir de zéro (souvent en utilisant des moteurs de rendu 3D ou de simulation), alors que l'augmentation de données modifie des données réelles existantes. De plus, le Prétraitement des données implique le nettoyage et la mise en forme des données (par ex., redimensionnement, normalisation) pour les rendre adaptées à un modèle, mais contrairement à l'augmentation, il n'augmente pas nécessairement le nombre d'échantillons d'entraînement.

Link to this sectionImplémentation de l'augmentation avec Ultralytics#

Les frameworks modernes intègrent l'augmentation directement dans le pipeline d'entraînement. L'exemple ci-dessous montre comment appliquer des augmentations comme le retournement et la mise à l'échelle pendant l'entraînement d'un modèle YOLO26 en utilisant le package ultralytics.

from ultralytics import YOLO

# Load the YOLO26 model
model = YOLO("yolo26n.pt")

# Train with custom data augmentation hyperparameters
# fliplr: 50% chance of horizontal flip, scale: image scaling gain
results = model.train(data="coco8.yaml", epochs=10, fliplr=0.5, scale=0.5)

En ajustant ces hyperparamètres, tu peux adapter la stratégie d'augmentation aux besoins spécifiques de ton jeu de données et de ton application, en tirant parti de la flexibilité de la plateforme Ultralytics pour un développement de modèle efficace.

Explore solutions

IA dans la robotique

Équipe tes machines plus intelligentes avec les modèles Ultralytics YOLO. La vision par IA dans la robotique propulse la navigation autonome, la perception, le suivi d'objets et le contrôle en temps réel.

Data Augmentation

Link to this sectionPertinence dans l'IA moderne#

Link to this sectionTechniques et méthodes courantes#

Link to this sectionApplications concrètes#

Link to this sectionConduite autonome#

Link to this sectionImagerie médicale#

Link to this sectionDistinguer les concepts apparentés#

Link to this sectionImplémentation de l'augmentation avec Ultralytics#

Explore solutions

IA dans la robotique

IA dans la logistique

IA dans le commerce de détail

IA dans la santé

IA dans la fabrication

IA dans l'automobile

IA en agriculture

IA dans la robotique

IA dans la logistique

IA dans le commerce de détail

IA dans la santé

IA dans la fabrication

IA dans l'automobile

IA en agriculture

IA dans la robotique

IA dans la logistique

IA dans le commerce de détail

IA dans la santé

IA dans la fabrication

IA dans l'automobile

IA en agriculture

Construisons ensemble le futur de l'IA !