En cliquant sur "Accepter tous les cookies", vous acceptez que des cookies soient stockés sur votre appareil afin d'améliorer la navigation sur le site, d'analyser l'utilisation du site et de nous aider dans nos efforts de marketing. Plus d'informations
Paramètres des cookies
En cliquant sur "Accepter tous les cookies", vous acceptez que des cookies soient stockés sur votre appareil afin d'améliorer la navigation sur le site, d'analyser l'utilisation du site et de nous aider dans nos efforts de marketing. Plus d'informations
Découvrez comment les données synthétiques pour l'entraînement des modèles d'IA sont utilisées dans les applications de vision par ordinateur dans toute une série d'industries telles que les soins de santé et la robotique.
Les données ont toujours été un facteur déterminant dans des domaines tels que l'analyse et l'intelligence artificielle (IA). En fait, la manière dont nous collectons, générons et utilisons les données façonne l'avenir des systèmes intelligents. Par exemple, les voitures autonomes dépendent de millions d'images étiquetées et de relevés de capteurs, des panneaux de signalisation aux mouvements des piétons, pour apprendre à naviguer sur les routes en toute sécurité.
Les données visuelles, telles que les images et les vidéos, constituent l'un des types de données les plus essentiels à ces progrès, en particulier dans des domaines tels que les véhicules autonomes et la sécurité.
En particulier, le domaine de l'IA qui permet aux machines d'interpréter ces informations visuelles est appelé vision par ordinateur. Il aide les systèmes à comprendre et à analyser les données visuelles comme le font les humains, en prenant en charge des tâches telles que la reconnaissance faciale, la détection des panneaux de signalisation et l'analyse d'images médicales.
Cependant, la collecte d'ensembles de données visuelles à grande échelle et de haute qualité dans le monde réel peut prendre du temps, être coûteuse et soulève souvent des problèmes de protection de la vie privée. C'est pourquoi les chercheurs explorent activement le concept d'exploitation des données synthétiques.
Les données synthétiques font référence à des visuels générés artificiellement qui imitent étroitement les images et les vidéos du monde réel. Elles sont créées à l'aide de techniques telles que la modélisation 3D, les simulations informatiques et les méthodes d'IA générative telles que les réseaux adversaires génératifs (GAN), qui apprennent des modèles à partir de données réelles pour produire de nouveaux exemples réalistes.
Les données synthétiques devraient bientôt jouer un rôle essentiel dans le développement de l'IA - Gartner prédit que d'ici 2030, elles deviendront plus essentielles que les données du monde réel. Dans cet article, nous allons explorer ce que sont les données synthétiques dans le contexte de la vision par ordinateur, comment elles sont générées et où elles sont appliquées dans des scénarios réels. C'est parti !
Qu'est-ce que les données synthétiques dans le domaine de la vision par ordinateur ?
Supposons que vous souhaitiez entraîner un modèle d'IA de vision à la détection d'objets dans divers environnements et conditions. S'appuyer uniquement sur des données réelles peut s'avérer difficile et parfois contraignant.
Par ailleurs, les données synthétiques peuvent être utilisées pour créer le bon ensemble de données, contenant des objets dans diverses conditions créées artificiellement. Grâce à des outils tels que la modélisation et les simulations en 3D, les développeurs peuvent générer des images en contrôlant avec précision des facteurs tels que l'éclairage, les angles et l'emplacement des objets. Ces données offrent une plus grande souplesse pour l'apprentissage des modèles que les données réelles.
Les données synthétiques sont particulièrement utiles lorsque la collecte de données réelles est difficile ou impossible. Par exemple, pour entraîner un modèle à reconnaître des personnes dans une large gamme de poses, comme courir, s'accroupir ou s'allonger, il faudrait capturer des milliers de photos dans de nombreux paramètres, angles et conditions d'éclairage différents.
En revanche, grâce aux données synthétiques, les développeurs peuvent facilement générer ces variations avec des étiquettes précises, ce qui permet d'économiser du temps et des efforts tout en améliorant les performances du modèle.
Fig. 1. Un ensemble de données synthétiques avec différentes poses humaines et variations d'éclairage(source).
Données synthétiques et données réelles dans l'IA
Ensuite, examinons de plus près les différences entre les données synthétiques et les données réelles. Les deux ont leurs avantages et leurs inconvénients lorsqu'il s'agit d'entraîner des modèles d'IA.
Par exemple, les données synthétiques sont utiles lorsque les données réelles sont difficiles à collecter, mais elles risquent de ne pas rendre compte de tous les petits détails de la vie réelle. Parallèlement, les données réelles sont plus authentiques, mais elles peuvent être difficiles à obtenir, prendre du temps à étiqueter et ne pas couvrir toutes les situations.
En combinant des données synthétiques et réelles, les développeurs peuvent obtenir le meilleur des deux mondes. Cet équilibre permet aux modèles d'IA d'apprendre avec plus de précision, de mieux se généraliser dans différents scénarios et de réduire les biais.
Fig. 2. Données synthétiques et données réelles dans l'IA. Image de l'auteur.
Regard sur la génération de données pour les modèles de vision par ordinateur
De la construction de mondes virtuels à l'aide d'outils 3D à la génération d'images à l'aide de l'IA générative, voici quelques méthodes courantes utilisées pour créer des données d'entraînement synthétiques pour les modèles de vision par ordinateur :
Modélisation 3D: Les développeurs utilisent des logiciels 3D pour créer des objets et des scènes numériques. Cela permet de contrôler entièrement des éléments tels que l'éclairage, les angles de caméra et l'emplacement des objets, et est utile pour générer des images réalistes de personnes, de véhicules et d'environnements.
Simulations: Elles recréent des situations réelles, comme des environnements de circulation ou d'usine, à l'aide de moteurs basés sur la physique. Les simulations sont utiles pour générer en toute sécurité des données de formation dans des domaines tels que la robotique et les voitures autonomes.
Réseaux adversaires génératifs: Les GAN sont un type de modèle d'apprentissage profond composé de deux réseaux : l'un qui crée des images et l'autre qui les évalue. Ensemble, ils génèrent des images très réalistes, telles que des visages humains ou des vues de rues, en apprenant à partir d'exemples réels.
Génération procédurale: Cette technique utilise des règles prédéfinies ou des modèles mathématiques pour générer automatiquement des structures visuelles complexes telles que des terrains, des bâtiments ou des textures. Elle est souvent utilisée dans les jeux et les plateformes de simulation et permet de produire des ensembles de données diversifiés et à grande échelle avec un minimum d'intervention humaine.
La randomisation du domaine: Elle permet de modifier de manière aléatoire des éléments tels que l'éclairage, les couleurs et la forme des objets dans des scènes synthétiques. L'objectif de cette technique est d'aider les modèles à se concentrer sur ce qui est vraiment important, ce qui les rend plus adaptables aux environnements du monde réel.
Fig. 3. Exemples de données : (a) modèles 3D, (b) scènes synthétiques multi-objets, et (c) images de données réelles(source).
Apprentissage de modèles d'IA avec des données synthétiques
Maintenant que nous avons discuté des différentes méthodes utilisées pour créer des données synthétiques, voyons comment elles sont utilisées pour former des modèles d'IA.
Une fois générées, les données synthétiques peuvent généralement être intégrées directement dans le pipeline d'apprentissage de la même manière que les données réelles. Elles comprennent généralement les annotations nécessaires, telles que les étiquettes d'objets, les boîtes de délimitation ou les masques de segmentation, ce qui signifie qu'elles peuvent être utilisées pour des tâches d'apprentissage supervisé, où les modèles apprennent à partir de paires d'entrées-sorties étiquetées, sans qu'il soit nécessaire de procéder à un étiquetage manuel.
Pendant l'entraînement, le modèle traite des images synthétiques pour apprendre à détecter des caractéristiques, à reconnaître des modèles et à classer des objets. Ces données peuvent être utilisées pour construire une première version du modèle à partir de zéro ou pour enrichir un ensemble de données existant, ce qui permet d'améliorer les performances du modèle.
Dans de nombreux flux de travail, les données synthétiques sont également utilisées pour le pré-entraînement, ce qui permet aux modèles d'acquérir une compréhension générale avant d'être affinés à l'aide d'exemples réels. De même, elles sont utilisées pour augmenter les ensembles de données en introduisant des variations contrôlées, comme des conditions d'éclairage différentes, des angles ou des classes d'objets rares, afin d'améliorer la généralisation et de réduire l'ajustement excessif.
En combinant des données synthétiques et réelles, les équipes peuvent former des modèles plus robustes qui fonctionnent bien dans un large éventail de conditions, tout en réduisant la dépendance à l'égard des efforts de collecte de données manuelles, coûteux en temps et en argent.
Applications concrètes des données synthétiques dans le domaine de la vision par ordinateur
Les données synthétiques devenant de plus en plus pratiques et accessibles, nous commençons à les voir adoptées dans une variété de cas d'utilisation de l'IA visionnaire dans le monde réel. Examinons quelques-unes des applications les plus importantes dans le domaine de la vision par ordinateur où elles sont utilisées.
Utilisation de données synthétiques pour la détection d'objets dans les véhicules autonomes
Pour apprendre aux voitures autonomes à conduire en toute sécurité, il faut former les modèles à un large éventail de scénarios, y compris des situations rares ou dangereuses. Cependant, la collecte de données réelles pour ces cas limites peut s'avérer difficile et parfois dangereuse. Les données synthétiques peuvent aider à créer des scènes où les modèles peuvent apprendre à détecter des objets dans des situations difficiles. Elles peuvent également reproduire différentes configurations de capteurs, ce qui est utile car toutes les voitures autopilotées n'utilisent pas le même matériel.
La plate-forme DRIVE Sim de NVIDIA en est un excellent exemple. Elle crée des données synthétiques de haute qualité à l'aide de modèles 3D photoréalistes, d'environnements virtuels et de simulations de capteurs. Elle peut également générer des images de plusieurs angles de conduite à partir d'une seule image. L'utilisation de données synthétiques de ce type permet de réduire la nécessité d'effectuer des tests coûteux dans le monde réel tout en offrant au modèle la variété dont il a besoin pour apprendre efficacement.
Fig. 4. Création de plusieurs vues de conduite à partir d'une seule image(source).
Réduire les biais dans l'IA de l'imagerie médicale grâce à des données synthétiques
Les modèles de vision artificielle comme Ultralytics YOLO11, qui prennent en charge des tâches telles que la détection d'objets et la segmentation d'instances, peuvent être formés sur mesure pour des applications d'imagerie médicale. Cependant, les données d'entraînement du monde réel contiennent souvent des biais, car elles peuvent ne pas représenter correctement les patients de tous les groupes démographiques.
Par exemple, le cancer de la peau est moins souvent diagnostiqué chez les personnes à la peau plus foncée, ce qui limite les données pour ces populations. Ce déséquilibre peut contribuer à des diagnostics erronés et à des résultats de santé inégaux, en particulier dans des domaines tels que l'histopathologie, les radiographies pulmonaires et la dermatologie.
Les images synthétiques peuvent contribuer à combler ce manque de données. En générant des exemples supplémentaires et diversifiés, tels que des anomalies tissulaires variées, un large éventail d'affections pulmonaires et des teintes de peau avec différents types de lésions, les données synthétiques peuvent contribuer à améliorer les performances des modèles dans les groupes sous-représentés.
Les chercheurs travaillent actuellement au développement et à la validation d'ensembles de données synthétiques pour soutenir ces objectifs. Ils étudient également la manière dont les données synthétiques peuvent être utilisées pour tester des outils médicaux et des stratégies de traitement sans s'appuyer sur les dossiers de patients réels, ce qui permet d'accélérer la recherche tout en protégeant la vie privée des patients. Grâce à ces travaux, les données synthétiques ouvrent la voie à des systèmes d'IA médicale plus inclusifs, plus précis et plus éthiques.
Faire progresser l'IA agricole grâce à des données synthétiques pour l'agriculture de précision
La mise au point de systèmes d'IA de vision pour les applications agricoles dépend de l'accès à de grandes quantités de données étiquetées. Cependant, la collecte et l'étiquetage d'images de cultures, de maladies et de conditions de terrain sont lents, coûteux et souvent limités par des facteurs tels que la météo, les saisons de croissance ou la difficulté d'accéder à certaines zones.
Ces défis rendent difficile la formation de modèles de vision artificielle pour des tâches telles que la détection des maladies des plantes, la surveillance des cultures ou la prévision des rendements. C'est là que les données synthétiques peuvent être utiles, en reproduisant différents environnements agricoles pour générer des exemples de formation utiles.
Fig. 5. Utilisation d'images synthétiques pour améliorer la détection des maladies(source).
Principaux enseignements
L'utilisation de données synthétiques représente une avancée importante dans la formation de modèles d'IA, en particulier pour les systèmes de vision artificielle dans les domaines où les données réelles sont limitées ou difficiles à obtenir. Plutôt que de s'appuyer uniquement sur des photos ou des vidéos réelles, qui peuvent être coûteuses, prendre du temps ou poser des problèmes de confidentialité, les données synthétiques nous permettent de générer des images réalistes et étiquetées à la demande.
Elles facilitent la formation des modèles d'IA de vision pour des tâches telles que la conduite autonome, la détection des maladies ou la surveillance des cultures. À mesure que l'IA continue d'évoluer, les données synthétiques sont appelées à jouer un rôle encore plus important dans l'accélération de l'innovation et l'amélioration de l'accessibilité dans tous les secteurs.