Découvrez comment l'apprentissage auto-supervisé exploite les données non étiquetées pour une formation efficace, transformant ainsi l'IA en vision artificielle, NLP, etc.
L'apprentissage auto-supervisé (SSL) est une approche d'apprentissage automatique qui permet aux modèles d'apprendre à partir de grandes quantités de données non étiquetées. Contrairement à l'apprentissage supervisé, qui dépend fortement de données méticuleusement étiquetées, l'apprentissage auto-supervisé crée ingénieusement ses propres signaux de supervision directement à partir des données d'entrée. Cela lui confère une valeur exceptionnelle dans des domaines tels que la vision artificielle (CV) et le traitement du langage naturel (NLP), où les données non étiquetées sont abondantes, mais où le coût et l'effort d'étiquetage manuel(annotation des données) peuvent s'avérer prohibitifs.
Le mécanisme de base de SSL implique la conception d'une "tâche prétexte". Il s'agit d'une tâche auxiliaire, auto-générée, dans laquelle le modèle doit prédire certaines propriétés des données qui ont été intentionnellement cachées ou modifiées. En résolvant cette tâche prétexte, le modèle est contraint d'apprendre des structures et des représentations sous-jacentes significatives(embeddings) des données sans étiquettes fournies par l'homme. Cette phase de formation initiale est communément appelée préformation.
Par exemple, dans le domaine de la vision par ordinateur, une tâche prétexte peut impliquer :
Dans le domaine du NLP, une tâche prétexte bien connue est la modélisation du langage masqué, utilisée par des modèles tels que BERT. Dans ce cas, le modèle apprend à prédire les mots qui ont été aléatoirement masqués (cachés) dans les phrases.
Après un pré-entraînement sur de grands ensembles de données non étiquetées, le modèle capture de riches représentations de caractéristiques. Ce modèle pré-entraîné peut ensuite être adapté à des tâches spécifiques en aval, telles que la détection d'objets, la classification d'images ou l'analyse de sentiments, par le biais d'unprocessus appelé réglage fin. Le réglage fin nécessite généralement une quantité beaucoup plus faible de données étiquetées par rapport à la formation d'un modèle à partir de zéro, ce qui fait de SSL un outil clé pour un apprentissage par transfert efficace.
Il est essentiel de différencier le SSL des paradigmes de ML apparentés :
SSL dispose de capacités d'intelligence artificielle (IA) très avancées :
SSL réduit considérablement la dépendance à l'égard d'ensembles de données étiquetés coûteux, démocratisant ainsi le développement de puissants modèles d'IA. Des outils comme PyTorch et TensorFlow, ainsi que des plateformes comme Ultralytics HUB, fournissent des environnements permettant d'exploiter les techniques SSL pour construire et déployer des solutions d'IA de pointe.