Yolo Vision Shenzhen
Shenzhen
Rejoindre maintenant
Glossaire

Apprentissage auto-supervisé

Découvrez comment l'apprentissage auto-supervisé élimine le besoin d'étiquetage manuel. Découvrez les méthodes SSL génératives et contrastives pour améliorer Ultralytics .

L'apprentissage auto-supervisé (SSL) est un paradigme d'apprentissage automatique dans lequel un système apprend à comprendre les données en générant ses propres signaux de supervision à partir des données elles-mêmes, plutôt que de s'appuyer sur des étiquettes externes fournies par des humains. Dans l' apprentissage supervisé traditionnel apprentissage supervisé, les modèles nécessitent de grandes quantités de données annotées manuellement, telles que des images étiquetées « chat » ou « chien », dont la production peut être coûteuse et prendre beaucoup de temps. L'apprentissage auto-supervisé contourne ce goulot d'étranglement en créant des « tâches prétextes » dans lesquelles le modèle doit prédire les parties cachées ou manquantes des données d'entrée, s'enseignant ainsi efficacement la structure et les caractéristiques sous-jacentes nécessaires à des tâches complexes telles que la détection d'objets et la classification.

Mécanismes fondamentaux de l'apprentissage auto-supervisé

L'idée fondamentale derrière le protocole SSL est de masquer ou de dissimuler une partie des données et de forcer le réseau neuronal (NN) à les reconstruire ou prédire la relation entre différentes vues des mêmes données. Ce processus crée des représentations riches et polyvalentes qui peuvent être affinées ultérieurement pour des applications spécifiques en aval.

Il existe deux approches principales dans le cadre du protocole SSL :

  • Méthodes génératives : le modèle apprend à générer des pixels ou des mots pour remplir les espaces vides. Un exemple classique dans le traitement du langage naturel (NLP) est la prédiction du mot suivant dans une phrase. En vision par ordinateur, des techniques telles que les auto-encodeurs masqués (MAE) masquent des zones aléatoires d'une image et chargent le modèle de reconstruire les pixels manquants, le forçant ainsi à « comprendre » le contexte visuel .
  • Apprentissage contrastif : cette méthode apprend au modèle à distinguer les points de données similaires des points de données dissemblables . En appliquant l' techniques d'augmentation des données , telles que le recadrage, la variation de couleur ou la rotation, à une image, le modèle apprend que ces versions modifiées représentent le même objet (paires positives) tout en traitant les autres images comme des objets différents (paires négatives). Des frameworks populaires tels que SimCLR s'appuient fortement sur ce principe.

Applications concrètes

L'apprentissage auto-supervisé est devenu une pierre angulaire pour la construction de puissants modèles fondamentaux dans divers domaines. Sa capacité à exploiter d'énormes quantités de données non étiquetées le rend hautement évolutif.

  • Imagerie médicale : obtenir des scans médicaux étiquetés par des experts est difficile et coûteux. Le SSL permet aux modèles d'être pré-entraînés sur des milliers de radiographies ou d'IRM non étiquetées afin d'apprendre les caractéristiques anatomiques générales. Ce modèle pré-entraîné peut ensuite être affiné à l'aide d'un petit nombre d'exemples étiquetés afin d'atteindre une grande précision dans la détection des tumeurs ou le diagnostic de maladies.
  • Conduite autonome : les voitures autonomes génèrent quotidiennement des téraoctets de données vidéo. Le SSL permet à ces systèmes d'apprendre la dynamique temporelle et la compréhension spatiale à partir d'images vidéo brutes sans annotation image par image . Cela contribue à améliorer la détection des voies et l'évitement d'obstacles en prédisant les images futures ou le mouvement des objets.

Distinguer SSL des termes apparentés

Il est important de différencier le SSL du apprentissage non supervisé. Si les deux méthodes utilisent des données non étiquetées, l'apprentissage non supervisé se concentre généralement sur la recherche de modèles cachés ou de regroupements (clustering) sans tâche prédictive spécifique. À l'inverse, l'apprentissage supervisé par les données non étiquetées (SSL) considère le processus d'apprentissage comme une tâche supervisée dans laquelle les étiquettes sont générées automatiquement à partir de la structure des données elle-même. En outre, l' apprentissage semi-supervisé combine une petite quantité de données étiquetées avec une grande quantité de données non étiquetées, tandis que le SSL pur crée ses propres étiquettes entièrement à partir de l'ensemble de données non étiquetées avant tout ajustement.

Utilisation de poids pré-entraînés dans Ultralytics

Dans l Ultralytics , des modèles tels que YOLO26 bénéficient considérablement de stratégies d'entraînement avancées qui intègrent souvent des principes similaires à ceux du SSL pendant la phase de pré-entraînement sur des ensembles de données massifs tels que ImageNet ou COCO. Cela garantit que lorsque les utilisateurs déploient un modèle pour une tâche spécifique, les extracteurs de caractéristiques sont déjà robustes.

Les utilisateurs peuvent exploiter ces puissantes représentations pré-entraînées pour affiner les modèles sur leurs propres ensembles de données personnalisés à l'aide de la plateforme Ultralytics .

Voici un exemple concis montrant comment charger un modèle YOLO26 pré-entraîné et commencer à l'ajuster sur un nouvel ensemble de données, en tirant parti des fonctionnalités apprises lors de son entraînement initial à grande échelle :

from ultralytics import YOLO

# Load a pre-trained YOLO26 model (weights learned from large-scale data)
model = YOLO("yolo26n.pt")

# Fine-tune the model on a specific dataset (e.g., COCO8)
# This leverages the robust feature representations learned during pre-training
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)

L'avenir du protocole SSL

Comme les chercheurs des grands laboratoires tels que Meta AI et Google continuent d'affiner ces techniques, SSL repousse les limites du possible en matière d' IA générative et la vision par ordinateur. En réduisant la dépendance aux données étiquetées, le SSL démocratise l'accès à l'IA haute performance, permettant à des équipes plus petites de créer des modèles sophistiqués pour des applications de niche telles que la la conservation de la faune sauvage ou l' l'inspection industrielle.

Rejoindre la communauté Ultralytics

Rejoignez le futur de l'IA. Connectez-vous, collaborez et évoluez avec des innovateurs mondiaux.

Rejoindre maintenant