Semi-Supervised Learning

Explore comment l'apprentissage semi-supervisé combine des données étiquetées et non étiquetées pour améliorer la précision du modèle. Apprends à implémenter des flux de travail SSL en utilisant Ultralytics YOLO26.

L'apprentissage semi-supervisé (SSL) est un paradigme stratégique en apprentissage automatique (ML) qui sert de pont entre deux méthodes d'entraînement traditionnelles. Alors que l'apprentissage supervisé repose entièrement sur des jeux de données entièrement annotés et que l'apprentissage non supervisé tente de trouver des motifs dans les données sans aucune étiquette, le SSL fonctionne en combinant une petite quantité de données étiquetées avec un ensemble nettement plus large de données non étiquetées. Cette approche est particulièrement précieuse dans les scénarios réels de vision par ordinateur (CV) où la collecte d'images brutes — telles que des séquences vidéo provenant de caméras de sécurité ou de satellites — est relativement peu coûteuse, mais où le processus d'étiquetage des données par des experts humains est coûteux, lent et exigeant en main-d'œuvre. En utilisant efficacement la structure cachée au sein des exemples non étiquetés, le SSL peut améliorer considérablement la précision du modèle et sa généralisation sans nécessiter un budget d'annotation exhaustif.

Link to this sectionMécanismes fondamentaux de l'apprentissage semi-supervisé#

L'objectif principal du SSL est de propager les informations trouvées dans le petit ensemble d'exemples étiquetés vers le plus grand ensemble non étiqueté. Cela permet au réseau neuronal d'apprendre des frontières de décision qui passent par des régions de faible densité de données, aboutissant à une classification ou une détection plus robuste.

Deux techniques populaires pilotent la plupart des flux de travail semi-supervisés :

Pseudo-étiquetage : Dans cette méthode, un modèle est d'abord entraîné sur les données étiquetées limitées. Il est ensuite utilisé pour effectuer des inférences sur les données non étiquetées. Les prédictions qui dépassent un seuil de confiance spécifique sont traitées comme des "pseudo-étiquettes" ou une vérité terrain. Ces prédictions fiables sont ajoutées aux données d'entraînement, et le modèle est réentraîné, améliorant ainsi ses performances de manière itérative.
Régularisation de la cohérence : Cette technique repose sur l'augmentation des données. L'idée est qu'un modèle doit produire des prédictions similaires pour une image et une version légèrement modifiée (augmentée) de cette même image. En minimisant la différence de prédictions entre la version originale et la version augmentée, le modèle apprend à se concentrer sur les caractéristiques essentielles de l'objet plutôt que sur le bruit, améliorant ainsi sa capacité à gérer le surapprentissage.

Link to this sectionMise en œuvre pratique avec YOLO#

L'exemple Python suivant démontre un flux de travail de pseudo-étiquetage simple utilisant le package ultralytics. Ici, nous entraînons un modèle YOLO26 sur un petit jeu de données, puis nous l'utilisons pour générer des étiquettes pour un répertoire d'images non étiquetées.

from ultralytics import YOLO

# Load the latest YOLO26 model
model = YOLO("yolo26n.pt")

# Train initially on a small available labeled dataset
model.train(data="coco8.yaml", epochs=10)

# Run inference on unlabeled data to generate pseudo-labels
# Setting save_txt=True saves the detections as text files for future training
results = model.predict(source="./unlabeled_images", save_txt=True, conf=0.85)

Link to this sectionApplications concrètes#

L'apprentissage semi-supervisé transforme les secteurs où les données sont abondantes mais l'expertise rare.

Imagerie médicale : Dans l'IA pour la santé, l'acquisition de scanners (rayons X, IRM) est une procédure standard, mais demander à un radiologue agréé d'annoter chaque pixel pour la détection de tumeurs est d'un coût prohibitif. Le SSL permet aux chercheurs d'entraîner des modèles haute performance en n'utilisant qu'une fraction des cas annotés par des experts, en tirant parti de milliers d'examens archivés pour affiner la compréhension du modèle des structures biologiques.
Conduite autonome : Les entreprises de voitures autonomes collectent quotidiennement des pétaoctets de données vidéo provenant de leurs flottes de véhicules. Étiqueter chaque image pour la détection d'objets et la segmentation sémantique est impossible. Grâce au SSL, le système peut apprendre de la grande majorité des heures de conduite non étiquetées pour mieux comprendre les environnements routiers complexes, les conditions météorologiques et les cas limites rares.

Link to this sectionDistinguer les concepts apparentés#

Pour déployer efficacement des solutions d'IA, il est crucial de comprendre comment le SSL diffère des stratégies similaires :

vs Apprentissage actif : Bien que les deux traitent des données non étiquetées, leur approche de l'étiquetage diffère. Le SSL attribue automatiquement des étiquettes basées sur les prédictions du modèle. À l'inverse, l'apprentissage actif identifie les points de données les plus « confus » ou incertains et demande explicitement à un humain dans la boucle de les étiqueter, optimisant ainsi le temps de l'humain plutôt que de le supprimer entièrement.
vs Apprentissage par transfert : L'apprentissage par transfert implique de prendre un modèle pré-entraîné sur un jeu de données externe massif (comme ImageNet) et de l'ajuster (fine-tuning) sur ta tâche spécifique. Le SSL, cependant, se concentre sur l'exploitation de la partie non étiquetée de la distribution de ton jeu de données spécifique pendant le processus d'entraînement lui-même.
vs Apprentissage auto-supervisé : Bien que les noms soient similaires, l'apprentissage auto-supervisé fait souvent référence à des « tâches prétextes » (comme résoudre un puzzle de pièces d'image) où les données génèrent leurs propres signaux de supervision sans étiquettes externes. Le SSL implique spécifiquement l'utilisation d'un ensemble plus petit d'étiquettes vérifiées pour guider le processus.

Link to this sectionOutils et perspectives d'avenir#

À mesure que les modèles d'apprentissage profond (DL) augmentent en taille, l'efficacité de l'utilisation des données devient primordiale. Des frameworks modernes comme PyTorch et TensorFlow fournissent le backend informatique pour ces boucles d'entraînement avancées. De plus, des outils comme la plateforme Ultralytics simplifient le cycle de vie de la gestion des jeux de données. En utilisant des fonctionnalités comme l'auto-annotation, les équipes peuvent mettre en œuvre des flux de travail semi-supervisés plus facilement, transformant rapidement les données brutes en poids de modèle prêts pour la production. Cette évolution dans le MLOps garantit que la barrière à l'entrée pour créer des systèmes de vision de haute précision continue de baisser.

Explore solutions

IA dans la robotique

Équipe tes machines plus intelligentes avec les modèles Ultralytics YOLO. La vision par IA dans la robotique propulse la navigation autonome, la perception, le suivi d'objets et le contrôle en temps réel.

Semi-Supervised Learning

Link to this sectionMécanismes fondamentaux de l'apprentissage semi-supervisé#

Link to this sectionMise en œuvre pratique avec YOLO#

Link to this sectionApplications concrètes#

Link to this sectionDistinguer les concepts apparentés#

Link to this sectionOutils et perspectives d'avenir#

Explore solutions

IA dans la robotique

IA dans la logistique

IA dans le commerce de détail

IA dans la santé

IA dans la fabrication

IA dans l'automobile

IA en agriculture

IA dans la robotique

IA dans la logistique

IA dans le commerce de détail

IA dans la santé

IA dans la fabrication

IA dans l'automobile

IA en agriculture

IA dans la robotique

IA dans la logistique

IA dans le commerce de détail

IA dans la santé

IA dans la fabrication

IA dans l'automobile

IA en agriculture

Construisons ensemble le futur de l'IA !