Connectez-vous à YOLO Vision 2025 !
25 septembre 2025
10:00 — 18:00, heure d'été britannique
Événement hybride
Yolo Vision 2024
Glossaire

Apprentissage non supervisé

Découvrez comment l'apprentissage non supervisé utilise le clustering, la réduction de dimensionnalité et la détection d'anomalies pour découvrir des schémas cachés dans les données.

L'apprentissage non supervisé est un paradigme fondamental de l'apprentissage automatique (ML) où les algorithmes sont entraînés sur des données qui n'ont pas été étiquetées, classifiées ou catégorisées. Contrairement à d'autres méthodes, le système essaie d'apprendre les modèles et la structure directement à partir des données elles-mêmes, sans aucune étiquette de sortie correspondante. L'objectif principal est d'explorer les données et de trouver des structures ou des modèles significatifs, ce qui en fait un outil clé pour l'exploration et l'analyse des données dans le domaine de l'intelligence artificielle (IA).

Tâches principales d'apprentissage non supervisé

Les algorithmes d'apprentissage non supervisé sont généralement utilisés pour l'analyse exploratoire des données et peuvent être regroupés en plusieurs tâches principales :

  • Clustering : Il s'agit de la tâche d'apprentissage non supervisé la plus courante, impliquant le regroupement de points de données en clusters en fonction de leurs similitudes. L'objectif est de rendre les points de données au sein d'un même cluster très similaires les uns aux autres et dissemblables aux points des autres clusters. Les algorithmes populaires incluent le clustering K-Means et le DBSCAN.
  • Réduction de la dimensionnalité : Cette technique est utilisée pour réduire le nombre de variables d'entrée dans un ensemble de données. Elle est utile lorsque l'on travaille avec des données de grande dimension, car elle peut simplifier les modèles, réduire le temps de calcul et faciliter la visualisation des données. L'analyse en composantes principales (ACP) est une méthode largement utilisée pour cette tâche.
  • Exploration des règles d'association : Cette méthode découvre des relations intéressantes ou des règles d'association entre les variables dans de grandes bases de données. Un exemple classique est l'"analyse du panier de marché", qui trouve des relations entre les articles fréquemment achetés ensemble dans un magasin.

Applications concrètes

L'apprentissage non supervisé stimule l'innovation dans de nombreux secteurs. Voici quelques exemples concrets :

  1. Segmentation de la clientèle : Les entreprises de vente au détail et de commerce électronique utilisent des algorithmes de clustering pour regrouper les clients ayant des comportements et des préférences similaires. En analysant l'historique des achats, l'activité de navigation et les données démographiques, les entreprises peuvent créer des campagnes de marketing ciblées, offrir des recommandations personnalisées et améliorer l'expérience client, ce qui stimule en fin de compte l'IA dans le commerce de détail.
  2. Détection d'anomalies : En cybersécurité, les modèles d'apprentissage non supervisé peuvent identifier un trafic réseau inhabituel qui peut indiquer une violation de sécurité. De même, dans le secteur de la fabrication, ces algorithmes peuvent détecter des défauts dans les produits sur une chaîne de montage en identifiant les écarts par rapport à la norme, un élément clé du contrôle qualité moderne.

Comparaison avec d'autres paradigmes d'apprentissage

L'apprentissage non supervisé diffère considérablement des autres approches de ML :

L'apprentissage non supervisé est un outil puissant pour explorer les données, découvrir des structures cachées et extraire des caractéristiques précieuses. Il sert souvent de première étape essentielle dans les pipelines complexes de science des données, par exemple en effectuant un prétraitement des données avant d'introduire les données dans un modèle supervisé. Des plateformes comme Ultralytics HUB fournissent des environnements où divers modèles de ML, intégrant potentiellement des techniques non supervisées pour l'analyse des ensembles de données, peuvent être développés et gérés. Des frameworks tels que PyTorch et TensorFlow offrent de vastes bibliothèques qui prennent en charge l'implémentation d'algorithmes non supervisés, et vous pouvez explorer davantage avec des ressources comme le guide d'apprentissage non supervisé de Scikit-learn.

Rejoignez la communauté Ultralytics

Rejoignez le futur de l'IA. Connectez-vous, collaborez et évoluez avec des innovateurs mondiaux.

Rejoindre maintenant
Lien copié dans le presse-papiers