Découvre YOLO26 : l'IA de vision de nouvelle génération.
Ultralytics
Retour au glossaire Ultralytics

K-Means Clustering

Explore le K-Means Clustering pour l'apprentissage non supervisé. Découvre comment cet algorithme partitionne les données, améliore les applications IA et informe des modèles comme Ultralytics YOLO26.

Le clustering K-means est un algorithme fondamental et largement utilisé dans le domaine de l'apprentissage non supervisé conçu pour découvrir des structures cachées au sein de données non étiquetées. Son objectif principal est de partitionner un jeu de données en sous-groupes distincts, appelés clusters, de sorte que les points de données au sein d'un même groupe soient aussi similaires que possible, tandis que ceux appartenant à des groupes différents soient distincts. En tant que pierre angulaire du data mining et de l'analyse exploratoire, K-means permet aux data scientists d'organiser automatiquement des informations complexes en catégories gérables sans avoir besoin d'étiquettes prédéfinies ou de supervision humaine.

Link to this sectionComment fonctionne l'algorithme#

Le fonctionnement de K-means est itératif et repose sur des mesures de distance pour déterminer le regroupement optimal des données d'entraînement. L'algorithme opère en organisant les éléments en K clusters, où chaque élément appartient au cluster dont la moyenne, ou centroïde, est la plus proche. Ce processus minimise la variance au sein de chaque groupe. Le flux de travail suit généralement ces étapes :

  1. Initialisation : L'algorithme sélectionne K points initiaux comme centroïdes. Ceux-ci peuvent être choisis de manière aléatoire ou via des méthodes optimisées comme k-means++ pour accélérer la convergence.

  2. Affectation : Chaque point de données du jeu de données est affecté au centroïde le plus proche sur la base d'une métrique de distance spécifique, le plus souvent la distance euclidienne.

  3. Mise à jour : Les centroïdes sont recalculés en prenant la moyenne de tous les points de données affectés à ce cluster.

  4. Itération : Les étapes 2 et 3 sont répétées jusqu'à ce que les centroïdes ne bougent plus de manière significative ou qu'un nombre maximum d'itérations soit atteint.

Déterminer le nombre correct de clusters (K) est un aspect critique de l'utilisation de cet algorithme. Les praticiens utilisent souvent des techniques comme la méthode du coude ou analysent le score de silhouette pour évaluer à quel point les clusters résultants sont bien séparés.

Link to this sectionApplications concrètes en IA#

Le clustering K-means est extrêmement polyvalent et trouve son utilité dans diverses industries pour la simplification et le prétraitement des données.

  • Compression d'images et quantification des couleurs : En vision par ordinateur (CV), K-means aide à réduire la taille des fichiers d'images en regroupant les couleurs des pixels. En regroupant des milliers de couleurs dans un ensemble plus restreint de couleurs dominantes, l'algorithme effectue efficacement une réduction de dimensionnalité tout en préservant la structure visuelle de l'image. Cette technique est souvent utilisée avant d'entraîner des modèles avancés de détection d'objets pour normaliser les données d'entrée.
  • Segmentation client : Les entreprises tirent parti du clustering pour regrouper les clients en fonction de leur historique d'achat, de leurs données démographiques ou de leur comportement sur le site Web. Cela permet d'élaborer des stratégies marketing ciblées, une composante clé des solutions d'IA dans le commerce de détail. En identifiant les acheteurs à forte valeur ajoutée ou les risques d'attrition, les entreprises peuvent adapter efficacement leur communication.
  • Détection d'anomalies : En apprenant la structure des clusters de données « normales », les systèmes peuvent identifier les valeurs aberrantes qui s'éloignent de tout centroïde. Cela est précieux pour la détection de la fraude dans la finance et la détection d'anomalies dans la sécurité réseau, ce qui aide à signaler les activités suspectes qui s'écartent des modèles standards.
  • Génération de boîtes d'ancrage (Anchor Boxes) : Historiquement, les détecteurs d'objets comme les anciennes versions de YOLO utilisaient K-means pour calculer des anchor boxes optimales à partir des jeux de données d'entraînement. Bien que les modèles modernes comme YOLO26 utilisent des méthodes avancées sans ancres, comprendre K-means reste pertinent pour l'évolution des architectures de détection.

Link to this sectionExemple d'implémentation#

Bien que les frameworks de deep learning comme la Ultralytics Platform gèrent des pipelines d'entraînement complexes, K-means est souvent utilisé pour analyser les statistiques des jeux de données. L'extrait Python suivant démontre comment clusteriser des coordonnées 2D—simulant des centroïdes d'objets—en utilisant la bibliothèque populaire Scikit-learn.

import numpy as np
from sklearn.cluster import KMeans

# Simulated coordinates of detected objects (e.g., from YOLO26 inference)
points = np.array([[10, 10], [12, 11], [100, 100], [102, 101], [10, 12], [101, 102]])

# Initialize K-Means to find 2 distinct groups (clusters)
kmeans = KMeans(n_clusters=2, random_state=0, n_init="auto").fit(points)

# Output the cluster labels (0 or 1) for each point
print(f"Cluster Labels: {kmeans.labels_}")
# Output: [1 1 0 0 1 0] -> Points near (10,10) are Cluster 1, near (100,100) are Cluster 0

Link to this sectionComparaison avec des algorithmes associés#

Il est important de distinguer K-means d'autres algorithmes ayant des noms ou des fonctions similaires afin de garantir que le bon outil est sélectionné pour un projet.

  • K-means vs. K-Nearest Neighbors (KNN) : Ils sont souvent confondus en raison du « K » dans leurs noms. K-means est un algorithme non supervisé utilisé pour le clustering de données non étiquetées. À l'inverse, K-Nearest Neighbors (KNN) est un algorithme d'apprentissage supervisé utilisé pour la classification d'images et la régression, s'appuyant sur des données étiquetées pour faire des prédictions basées sur la classe majoritaire des voisins.
  • K-means vs. DBSCAN : Bien que les deux permettent de clusteriser des données, K-means suppose que les clusters sont sphériques et exige que le nombre de clusters soit défini à l'avance. DBSCAN groupe les données en fonction de leur densité, peut trouver des clusters de formes arbitraires et gère mieux le bruit. Cela rend DBSCAN supérieur pour les données spatiales complexes trouvées dans des datasets avec des structures irrégulières où le nombre de clusters est inconnu.

Explore solutions

Real-time AI that works with your team

IA dans la robotique

Équipe tes machines plus intelligentes avec les modèles Ultralytics YOLO. La vision par IA dans la robotique propulse la navigation autonome, la perception, le suivi d'objets et le contrôle en temps réel.
En savoir plus
Real-time AI that works with your team

IA dans la logistique

Simplifie la logistique avec les modèles Ultralytics YOLO. La vision par IA permet l'inspection des colis, le tri, le suivi des véhicules et la surveillance de la sécurité des entrepôts en temps réel.
En savoir plus
Real-time AI that works with your team

IA dans le commerce de détail

Réinvente le commerce de détail avec les modèles Ultralytics YOLO. La vision par IA alimente le suivi des stocks, la surveillance des étagères, la gestion des files d'attente et des informations plus intelligentes sur les clients.
En savoir plus
Real-time AI that works with your team

IA dans la santé

Construis des solutions de santé avec les modèles Ultralytics YOLO. L'IA de vision dans la santé permet une imagerie médicale plus rapide, des diagnostics plus intelligents et une surveillance des patients.
En savoir plus
Real-time AI that works with your team

IA dans la fabrication

Optimise la fabrication avec les modèles Ultralytics YOLO. La vision par IA favorise le contrôle qualité, la détection des défauts, la conformité aux EPI et l'automatisation des chaînes de montage.
En savoir plus
Real-time AI that works with your operation

IA dans l'automobile

Applique la vision par ordinateur dans l'automobile avec les modèles Ultralytics YOLO. L'IA de vision améliore la sécurité routière, l'assistance à la conduite et l'automatisation des véhicules pour des routes plus intelligentes.
En savoir plus
Real-time AI tailored to your operation

IA en agriculture

Intègre l'IA de vision à l'agriculture intelligente avec les modèles Ultralytics YOLO. Optimise la surveillance des cultures, le suivi du bétail et l'agriculture de précision pour des rendements plus élevés et plus intelligents.
En savoir plus
Real-time AI that works with your team

IA dans la robotique

Équipe tes machines plus intelligentes avec les modèles Ultralytics YOLO. La vision par IA dans la robotique propulse la navigation autonome, la perception, le suivi d'objets et le contrôle en temps réel.
En savoir plus
Real-time AI that works with your team

IA dans la logistique

Simplifie la logistique avec les modèles Ultralytics YOLO. La vision par IA permet l'inspection des colis, le tri, le suivi des véhicules et la surveillance de la sécurité des entrepôts en temps réel.
En savoir plus
Real-time AI that works with your team

IA dans le commerce de détail

Réinvente le commerce de détail avec les modèles Ultralytics YOLO. La vision par IA alimente le suivi des stocks, la surveillance des étagères, la gestion des files d'attente et des informations plus intelligentes sur les clients.
En savoir plus
Real-time AI that works with your team

IA dans la santé

Construis des solutions de santé avec les modèles Ultralytics YOLO. L'IA de vision dans la santé permet une imagerie médicale plus rapide, des diagnostics plus intelligents et une surveillance des patients.
En savoir plus
Real-time AI that works with your team

IA dans la fabrication

Optimise la fabrication avec les modèles Ultralytics YOLO. La vision par IA favorise le contrôle qualité, la détection des défauts, la conformité aux EPI et l'automatisation des chaînes de montage.
En savoir plus
Real-time AI that works with your operation

IA dans l'automobile

Applique la vision par ordinateur dans l'automobile avec les modèles Ultralytics YOLO. L'IA de vision améliore la sécurité routière, l'assistance à la conduite et l'automatisation des véhicules pour des routes plus intelligentes.
En savoir plus
Real-time AI tailored to your operation

IA en agriculture

Intègre l'IA de vision à l'agriculture intelligente avec les modèles Ultralytics YOLO. Optimise la surveillance des cultures, le suivi du bétail et l'agriculture de précision pour des rendements plus élevés et plus intelligents.
En savoir plus
Real-time AI that works with your team

IA dans la robotique

Équipe tes machines plus intelligentes avec les modèles Ultralytics YOLO. La vision par IA dans la robotique propulse la navigation autonome, la perception, le suivi d'objets et le contrôle en temps réel.
En savoir plus
Real-time AI that works with your team

IA dans la logistique

Simplifie la logistique avec les modèles Ultralytics YOLO. La vision par IA permet l'inspection des colis, le tri, le suivi des véhicules et la surveillance de la sécurité des entrepôts en temps réel.
En savoir plus
Real-time AI that works with your team

IA dans le commerce de détail

Réinvente le commerce de détail avec les modèles Ultralytics YOLO. La vision par IA alimente le suivi des stocks, la surveillance des étagères, la gestion des files d'attente et des informations plus intelligentes sur les clients.
En savoir plus
Real-time AI that works with your team

IA dans la santé

Construis des solutions de santé avec les modèles Ultralytics YOLO. L'IA de vision dans la santé permet une imagerie médicale plus rapide, des diagnostics plus intelligents et une surveillance des patients.
En savoir plus
Real-time AI that works with your team

IA dans la fabrication

Optimise la fabrication avec les modèles Ultralytics YOLO. La vision par IA favorise le contrôle qualité, la détection des défauts, la conformité aux EPI et l'automatisation des chaînes de montage.
En savoir plus
Real-time AI that works with your operation

IA dans l'automobile

Applique la vision par ordinateur dans l'automobile avec les modèles Ultralytics YOLO. L'IA de vision améliore la sécurité routière, l'assistance à la conduite et l'automatisation des véhicules pour des routes plus intelligentes.
En savoir plus
Real-time AI tailored to your operation

IA en agriculture

Intègre l'IA de vision à l'agriculture intelligente avec les modèles Ultralytics YOLO. Optimise la surveillance des cultures, le suivi du bétail et l'agriculture de précision pour des rendements plus élevés et plus intelligents.
En savoir plus

Construisons ensemble le futur de l'IA !

Commence ton aventure avec le futur de l'apprentissage automatique