Keypoints
Apprends comment les keypoints définissent la géométrie et la posture des objets dans l'IA. Explore l'estimation de pose avec Ultralytics YOLO26 et commence avec notre SDK Python facile à utiliser.
Les keypoints sont des emplacements spatiaux ou des points de repère distincts dans une image qui définissent des caractéristiques significatives d'un objet ou d'un sujet. Dans le contexte de la vision par ordinateur et de l'apprentissage automatique, un keypoint est généralement représenté par un ensemble de coordonnées (X, Y) qui localisent une partie spécifique d'un objet, telle que le coude d'une personne, le coin d'un bâtiment ou le centre d'une roue de voiture. Contrairement aux tâches plus simples qui identifient uniquement la présence d'un objet, l'identification des keypoints permet aux modèles d'intelligence artificielle (IA) de comprendre la géométrie, la posture et l'agencement structurel du sujet. Cette capacité est fondamentale pour l'analyse visuelle avancée, permettant aux machines d'interpréter le langage corporel, de suivre des mouvements précis et d'aligner des superpositions numériques avec des objets du monde réel.
Link to this sectionLe rôle des keypoints dans les modèles d'IA#
Les keypoints servent de données fondamentales pour l'estimation de pose, une technique qui cartographie la structure squelettique d'un humain ou d'un animal. En détectant un ensemble prédéfini de points—tels que les épaules, les genoux et les chevilles—les algorithmes peuvent reconstruire la pose complète d'un sujet en temps réel. Ce processus va au-delà de la détection d'objets standard, qui renvoie généralement une boîte englobante (bounding box) autour d'un objet sans comprendre sa forme interne.
Les architectures modernes, telles que le modèle de pointe Ultralytics YOLO26, ont évolué pour prédire ces keypoints avec une grande précision et vitesse. Ces modèles utilisent des réseaux de deep learning (DL) entraînés sur des ensembles de données annotés massifs, tels que COCO Keypoints, pour apprendre les motifs visuels associés aux articulations et aux traits du visage. Lors de l'inférence, le modèle régresse les coordonnées de chaque keypoint, incluant souvent un score de confiance pour indiquer la fiabilité de la prédiction.
Link to this sectionKeypoints vs concepts connexes#
Il est utile de distinguer les keypoints des autres sorties courantes de la vision par ordinateur pour comprendre leur utilité unique :
- Keypoints vs Bounding Boxes : Une bounding box fournit une localisation grossière, englobant l'objet entier dans un rectangle. Les keypoints offrent une localisation fine de parties spécifiques à l'intérieur de cet objet.
- Keypoints vs Segmentation d'image : La segmentation d'image classifie chaque pixel pour créer un masque précis de la forme de l'objet. Alors que la segmentation offre des informations détaillées sur les contours, les keypoints offrent un résumé structurel (un « squelette ») qui est souvent plus efficace pour analyser le mouvement et la cinématique.
- Keypoints vs Descripteurs de caractéristiques : Dans le traitement d'image traditionnel comme SIFT (Scale-Invariant Feature Transform), les keypoints sont des points d'intérêt (coins, blobs) utilisés pour la correspondance d'images. Dans l'estimation de pose par DL moderne, les keypoints sont des étiquettes sémantiques (par ex. « poignet gauche ») apprises par le réseau.
Link to this sectionApplications concrètes#
La capacité à suivre des parties du corps ou des caractéristiques d'objet spécifiques ouvre diverses applications à travers les industries :
- Analyse sportive : Les coachs et les athlètes utilisent l'estimation de pose pour analyser la biomécanique. En suivant les keypoints sur les articulations, les systèmes peuvent calculer des angles et des vitesses pour améliorer la technique dans des sports comme le golf, le tennis ou le sprint. Découvre comment les modèles Ultralytics YOLO suivent les swings de golf pour fournir des retours exploitables.
- Soins de santé et rééducation : Les plateformes de physiothérapie exploitent les keypoints pour surveiller les exercices des patients à distance. Le système s'assure que les patients maintiennent une forme correcte pendant les routines de rééducation, réduisant le risque de blessure et suivant les progrès de la récupération.
- Réalité augmentée (RA) : Les filtres de réseaux sociaux et les applications d'essayage virtuel reposent sur les keypoints faciaux (contours des yeux, du nez, de la bouche) pour ancrer solidement des masques ou des lunettes numériques sur le visage de l'utilisateur, maintenant l'alignement même lorsqu'il bouge.
- Surveillance du conducteur : Les systèmes de sécurité automobile suivent les points de repère faciaux pour détecter les signes de somnolence ou de distraction, alertant le conducteur si ses yeux se ferment ou si la position de sa tête indique un manque d'attention.
Link to this sectionImplémentation de la détection de keypoints avec YOLO26#
En utilisant la plateforme Ultralytics ou le SDK Python, tu peux facilement implémenter la détection de keypoints. L'exemple suivant démontre comment charger un modèle YOLO26-pose pré-entraîné et lancer l'inférence sur une image pour détecter des squelettes humains.
from ultralytics import YOLO
# Load a pre-trained YOLO26 pose estimation model
model = YOLO("yolo26n-pose.pt")
# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")
# Visualize the results showing detected keypoints and skeletons
for result in results:
result.show() # Display the image with keypoints drawn
# Access keypoint coordinates (x, y, confidence)
keypoints = result.keypoints.data
print(f"Detected keypoints shape: {keypoints.shape}")Ce flux de travail simple permet le déploiement rapide d'applications sophistiquées de vision par ordinateur (CV). Pour les utilisateurs cherchant à entraîner leurs propres modèles de keypoints personnalisés—par exemple, pour détecter des points spécifiques sur des machines industrielles ou des espèces animales—la plateforme Ultralytics simplifie le processus d'annotation des données et d'entraînement des modèles dans le cloud.
Link to this sectionConsidérations avancées#
Le déploiement réussi de la détection de keypoints nécessite de gérer des défis tels que l'occlusion (lorsqu'une partie du corps est cachée) et diverses conditions d'éclairage. Les modèles modernes traitent cela grâce à une augmentation de données robuste pendant l'entraînement, exposant le réseau à des scénarios variés. De plus, intégrer les keypoints avec des algorithmes de suivi d'objets permet une identification cohérente des individus au fil du temps dans les flux vidéo, ce qui est essentiel pour des applications comme la sécurité ou l'analyse comportementale.






