Découvrez l'estimation de la pose : comment fonctionnent les modèles de points clés (descendants ou ascendants), les utilisations concrètes dans les domaines de la santé et du sport, ainsi que les principaux avantages et défis.
L'estimation de la pose est une tâche vision par ordinateur (CV) qui va au-delà de la la détection d'objets pour identifier leur géométrie et leur orientation spécifiques. En déterminant les coordonnées de points de repère structurels - connus sous le nom de points clés - cettetechnologie crée une représentation squelettique d'un sujet. représentation squelettique d'un sujet. Chez l'homme, ces points clés correspondent généralement aux principales articulations telles que les épaules, les coudes, les hanches et les genoux, les hanches et les genoux. Cette capacité permet aux modèles d'apprentissage automatique d'interpréter le d'interpréter le langage corporel, l'activité et la posture, comblant ainsi le fossé entre la simple détection de pixels et la compréhension de comportements physiques complexes. comportements physiques complexes.
L'estimation moderne de la pose s'appuie fortement sur sur les architectures d'apprentissage profond (DL), en particulier les réseaux neuronaux convolutifs (CNN) et, de plus en plus, les transformateurs. Le processus s'articule généralement autour de deux méthodologies principales :
Pour les applications à haute performance, des modèles tels que Ultralytics YOLO11 intègrent ces concepts pour fournir une estimation rapide de la pose, adaptée aux appareils périphériques.
Il est essentiel de différencier l'estimation de la pose des tâches visuelles similaires :
L'utilité de l'estimation de la pose s'étend à divers secteurs d'activité où l'analyse des mouvements est cruciale.
Dans le domaine de l'IA dans les soins de santé, l'estimation de la pose contribue à la thérapie physique en suivant automatiquement les mouvements du patient. Les systèmes peuvent mesurer l'angle des articulations pendant les exercices de rééducation pour s'assurer que les patients conservent une forme correcte, réduisant ainsi le risque de nouvelles blessures. Cela permet Cela permet une surveillance à distance et des progrès en matière de télésanté, rendant les soins de qualité plus accessibles.
Les entraîneurs et les athlètes utilisent l'analyse sportive pour analyser les performances. En extrayant des biomécaniques à partir de séquences vidéo, l'IA peut analyser le plan de swing d'un golfeur ou l'efficacité de la démarche d'un coureur sans avoir recours aux combinaisons de marquage intrusives utilisées dans la capture de mouvement traditionnelle. de marqueurs intrusifs utilisés dans la capture de mouvement traditionnelle.
Le texte suivant Python montre comment charger un modèle YOLO11 pré-entraîné
et d'effectuer une estimation de la pose sur une image. Pour ce faire, il est nécessaire d'utiliser la fonction ultralytics et visualise la sortie du
sortie squelettique.
from ultralytics import YOLO
# Load the official YOLO11 nano pose model
model = YOLO("yolo11n-pose.pt")
# Run inference on an image source
results = model("https://docs.ultralytics.com/usage/python/")
# Visualize the detected keypoints and skeleton
results[0].show()
L'apprentissage de modèles de pose robustes nécessite des ensembles de données massifs et annotés. Les références standard telles que l'ensemble de donnéesCOCO Pose fournissent des milliers de figures humaines étiquetées. des milliers de figures humaines étiquetées. Cependant, des défis persistent, tels que l'occlusion (lorsque des parties du corps sont cachées) et l'auto-occlusion (lorsqu'une personne bloque ses propres membres). sont cachées) et l'auto-occlusion (lorsqu'une personne bloque ses propres membres). Pour y remédier, il faut des techniques avancées d'augmentation des données et des données d'entraînement variées couvrant divers angles et conditions conditions d'éclairage.
En outre, le déploiement de ces modèles sur des dispositifs d'IA en périphérie nécessite une optimisation minutieuse, telle que la quantification du modèle, afin de maintenir une précision élevée sans sacrifier la vitesse.