Glossaire

Estimation de la pose

Découvrez l'estimation de la pose : comment fonctionnent les modèles de points clés (descendants ou ascendants), les utilisations concrètes dans les domaines de la santé et du sport, ainsi que les principaux avantages et défis.

L'estimation de la pose est une tâche vision par ordinateur (CV) qui va au-delà de la la détection d'objets pour identifier leur géométrie et leur orientation spécifiques. En déterminant les coordonnées de points de repère structurels - connus sous le nom de points clés - cettetechnologie crée une représentation squelettique d'un sujet. représentation squelettique d'un sujet. Chez l'homme, ces points clés correspondent généralement aux principales articulations telles que les épaules, les coudes, les hanches et les genoux, les hanches et les genoux. Cette capacité permet aux modèles d'apprentissage automatique d'interpréter le d'interpréter le langage corporel, l'activité et la posture, comblant ainsi le fossé entre la simple détection de pixels et la compréhension de comportements physiques complexes. comportements physiques complexes.

Mécanismes et approches de base

L'estimation moderne de la pose s'appuie fortement sur sur les architectures d'apprentissage profond (DL), en particulier les réseaux neuronaux convolutifs (CNN) et, de plus en plus, les transformateurs. Le processus s'articule généralement autour de deux méthodologies principales :

Approche descendante : Cette méthode utilise d'abord un modèle de modèle de détection d'objets pour localiser des instances des instances individuelles (par exemple, des humains) à l'intérieur d'une boîte de délimitation. Une fois recadrées, le système estime les points clés pour cette seule personne. Cette méthode est souvent plus précise mais coûteuse en calcul lorsque le nombre de personnes augmente. de calcul lorsque le nombre de personnes augmente.
Approche ascendante : Le modèle détecte d'abord tous les points clés potentiels de l'image entière (par exemple, chaque coude gauche), puis les associe pour former des squelettes distincts. (par exemple, chaque coude gauche) et les associe ensuite pour former des squelettes distincts. Cette méthode est souvent préférée pour l'inférence en temps réel dans les scènes encombrées. pour l'inférence en temps réel dans les scènes car le temps de traitement dépend moins du nombre de sujets.

Pour les applications à haute performance, des modèles tels que Ultralytics YOLO11 intègrent ces concepts pour fournir une estimation rapide de la pose, adaptée aux appareils périphériques.

Distinguer les concepts apparentés

Il est essentiel de différencier l'estimation de la pose des tâches visuelles similaires :

Versus Object Detection (détection d'objets) : Alors que détection d 'objets identifie où se trouve un objet et ce qu'il est (étiquette de classe), elle traite l'objet comme une boîte rigide. ce qu' il est (étiquette de classe), elle traite l'objet comme une boîte rigide. L'estimation de la pose révèle la structure structure interne et l'articulation à l'intérieur de cette boîte.
Versus Instance Segmentation : La segmentation par instance fournit un masque un masque parfait en pixels de la forme d'un objet. Bien qu'elle délimite la frontière, elle n'identifie pas explicitement les articulations ou les liens squelettiques, ce qui est nécessaire pour analyser la dynamique des mouvements ou la structure du corps. squelette, ce qui est nécessaire pour analyser la dynamique ou la cinématique d'un mouvement. cinématique.

Applications concrètes

L'utilité de l'estimation de la pose s'étend à divers secteurs d'activité où l'analyse des mouvements est cruciale.

Soins de santé et réadaptation

Dans le domaine de l'IA dans les soins de santé, l'estimation de la pose contribue à la thérapie physique en suivant automatiquement les mouvements du patient. Les systèmes peuvent mesurer l'angle des articulations pendant les exercices de rééducation pour s'assurer que les patients conservent une forme correcte, réduisant ainsi le risque de nouvelles blessures. Cela permet Cela permet une surveillance à distance et des progrès en matière de télésanté, rendant les soins de qualité plus accessibles.

Analyse du sport et biomécanique

Les entraîneurs et les athlètes utilisent l'analyse sportive pour analyser les performances. En extrayant des biomécaniques à partir de séquences vidéo, l'IA peut analyser le plan de swing d'un golfeur ou l'efficacité de la démarche d'un coureur sans avoir recours aux combinaisons de marquage intrusives utilisées dans la capture de mouvement traditionnelle. de marqueurs intrusifs utilisés dans la capture de mouvement traditionnelle.

Exemple de code : Estimation de la pose avec YOLO11

Le texte suivant Python montre comment charger un modèle YOLO11 pré-entraîné et d'effectuer une estimation de la pose sur une image. Pour ce faire, il est nécessaire d'utiliser la fonction ultralytics et visualise la sortie du sortie squelettique.

from ultralytics import YOLO

# Load the official YOLO11 nano pose model
model = YOLO("yolo11n-pose.pt")

# Run inference on an image source
results = model("https://docs.ultralytics.com/usage/python/")

# Visualize the detected keypoints and skeleton
results[0].show()

Défis et données

L'apprentissage de modèles de pose robustes nécessite des ensembles de données massifs et annotés. Les références standard telles que l'ensemble de donnéesCOCO Pose fournissent des milliers de figures humaines étiquetées. des milliers de figures humaines étiquetées. Cependant, des défis persistent, tels que l'occlusion (lorsque des parties du corps sont cachées) et l'auto-occlusion (lorsqu'une personne bloque ses propres membres). sont cachées) et l'auto-occlusion (lorsqu'une personne bloque ses propres membres). Pour y remédier, il faut des techniques avancées d'augmentation des données et des données d'entraînement variées couvrant divers angles et conditions conditions d'éclairage.

En outre, le déploiement de ces modèles sur des dispositifs d'IA en périphérie nécessite une optimisation minutieuse, telle que la quantification du modèle, afin de maintenir une précision élevée sans sacrifier la vitesse.

Estimation de la pose

Former les modèlesYOLO d'Ultralytics pour rationaliser les flux de travail dans tous les secteurs d'activité

Solution de licence d'entreprise flexible pour dynamiser votre innovation

Former des modèles d'IA en quelques secondes avec Ultralytics YOLO

Mécanismes et approches de base

Distinguer les concepts apparentés

Applications concrètes

Soins de santé et réadaptation

Analyse du sport et biomécanique

Exemple de code : Estimation de la pose avec YOLO11

Défis et données

En savoir plus dans cette catégorie

La vision par ordinateur rend les jumelles d'observation des oiseaux plus intelligentes

Apprentissage auto-supervisé pour le débruitage : une analyse étape par étape

Tendances futures en matière de détection d'objets : 7 éléments clés à surveiller

Rejoindre la communauté Ultralytics