Yolo Vision Shenzhen
Shenzhen
Rejoindre maintenant
Glossaire

Estimation de la pose

Découvrez l'estimation de la pose : comment fonctionnent les modèles de points clés (descendants ou ascendants), les utilisations concrètes dans les domaines de la santé et du sport, ainsi que les principaux avantages et défis.

L'estimation de la pose est une tâche spécialisée de vision par ordinateur qui va au-delà de la détection d'objets pour identifier leur géométrie et leur orientation spécifiques. En localisant avec précision les coordonnées des repères structurels appelés « points clés», cette technologie crée une représentation squelettique d'un sujet. Chez l'être humain, ces points clés correspondent généralement aux articulations principales telles que les épaules, les coudes, les hanches et les genoux. Cette capacité permet aux modèles d'apprentissage automatique d'interpréter le langage corporel , l'activité et la posture, comblant ainsi le fossé entre la simple détection de pixels et la compréhension de comportements physiques complexes .

Mécanismes et approches de base

L'estimation moderne des poses repose largement sur les architectures d'apprentissage profond, en particulier les réseaux neuronaux convolutifs (CNN) et, de plus en plus, les transformateurs. Le processus se divise généralement en deux méthodologies principales :

  • Approche descendante : Cette méthode utilise d'abord un modèle de modèle de détection d'objets pour localiser des instances des instances individuelles (par exemple, des humains) à l'intérieur d'une boîte de délimitation. Une fois recadrées, le système estime les points clés pour cette seule personne. Cette méthode est souvent plus précise mais coûteuse en calcul lorsque le nombre de personnes augmente. de calcul lorsque le nombre de personnes augmente.
  • Approche ascendante : Le modèle détecte d'abord tous les points clés potentiels de l'image entière (par exemple, chaque coude gauche), puis les associe pour former des squelettes distincts. (par exemple, chaque coude gauche) et les associe ensuite pour former des squelettes distincts. Cette méthode est souvent préférée pour l'inférence en temps réel dans les scènes encombrées. pour l'inférence en temps réel dans les scènes car le temps de traitement dépend moins du nombre de sujets.

Pour les applications hautes performances, les derniers modèles YOLO26 intègrent ces concepts afin de fournir une estimation rapide de la pose adaptée aux appareils de pointe.

Distinguer les concepts apparentés

Il est essentiel de différencier l'estimation de la pose des tâches visuelles similaires :

  • Versus Object Detection (détection d'objets) : Alors que détection d 'objets identifie se trouve un objet et ce qu'il est (étiquette de classe), elle traite l'objet comme une boîte rigide. ce qu' il est (étiquette de classe), elle traite l'objet comme une boîte rigide. L'estimation de la pose révèle la structure structure interne et l'articulation à l'intérieur de cette boîte.
  • Versus Instance Segmentation : La segmentation par instance fournit un masque un masque parfait en pixels de la forme d'un objet. Bien qu'elle délimite la frontière, elle n'identifie pas explicitement les articulations ou les liens squelettiques, ce qui est nécessaire pour analyser la dynamique des mouvements ou la structure du corps. squelette, ce qui est nécessaire pour analyser la dynamique ou la cinématique d'un mouvement. cinématique.

Applications concrètes

L'utilité de l'estimation de la pose s'étend à divers secteurs d'activité où l'analyse des mouvements est cruciale.

Soins de santé et réadaptation

Dans le domaine de l'IA dans les soins de santé, l'estimation de la pose contribue à la thérapie physique en suivant automatiquement les mouvements du patient. Les systèmes peuvent mesurer l'angle des articulations pendant les exercices de rééducation pour s'assurer que les patients conservent une forme correcte, réduisant ainsi le risque de nouvelles blessures. Cela permet Cela permet une surveillance à distance et des progrès en matière de télésanté, rendant les soins de qualité plus accessibles.

Analyse du sport et biomécanique

Les entraîneurs et les athlètes utilisent l'analyse sportive pour analyser les performances. En extrayant des biomécaniques à partir de séquences vidéo, l'IA peut analyser le plan de swing d'un golfeur ou l'efficacité de la démarche d'un coureur sans avoir recours aux combinaisons de marquage intrusives utilisées dans la capture de mouvement traditionnelle. de marqueurs intrusifs utilisés dans la capture de mouvement traditionnelle.

Exemple de code : Estimation de pose avec YOLO26

Le texte suivant Python Cet extrait de code montre comment charger un modèle YOLO26 pré-entraîné et effectuer une estimation de pose sur une image. Cela nécessite le ultralytics et visualise la sortie du sortie squelettique.

from ultralytics import YOLO

# Load the official YOLO26 nano pose model
model = YOLO("yolo26n-pose.pt")

# Run inference on an image source to detect keypoints
results = model("path/to/image.jpg")

# Visualize the detected keypoints and skeleton
results[0].show()

Défis et données

L'apprentissage de modèles de pose robustes nécessite des ensembles de données massifs et annotés. Les références standard telles que l'ensemble de donnéesCOCO Pose fournissent des milliers de figures humaines étiquetées. des milliers de figures humaines étiquetées. Cependant, des défis persistent, tels que l'occlusion (lorsque des parties du corps sont cachées) et l'auto-occlusion (lorsqu'une personne bloque ses propres membres). sont cachées) et l'auto-occlusion (lorsqu'une personne bloque ses propres membres). Pour y remédier, il faut des techniques avancées d'augmentation des données et des données d'entraînement variées couvrant divers angles et conditions conditions d'éclairage.

De plus, le déploiement de ces modèles sur des appareils IA de pointe nécessite une optimisation minutieuse, telle que la quantification des modèles, afin de maintenir une grande précision sans sacrifier la vitesse. Les utilisateurs peuvent rationaliser ce flux de travail à l'aide de Ultralytics , qui simplifie la formation et le déploiement.

Rejoindre la communauté Ultralytics

Rejoignez le futur de l'IA. Connectez-vous, collaborez et évoluez avec des innovateurs mondiaux.

Rejoindre maintenant