Pose Estimation
Apprends comment l'estimation de pose utilise des points clés pour suivre le mouvement. Explore les applications réelles et commence avec Ultralytics YOLO26 pour des résultats rapides et précis.
L'estimation de pose est une technique spécialisée de vision par ordinateur qui va au-delà de la simple détection de présence d'objets pour comprendre leur structure géométrique et leur orientation physique. Alors que la détection d'objets standard dessine une simple boîte rectangulaire autour d'un sujet, l'estimation de pose identifie des points sémantiques spécifiques, appelés keypoints, tels que les articulations d'un corps humain (coudes, genoux, épaules) ou les coins structurels d'un véhicule. En cartographiant ces repères, les modèles d'apprentissage automatique peuvent reconstruire une représentation squelettique du sujet, permettant aux systèmes d'interpréter le langage corporel, la dynamique des mouvements et le positionnement précis dans un espace 2D ou 3D.
Link to this sectionMécanismes fondamentaux : Top-Down vs Bottom-Up#
L'estimation de pose moderne repose largement sur des architectures sophistiquées d'apprentissage profond, utilisant souvent des réseaux de neurones convolutifs (CNN) pour traiter les données visuelles. Les algorithmes suivent généralement l'une des deux stratégies principales pour identifier les keypoints :
- Approches Top-Down : Cette méthode utilise d'abord un modèle de détection d'objets pour localiser les instances individuelles à l'intérieur de bounding boxes. Une fois qu'une personne ou un objet est extrait de l'image globale, l'estimateur de pose prédit les keypoints à l'intérieur de cette région spécifique. Cette approche est souvent très précise mais peut souffrir d'une latence d'inférence plus élevée à mesure que le nombre de sujets dans le cadre augmente.
- Approches Bottom-Up : À l'inverse, cette stratégie détecte tous les keypoints potentiels dans l'image entière simultanément (par exemple, en trouvant chaque « genou gauche » dans une foule), puis utilise des algorithmes d'association pour les regrouper en squelettes individuels. Cette méthode est généralement privilégiée pour l'inférence en temps réel dans les scènes encombrées, car le coût de calcul reste relativement constant, quel que soit le nombre de personnes présentes.
Des modèles de pointe comme YOLO26 utilisent des architectures de bout en bout avancées qui équilibrent ces besoins, offrant une estimation de pose à haute vitesse adaptée au déploiement sur des appareils d'edge AI et des plateformes mobiles.
Link to this sectionDistinction des termes liés à la vision par ordinateur#
Il est utile de différencier l'estimation de pose d'autres tâches de reconnaissance visuelle pour comprendre sa valeur unique dans les flux de travail de vision par ordinateur :
- Détection d'objets : Se concentre sur l'identification de quoi et où se trouve un objet, en produisant une boîte rectangulaire. Elle traite le sujet comme un objet rigide sans comprendre son articulation interne.
- Segmentation d'instance : Génère un masque au niveau du pixel soulignant la forme précise de l'objet. Bien que la segmentation fournisse des limites, elle n'identifie pas explicitement les articulations ou les liaisons squelettiques nécessaires à l'analyse cinématique.
- Estimation de pose : Cible spécifiquement la structure interne, en cartographiant les connexions entre des points de repère prédéterminés (par exemple, de la hanche au genou) pour analyser la posture et l'action.
Link to this sectionApplications concrètes#
La capacité à numériser les mouvements humains et d'objets a conduit à des applications transformatrices dans diverses industries, souvent entraînées à l'aide d'outils tels que la Ultralytics Platform pour gérer de grands ensembles de données de keypoints annotés.
Link to this sectionSoins de santé et rééducation#
Dans le domaine médical, l'AI in healthcare utilise l'estimation de pose pour surveiller la rééducation des patients à distance. En suivant les angles des articulations et l'amplitude des mouvements, les systèmes automatisés peuvent s'assurer que les patients effectuent correctement leurs exercices de physiothérapie à domicile. Cela réduit le risque de récidive et permet aux cliniciens de quantifier les progrès de la récupération sans avoir besoin d'équipements de laboratoire coûteux.
Link to this sectionAnalytique sportive#
Les entraîneurs et les athlètes exploitent l'analytique sportive pour optimiser les performances. Les modèles d'estimation de pose peuvent analyser le plan de swing d'un golfeur, la longueur de foulée d'un coureur ou la biomécanique d'un lanceur sans avoir besoin des combinaisons à marqueurs intrusives utilisées dans la capture de mouvement traditionnelle. Cela fournit un retour immédiat basé sur les données pour améliorer la technique et prévenir les blessures dues à la surutilisation.
Link to this sectionCommerce de détail et analyse comportementale#
Dans les environnements commerciaux, les systèmes d'AI in retail utilisent la détection de pose pour comprendre le comportement des clients, comme le fait d'atteindre des produits sur des étagères hautes ou de s'attarder dans des allées spécifiques. Ces données aident à optimiser l'agencement des magasins et à améliorer la gestion des stocks en corrélant les actions physiques avec les décisions d'achat.
Link to this sectionExemple de code : Estimation de pose avec YOLO26#
La mise en œuvre de l'estimation de pose est simple avec les frameworks Python modernes. L'exemple suivant montre comment utiliser le package ultralytics pour charger un modèle YOLO26 pré-entraîné (le successeur de YOLO11) et détecter les keypoints humains dans une image.
from ultralytics import YOLO
# Load the YOLO26 pose model (nano version for speed)
model = YOLO("yolo26n-pose.pt")
# Perform inference on an image source
# The model identifies bounding boxes and specific keypoints (joints)
results = model("https://ultralytics.com/images/bus.jpg")
# Print the xy coordinates of detected keypoints
print(results[0].keypoints.xy)
# Visualize the skeletal results directly
results[0].show()





