En cliquant sur « Accepter tous les cookies », vous acceptez le stockage de cookies sur votre appareil pour améliorer la navigation sur le site, analyser son utilisation et contribuer à nos efforts de marketing. Plus d’infos
Paramètres des cookies
En cliquant sur « Accepter tous les cookies », vous acceptez le stockage de cookies sur votre appareil pour améliorer la navigation sur le site, analyser son utilisation et contribuer à nos efforts de marketing. Plus d’infos
Découvrez comment Ultralytics améliore l'estimation de la pose grâce à une meilleure prise en charge des points clés non humains, une convergence plus rapide, une gestion améliorée de l'occlusion et un déploiement efficace en temps réel.
Développez vos projets de vision par ordinateur avec Ultralytics
Lorsque vous observez la posture d'une personne, il est facile de remarquer si elle est voûtée, penchée en avant ou droite. Les êtres humains peuvent rapidement comprendre comment les différentes parties du corps sont reliées entre elles.
Cela fait partie intégrante de la manière dont nous interprétons les mouvements et le langage corporel dans la vie quotidienne. Pour les machines, cependant, ce type de compréhension visuelle n'est pas automatique. Apprendre à un système à reconnaître les mouvements et les structures nécessite des techniques avancées d'apprentissage profond et de vision par ordinateur qui lui permettent d'interpréter les images de manière significative.
En particulier, l'estimation de pose est une technique d'IA visuelle qui permet à un modèle de vision par ordinateur de développer une compréhension similaire. Au lieu de simplement détecter un objet dans une image, le modèle prédit les points clés qui représentent des repères structurels importants.
Ces points clés peuvent correspondre à des articulations du corps, des membres d'animaux, des composants de machines ou même des points fixes tels que les coins d'un terrain. En identifiant et en suivant ces points, le système peut comprendre la position, l'alignement et le mouvement de manière structurée et mesurable.
À mesure que l'estimation de la pose est appliquée à davantage de scénarios réels, les modèles doivent gérer plus efficacement les points clés non humains, les scènes complexes et les ensembles de données personnalisés. Par exemple, les modèles de pointe tels que Ultralytics prennent en charge des tâches de vision par ordinateur telles que l'estimation de la pose et s'appuient sur les modèles YOLO antérieurs, avec des améliorations architecturales et d'entraînement conçues pour renforcer la flexibilité et les performances globales.
Fig. 1. Exemple d'estimation de pose rendue possible par YOLO Source)
Dans cet article, nous allons comparer YOLO26-pose aux précédents modèles Ultralytics YOLO et explorer comment il améliore la flexibilité, la vitesse de convergence et les performances dans des scènes complexes. C'est parti !
Qu'est-ce que l'estimation de pose ?
Avant de nous lancer dans la comparaison Ultralytics YOLO , examinons de plus près ce que signifie réellement l'estimation de la pose dans le contexte de la vision par ordinateur.
L'estimation de pose est une technique utilisée pour detect track des points clés track dans une image ou une trame vidéo. Ces points clés peuvent représenter des repères structurels importants, tels que les articulations du corps humain, les membres d'un animal, les composants d'une machine ou des points de référence fixes dans une scène.
Fig. 2. Estimation de la posture des travailleurs à l'aide de l'estimation de la posture humaine (Source)
En identifiant les coordonnées de ces points, un modèle peut comprendre comment un objet est positionné et comment il se déplace au fil du temps. Contrairement à la classification d'images, qui attribue une seule étiquette à une image entière, ou aux modèles de détection d'objets, qui se concentrent sur le tracé de cadres autour des objets, l'estimation de la pose fournit des informations spatiales plus détaillées sur la structure et le mouvement.
Présentation générale de YOLO26-pose
YOLO26-pose est disponible en plusieurs variantes ou tailles de modèles, y compris des options légères comme YOLO26n-pose et des modèles plus grands tels que YOLO26m-pose, YOLO26l-pose et YOLO26x-pose. Cela permet aux équipes de choisir le bon équilibre entre vitesse et précision en fonction de leur matériel et de leurs besoins en matière de performances.
Ultralytics fournit Ultralytics des modèles de pose pré-entraînés sur de grands ensembles de données généraux tels que COCO , en particulier les annotations COCO(COCO ) pour l'estimation de la pose humaine, afin que vous n'ayez pas à partir de zéro. Dans la plupart des cas, les équipes affinent ces modèles sur leur propre ensemble de données afin de les adapter à des points clés, des dispositions ou des environnements spécifiques.
Cela implique généralement la préparation de fichiers d'annotation personnalisés qui définissent les coordonnées des points clés et les étiquettes de classe dans un format structuré. Ces annotations associent les points clés à des coordonnées de pixels spécifiques dans chaque image, ce qui permet au modèle d'apprendre des relations spatiales précises pendant l'entraînement.
L'utilisation de modèles pré-entraînés accélère l'entraînement, réduit les besoins en données et permet de mettre les projets en production plus efficacement.
Applications concrètes de l'estimation de la posture humaine
Voici un aperçu de quelques cas d'utilisation concrets dans lesquels l'estimation de la pose joue un rôle important :
Soins de santé et rééducation : les cliniciens peuvent utiliser des modèles de posture pour évaluer la posture, suivre les progrès de la guérison et analyser les schémas de mouvement pendant la kinésithérapie.
Systèmes autonomes : les drones et les caméras intelligentes peuvent utiliser les informations de pose pour mieux comprendre l'orientation et le mouvement des objets dans des scènes dynamiques.
Sécurité au travail : les organisations peuvent surveiller la position du corps et les mouvements répétitifs afin d'identifier les risques potentiels pour la sécurité.
Fitness et entraînement personnel :les applications de fitness utilisent l'estimation de la posture pour track la forme track , compter les répétitions et fournir des commentaires en temps réel sur la posture et les mouvements maintenus pendant les tutoriels de fitness.
Fig. 3. L'estimation de la posture peut aider à track les points track du corps pendant les mouvements athlétiques. (Source)
Exploration de la prise en charge de l'estimation de pose Ultralytics
Ultralytics s'appuie surYOLO Ultralytics YOLO précédents et intègre des mises à jour conçues pour rendre la formation et le déploiement plus pratiques.
Comme les versions précédentes, il prend en charge l'estimation de la pose dans le cadre d'un système unifié. La principale différence réside dans le fait que YOLO26 est conçu pour être plus flexible et plus stable dans un plus large éventail de cas d'utilisation réels.
Les anciens modèlesYOLO Ultralytics étaient largement influencés par des ensembles de données sur les poses humaines, ce qui signifie que certaines parties des anciennes méthodes étaient optimisées en fonction des structures articulaires humaines. YOLO26 supprime ces hypothèses spécifiques à l'être humain.
Par conséquent, il est mieux adapté aux points clés non humains, tels que la détection des coins d'un court de tennis ou d'autres repères structurels personnalisés. Cela est important car les modèles YOLO26-pose pré-entraînés prêts à l'emploi sont entraînés sur des ensembles de données tels que COCO et prédisent les points clés humains définis dans les annotations de l'ensemble de données.
Cependant, lorsque les équipes souhaitent detect types de repères, tels que des composants de machines, des marqueurs de terrains de sport ou des points d'infrastructure, le modèle doit généralement être affiné à partir d'un ensemble de données personnalisé dans lequel ces points clés spécifiques sont annotés.
Comme YOLO26 n'est pas lié à des hypothèses sur les structures articulaires humaines, il peut s'adapter plus efficacement lors du réglage fin. Cette flexibilité permet au modèle d'apprendre plus fiablement les dispositions personnalisées des points clés, ce qui améliore les mesures d'évaluation lors de la validation sur des ensembles de données avec des configurations de points clés uniques.
YOLO26-pose est également conçu pour améliorer la localisation des points clés lorsque certaines parties d'un objet sont partiellement cachées ou apparaissent à très petite échelle. Dans les scènes réelles impliquant des sujets éloignés, des images prises par drone ou des scénarios avec de petits objets, cela peut conduire à des prédictions de points clés plus précises par rapport aux modèles de pose précédents.
Une autre mise à jour importante concerne l'amélioration de la formulation de la perte utilisée pendant l'entraînement. La fonction de perte détermine la manière dont le modèle corrige ses erreurs pendant l'apprentissage.
En ce qui concerne la pose YOLO26, ce processus est plus efficace, ce qui aide le modèle à apprendre plus rapidement et à atteindre une grande précision en moins d'époches, une époque correspondant à un passage complet du jeu de données d'entraînement.
Dans l'ensemble, YOLO26-pose s'appuie sur les modèles Ultralytics YOLO précédents, avec des améliorations plus marquées en matière de prise en charge des points clés non humains et de convergence de l'entraînement, tout en conservant le même flux de travail familier.
Comparaison entre YOLO26-pose et Ultralytics YOLOv5
La première versionYOLO Ultralytics , Ultralytics YOLOv5, a été conçue principalement pour la détection d'objets. Bien que YOLOv5 ait YOLOv5 été étendue pour prendre en charge la segmentation d'instances, elle ne comprend pas de tête d'estimation de pose native et spécialisée dans le Ultralytics officiel Ultralytics .
Les équipes qui avaient besoin d'une détection des points clés s'appuyaient généralement sur des implémentations distinctes ou des modifications personnalisées. Ultralytics inclut l'estimation de la pose comme tâche intégrée, avec une tête architecturale dédiée spécialement conçue pour prédire les points clés.
Cela signifie que les modèles YOLO26-pose peuvent être entraînés, validés et déployés dans le même flux de travail unifié que la détection et la segmentation. Pour les projets axés sur la détection structurée de points clés, YOLO26 offre une prise en charge native des poses et une architecture spécifique à la tâche que YOLOv5 offre YOLOv5 en standard.
Différences clés : YOLO26-pose vs Ultralytics YOLOv8
Ultralytics YOLOv8 a introduit l'estimation native de la pose dans le Ultralytics unifié Ultralytics , facilitant ainsi l'entraînement et le déploiement de modèles de points clés à l'aide du même flux de travail que la détection et la segmentation. Il s'appuie sur un pipeline de post-traitement traditionnel avec suppression non maximale (NMS) et utilise des formulations de perte antérieures pour la régression et l'entraînement des boîtes englobantes.
YOLO26 s'appuie sur ces bases avec des mises à jour architecturales et d'entraînement qui ont un impact direct sur l'estimation de la pose. L'une des principales différences réside dans la conception de bout en bout. YOLO26 supprime le besoin d'NMS externe NMS l'inférence, ce qui simplifie le déploiement et améliore la cohérence de la latence, en particulier sur les processeurs et les appareils périphériques.
Une autre amélioration majeure concerne la méthodologie d'entraînement. YOLO26 introduit l'optimiseur MuSGD ainsi que des stratégies de perte mises à jour. Pour les tâches de pose, il intègre l'estimation de la log-vraisemblance résiduelle, qui améliore la modélisation de l'incertitude des points clés. Ensemble, ces changements peuvent conduire à une convergence plus rapide et à des prédictions de points clés plus stables, en particulier dans les scènes complexes ou partiellement occultées.
En résumé, YOLOv8 a établi une base solide et polyvalente. YOLO26-pose affine cette base grâce à une efficacité d'entraînement améliorée, une meilleure gestion de l'occlusion et une plus grande flexibilité pour les applications réelles de pose non humaine.
YOLO26-Pose vs Ultralytics YOLO11: Quelles sont les améliorations ?
Ultralytics YOLO11 s'appuie sur Ultralytics YOLOv8 affinant les couches de base et d'extraction des caractéristiques. Il a réduit les FLOP, amélioré l'efficacité des paramètres et fourni mAP plus élevé mAP conservant de solides performances en temps réel. Pour les tâches de pose, cela s'est traduit par une meilleure précision des points clés avec une architecture plus légère.
YOLO26-pose poursuit cette progression avec un changement architectural plus fondamental. En termes simples, YOLO11 l'efficacité et la précision de YOLOv8, et YOLO26 s'appuie sur cette base avec des mises à jour architecturales et de formation visant une convergence plus rapide, une inférence plus stable et une précision améliorée dans des scénarios complexes.
Pourquoi devriez-vous commencer à utiliser le modèle YOLO26 pour l'estimation de la pose ?
En explorant les différences entreYOLO Ultralytics , vous vous demandez peut-être s'il faut passer à YOLO26-pose.
En bref, la mise à niveau est facile. Si vous utilisez déjà Ultralytics YOLOv8 ou Ultralytics YOLO11, passer à YOLO26-pose signifie généralement simplement changer la version du modèle, sans avoir à reconstruire votre pipeline.
Vous pouvez bénéficier d'une meilleure prise en charge des points clés non humains, d'une convergence plus rapide pendant la formation et d'une meilleure gestion des points occultés, tout en restant dans le même Ultralytics . Pour la plupart des projets de pose nouveaux et existants, le passage à YOLO26-pose est un moyen simple d'obtenir ces améliorations avec un minimum de friction.
De plus, YOLO26-pose est entièrement pris en charge dans le Python Ultralytics , qui repose sur PyTorch simplifie la formation, la validation et le déploiement. Les modèles peuvent être exportés vers des formats tels que ONNX, TensorRT, OpenVINO, CoreML et TFLite, ce qui facilite leur déploiement sur les GPU, les CPU et les appareils périphériques sans modifier votre flux de travail global.
Principaux points à retenir
Ultralytics rend l'estimation de la pose plus flexible et plus fiable, en particulier lorsqu'il s'agit de points clés non humains ou de scènes complexes. Il s'entraîne plus rapidement, gère mieux l'occlusion et fournit des résultats plus cohérents entre différents ensembles de données. Pour les équipes qui utilisent déjà les modèlesYOLO Ultralytics YOLO , YOLO26 offre des améliorations notables sans modifier les flux de travail existants.