Découvre YOLO26 : l'IA de vision de nouvelle génération.
Ultralytics
Ultralytics YOLO

YOLO26 d'Ultralytics vs. d'autres modèles YOLO d'Ultralytics pour l'estimation de pose

Découvre comment YOLO26 d'Ultralytics améliore l'estimation de pose avec un meilleur support des points clés non humains, une convergence plus rapide, une meilleure gestion des occlusions et un déploiement efficace en temps réel.

ABAbirami Vina
4 min read
Comparaison de YOLO26 d'Ultralytics aux autres modèles YOLO pour l'estimation de pose

Quand tu observes la posture de quelqu'un, il est facile de remarquer s'il est avachi, penché en avant ou s'il se tient droit. Les humains peuvent rapidement comprendre comment les différentes parties du corps interagissent entre elles.

C'est une partie inhérente de la façon dont nous interprétons le mouvement et le langage corporel dans la vie de tous les jours. Pour les machines, cependant, ce type de compréhension visuelle n'est pas automatique. Enseigner à un système à reconnaître le mouvement et la structure nécessite des techniques avancées d'apprentissage profond et de computer vision qui lui permettent d'interpréter les images de manière significative.

En particulier, l'pose estimation est une technique de vision par IA qui permet à un modèle de computer vision de développer une compréhension similaire. Au lieu de simplement détecter un objet dans une image, le modèle prédit des points clés qui représentent d'importants points de repère structurels.

Ces points clés pourraient correspondre à des articulations humaines, des membres d'animaux, des composants de machines, ou même des points fixes comme les coins d'un terrain. En identifiant et en suivant ces points, le système peut comprendre la position, l'alignement et le mouvement de manière structurée et mesurable.

À mesure que l'pose estimation est appliquée à davantage de scénarios réels, les modèles doivent gérer plus efficacement les points clés non humains, les scènes complexes et les jeux de données personnalisés. Par exemple, les modèles de pointe comme Ultralytics YOLO26 prennent en charge des tâches de computer vision comme l'pose estimation et s'appuient sur les modèles YOLO pose antérieurs avec des améliorations architecturales et d'entraînement conçues pour accroître la flexibilité et la performance globale.

Un exemple d'pose estimation activée par YOLO

Fig 1. Un exemple d'pose estimation activée par YOLO (Source)

Dans cet article, nous allons comparer YOLO26-pose aux modèles YOLO pose précédents d'Ultralytics et explorer comment il améliore la flexibilité, la vitesse de convergence et la performance dans les scènes complexes. Commençons !

Link to this sectionQu'est-ce que l'estimation de pose ?#

Avant de plonger dans la comparaison des modèles de pose Ultralytics YOLO, examinons de plus près ce que signifie réellement l'pose estimation dans le contexte de la computer vision.

L'pose estimation est une technique utilisée pour détecter et suivre des points clés spécifiques dans une image ou une séquence vidéo. Ces points clés peuvent représenter des repères structurels importants, tels que les articulations d'un corps humain, les membres d'un animal, des composants d'une machine ou des points de référence fixes dans une scène.

Estimation de la pose des travailleurs en utilisant l'pose estimation humaine

Fig 2. Estimation de la pose des travailleurs en utilisant l'pose estimation humaine (Source)

En identifiant les coordonnées de ces points, un modèle peut comprendre comment un objet est positionné et comment il se déplace au fil du temps. Contrairement à la classification d'images, qui attribue une seule étiquette à une image entière, ou aux modèles d'object detection, qui se concentrent sur le dessin de bbox autour des objets, l'pose estimation fournit des informations spatiales plus détaillées sur la structure et le mouvement.

Link to this sectionUn aperçu de YOLO26-pose#

YOLO26-pose est disponible en plusieurs variantes ou tailles de modèle, y compris des options légères comme YOLO26n-pose et des modèles plus grands tels que YOLO26m-pose, YOLO26l-pose et YOLO26x-pose. Cela permet aux équipes de choisir le bon équilibre entre vitesse et précision en fonction de leurs besoins matériels et de performance.

Ultralytics fournit également des modèles de pose pré-entraînés sur de grands jeux de données généraux tels que le jeu de données COCO, spécifiquement les annotations COCO-Pose (points clés COCO) pour l'pose estimation humaine, afin que tu n'aies pas à repartir de zéro. Dans la plupart des cas, les équipes affinent ces modèles sur leur propre jeu de données pour les adapter à des points clés, des mises en page ou des environnements spécifiques.

Cela implique généralement de préparer des fichiers d'annotation personnalisés qui définissent les coordonnées des points clés et les étiquettes de classe dans un format structuré. Ces annotations mappent les points clés à des coordonnées de pixels spécifiques au sein de chaque image, permettant au modèle d'apprendre des relations spatiales précises pendant l'entraînement.

L'utilisation de modèles pré-entraînés rend l'entraînement plus rapide, réduit les besoins en données et aide à mettre les projets en production plus efficacement.

Link to this sectionApplications réelles de l'pose estimation humaine#

Voici un aperçu de quelques cas d'utilisation réels où l'pose estimation joue un rôle important :

  • Santé et rééducation : Les cliniciens peuvent utiliser des modèles de pose pour évaluer la posture, surveiller les progrès de la récupération et analyser les schémas de mouvement pendant la thérapie physique.
  • Systèmes autonomes : Les drones et les caméras intelligentes peuvent utiliser les informations de pose pour mieux comprendre l'orientation et le mouvement des objets dans des scènes dynamiques.
  • Sécurité au travail : Les organisations peuvent surveiller le positionnement du corps et les mouvements répétitifs pour aider à identifier les risques de sécurité potentiels.
  • Fitness et entraînement personnel : Les apps de fitness utilisent l'pose estimation pour suivre la forme physique des exercices, compter les répétitions et fournir des commentaires en temps réel sur la posture et le mouvement maintenus pendant les tutoriels de fitness.

L'pose estimation suit les points corporels clés pendant le mouvement athlétique

Fig 3. L'pose estimation peut aider à suivre les points corporels clés pendant le mouvement athlétique. (Source)

Link to this sectionExplorer la prise en charge de l'pose estimation par Ultralytics YOLO26#

Ultralytics YOLO26 s'appuie sur les modèles YOLO précédents d'Ultralytics avec des mises à jour conçues pour rendre l'entraînement et le déploiement plus pratiques.

Comme les versions précédentes, il prend en charge l'pose estimation dans le cadre d'un framework unifié. La différence principale est que YOLO26 est construit pour être plus flexible et stable sur un éventail plus large de cas d'utilisation réels.

Benchmarking de la performance d'Ultralytics YOLO26

Fig 4. Benchmarking de YOLO26 (Source)

Les modèles de pose YOLO d'Ultralytics précédents étaient largement influencés par les jeux de données de pose humains, ce qui signifiait que certaines parties des anciennes méthodes étaient optimisées autour des structures articulaires humaines. YOLO26 supprime ces hypothèses spécifiques à l'humain.

En conséquence, il est mieux adapté aux points clés non humains, comme la détection des coins d'un terrain de tennis ou d'autres repères structurels personnalisés. C'est significatif car, prêts à l'emploi, les modèles YOLO26-pose pré-entraînés sont entraînés sur des jeux de données tels que COCO-pose et prédisent les points clés humains définis dans les annotations du jeu de données.

Cependant, lorsque les équipes veulent détecter différents types de repères, tels que des composants de machines, des marqueurs de terrain de sport ou des points d'infrastructure, le modèle doit généralement être affiné sur un jeu de données personnalisé où ces points clés spécifiques sont annotés.

Comme YOLO26 n'est pas lié à des hypothèses sur les structures articulaires humaines, il peut s'adapter plus efficacement lors de l'affinage. Cette flexibilité permet au modèle d'apprendre des mises en page de points clés personnalisées de manière plus fiable, ce qui conduit à des métriques d'évaluation améliorées lors de la validation sur des jeux de données avec des configurations de points clés uniques.

YOLO26-pose est également conçu pour améliorer la localisation des points clés lorsque des parties d'un objet sont partiellement cachées ou apparaissent à très petite échelle. Dans des scènes réelles impliquant des sujets distants, des images de drone ou des scénarios de petits objets, cela peut conduire à des prédictions de points clés plus précises par rapport aux modèles de pose antérieurs.

Une autre mise à jour importante est la formulation de perte améliorée utilisée pendant l'entraînement. La fonction de perte détermine comment le modèle corrige ses erreurs pendant qu'il apprend.

En ce qui concerne YOLO26-pose, ce processus est plus efficace, ce qui aide le modèle à apprendre plus rapidement et à atteindre une forte précision en moins d'époques, où une époque fait référence à un passage complet à travers le jeu de données d'entraînement.

Dans l'ensemble, YOLO26-pose s'appuie sur les modèles de pose YOLO d'Ultralytics précédents avec des améliorations plus claires en matière de prise en charge des points clés non humains et de convergence de l'entraînement, tout en conservant le même workflow familier.

Link to this sectionComparaison de YOLO26-pose à Ultralytics YOLOv5#

La toute première version des modèles YOLO d'Ultralytics, Ultralytics YOLOv5, a été construite principalement pour l'object detection. Bien que YOLOv5 se soit étendu plus tard pour prendre en charge l'instance segmentation, il n'inclut pas de tête d'pose estimation native et spécialisée au sein du framework officiel d'Ultralytics.

Les équipes qui avaient besoin de détection de points clés s'appuyaient généralement sur des implémentations distinctes ou des modifications personnalisées. Ultralytics YOLO26 inclut l'pose estimation en tant que tâche intégrée, avec une tête architecturale dédiée conçue spécifiquement pour prédire les points clés.

Cela signifie que les modèles YOLO26-pose peuvent être entraînés, validés et déployés au sein du même workflow unifié que la détection et la segmentation. Pour les projets axés sur la détection structurée de points clés, YOLO26 fournit un support de pose natif et une architecture spécifique à la tâche que YOLOv5 ne propose pas par défaut.

Link to this sectionDifférences clés : YOLO26-pose vs Ultralytics YOLOv8-pose#

Ultralytics YOLOv8 a introduit l'pose estimation native au sein du framework unifié Ultralytics, facilitant l'entraînement et le déploiement de modèles de points clés en utilisant le même workflow que la détection et la segmentation. Il repose sur un pipeline de post-traitement traditionnel avec NMS et utilise des formulations de perte antérieures pour la régression bbox et l'entraînement.

YOLO26 s'appuie sur cette base avec des mises à jour architecturales et d'entraînement qui impactent directement l'pose estimation. Une différence majeure est la conception de bout en bout. YOLO26 supprime le besoin de NMS externe pendant l'inférence, ce qui simplifie le déploiement et améliore la cohérence de la latence, en particulier sur les CPU et les appareils de périphérie.

Une autre amélioration clé réside dans la méthodologie d'entraînement. YOLO26 introduit l'optimiseur MuSGD ainsi que des stratégies de perte mises à jour. Pour les tâches de pose, il intègre l'estimation de la log-vraisemblance résiduelle, qui améliore la manière dont l'incertitude des points clés est modélisée. Ensemble, ces changements peuvent conduire à une convergence plus rapide et à des prédictions de points clés plus stables, en particulier dans des scènes complexes ou partiellement occluses.

En résumé, YOLOv8-pose a établi une base solide et polyvalente. YOLO26-pose affine cette base avec une efficacité d'entraînement améliorée, une meilleure gestion de l'occlusion et une plus grande flexibilité pour les applications de pose non humaines réelles.

Link to this sectionYOLO26-pose vs Ultralytics YOLO11-pose : Qu'est-ce qui a été amélioré ?#

Ultralytics YOLO11 s'appuie sur Ultralytics YOLOv8 en affinant le backbone et les couches d'extraction de caractéristiques. Il a réduit les FLOPs, amélioré l'efficacité des paramètres et délivré un mAP plus élevé tout en maintenant de fortes performances en temps réel. Pour les tâches de pose, cela signifiait une meilleure précision des points clés avec une architecture plus légère.

YOLO26-pose poursuit cette progression avec un changement architectural plus fondamental. En clair, YOLO11 a affiné l'efficacité et la précision de YOLOv8, et YOLO26 s'appuie sur cette base avec des mises à jour architecturales et d'entraînement visant une convergence plus rapide, une inférence plus stable et une précision de pose améliorée dans des scénarios complexes.

Link to this sectionPourquoi devrais-tu commencer à utiliser le modèle YOLO26 pour l'pose estimation ?#

Alors que tu explores les différences entre les modèles YOLO d'Ultralytics, tu te demandes peut-être s'il faut passer à YOLO26-pose.

La réponse courte est qu'il s'agit d'une mise à niveau facile. Si tu utilises déjà Ultralytics YOLOv8-pose ou Ultralytics YOLO11-pose, passer à YOLO26-pose signifie généralement simplement changer la version du modèle, et non reconstruire ton pipeline.

Tu peux bénéficier d'une meilleure prise en charge des points clés non humains, d'une convergence plus rapide pendant l'entraînement et d'une meilleure gestion des points occlus, tout en restant dans le même framework Ultralytics. Pour la plupart des projets de pose nouveaux et existants, passer à YOLO26-pose est un moyen simple d'obtenir ces améliorations avec un minimum de friction.

En plus de cela, YOLO26-pose est entièrement pris en charge au sein du package Python d'Ultralytics, qui est construit sur PyTorch et simplifie l'entraînement, la validation et le déploiement. Les modèles peuvent être exportés vers des formats tels que ONNX, TensorRT, OpenVINO, CoreML et TFLite, ce qui facilite le déploiement sur des GPU, des CPU et des appareils de périphérie sans changer ton workflow global.

Link to this sectionPoints clés#

Ultralytics YOLO26-pose rend l'pose estimation plus flexible et fiable, surtout lorsque tu travailles avec des points clés non humains ou des scènes complexes. Il s'entraîne plus rapidement, gère mieux l'occlusion et fournit des résultats plus cohérents sur différents jeux de données. Pour les équipes utilisant déjà des modèles de pose YOLO d'Ultralytics, YOLO26 offre des améliorations claires sans changer les workflows existants.

Tu veux en savoir plus sur l'IA ? Jette un œil à notre communauté et notre dépôt GitHub. Explore nos pages de solutions pour en apprendre davantage sur l'IA dans la robotique et la vision par ordinateur en agriculture. Découvre nos options de licence et commence à construire avec la vision par ordinateur dès aujourd'hui !

Explore solutions

Real-time AI that works with your team

IA dans la robotique

Équipe tes machines plus intelligentes avec les modèles Ultralytics YOLO. La vision par IA dans la robotique propulse la navigation autonome, la perception, le suivi d'objets et le contrôle en temps réel.

En savoir plus
Real-time AI that works with your team

IA dans la logistique

Simplifie la logistique avec les modèles Ultralytics YOLO. La vision par IA permet l'inspection des colis, le tri, le suivi des véhicules et la surveillance de la sécurité des entrepôts en temps réel.

En savoir plus
Real-time AI that works with your team

IA dans le commerce de détail

Réinvente le commerce de détail avec les modèles Ultralytics YOLO. La vision par IA alimente le suivi des stocks, la surveillance des étagères, la gestion des files d'attente et des informations plus intelligentes sur les clients.

En savoir plus
Real-time AI that works with your team

IA dans la santé

Construis des solutions de santé avec les modèles Ultralytics YOLO. L'IA de vision dans la santé permet une imagerie médicale plus rapide, des diagnostics plus intelligents et une surveillance des patients.

En savoir plus
Real-time AI that works with your team

IA dans la fabrication

Optimise la fabrication avec les modèles Ultralytics YOLO. La vision par IA favorise le contrôle qualité, la détection des défauts, la conformité aux EPI et l'automatisation des chaînes de montage.

En savoir plus
Real-time AI that works with your operation

IA dans l'automobile

Applique la vision par ordinateur dans l'automobile avec les modèles Ultralytics YOLO. L'IA de vision améliore la sécurité routière, l'assistance à la conduite et l'automatisation des véhicules pour des routes plus intelligentes.

En savoir plus
Real-time AI tailored to your operation

IA en agriculture

Intègre l'IA de vision à l'agriculture intelligente avec les modèles Ultralytics YOLO. Optimise la surveillance des cultures, le suivi du bétail et l'agriculture de précision pour des rendements plus élevés et plus intelligents.

En savoir plus
Real-time AI that works with your team

IA dans la robotique

Équipe tes machines plus intelligentes avec les modèles Ultralytics YOLO. La vision par IA dans la robotique propulse la navigation autonome, la perception, le suivi d'objets et le contrôle en temps réel.

En savoir plus
Real-time AI that works with your team

IA dans la logistique

Simplifie la logistique avec les modèles Ultralytics YOLO. La vision par IA permet l'inspection des colis, le tri, le suivi des véhicules et la surveillance de la sécurité des entrepôts en temps réel.

En savoir plus
Real-time AI that works with your team

IA dans le commerce de détail

Réinvente le commerce de détail avec les modèles Ultralytics YOLO. La vision par IA alimente le suivi des stocks, la surveillance des étagères, la gestion des files d'attente et des informations plus intelligentes sur les clients.

En savoir plus
Real-time AI that works with your team

IA dans la santé

Construis des solutions de santé avec les modèles Ultralytics YOLO. L'IA de vision dans la santé permet une imagerie médicale plus rapide, des diagnostics plus intelligents et une surveillance des patients.

En savoir plus
Real-time AI that works with your team

IA dans la fabrication

Optimise la fabrication avec les modèles Ultralytics YOLO. La vision par IA favorise le contrôle qualité, la détection des défauts, la conformité aux EPI et l'automatisation des chaînes de montage.

En savoir plus
Real-time AI that works with your operation

IA dans l'automobile

Applique la vision par ordinateur dans l'automobile avec les modèles Ultralytics YOLO. L'IA de vision améliore la sécurité routière, l'assistance à la conduite et l'automatisation des véhicules pour des routes plus intelligentes.

En savoir plus
Real-time AI tailored to your operation

IA en agriculture

Intègre l'IA de vision à l'agriculture intelligente avec les modèles Ultralytics YOLO. Optimise la surveillance des cultures, le suivi du bétail et l'agriculture de précision pour des rendements plus élevés et plus intelligents.

En savoir plus
Real-time AI that works with your team

IA dans la robotique

Équipe tes machines plus intelligentes avec les modèles Ultralytics YOLO. La vision par IA dans la robotique propulse la navigation autonome, la perception, le suivi d'objets et le contrôle en temps réel.

En savoir plus
Real-time AI that works with your team

IA dans la logistique

Simplifie la logistique avec les modèles Ultralytics YOLO. La vision par IA permet l'inspection des colis, le tri, le suivi des véhicules et la surveillance de la sécurité des entrepôts en temps réel.

En savoir plus
Real-time AI that works with your team

IA dans le commerce de détail

Réinvente le commerce de détail avec les modèles Ultralytics YOLO. La vision par IA alimente le suivi des stocks, la surveillance des étagères, la gestion des files d'attente et des informations plus intelligentes sur les clients.

En savoir plus
Real-time AI that works with your team

IA dans la santé

Construis des solutions de santé avec les modèles Ultralytics YOLO. L'IA de vision dans la santé permet une imagerie médicale plus rapide, des diagnostics plus intelligents et une surveillance des patients.

En savoir plus
Real-time AI that works with your team

IA dans la fabrication

Optimise la fabrication avec les modèles Ultralytics YOLO. La vision par IA favorise le contrôle qualité, la détection des défauts, la conformité aux EPI et l'automatisation des chaînes de montage.

En savoir plus
Real-time AI that works with your operation

IA dans l'automobile

Applique la vision par ordinateur dans l'automobile avec les modèles Ultralytics YOLO. L'IA de vision améliore la sécurité routière, l'assistance à la conduite et l'automatisation des véhicules pour des routes plus intelligentes.

En savoir plus
Real-time AI tailored to your operation

IA en agriculture

Intègre l'IA de vision à l'agriculture intelligente avec les modèles Ultralytics YOLO. Optimise la surveillance des cultures, le suivi du bétail et l'agriculture de précision pour des rendements plus élevés et plus intelligents.

En savoir plus

Construisons ensemble le futur de l'IA !

Commence ton aventure avec le futur de l'apprentissage automatique