Comment utiliser Ultralytics YOLO11 pour l'estimation de la pose ?

Abirami Vina

3 minutes de lecture

14 octobre 2024

Apprenez à utiliser le modèle Ultralytics YOLO11 pour une estimation précise de la pose. Nous couvrirons l'inférence en temps réel et la formation de modèles personnalisés pour diverses applications.

La recherche sur la vision par ordinateur, une branche de l'intelligence artificielle (IA), remonte aux années 1960. Toutefois, ce n'est que dans les années 2010, avec l'essor de l'apprentissage profond, que nous avons assisté à des avancées majeures dans la manière dont les machines comprennent les images. Les modèles YOLO11 d'Ultralytics constituent l'une des dernières avancées en matière de vision par ordinateur. Les modèles YOLO11, présentés pour la première fois lors de l'événement hybride annuel d'Ultralytics, YOLO Vision 2024 (YV24), prennent en charge une série de tâches de vision par ordinateur, notamment l'estimation de la pose.

L'estimation de la pose peut être utilisée pour détecter les points clés d'une personne ou d'un objet dans une image ou une vidéo afin de comprendre sa position, sa posture ou son mouvement. Elle est largement utilisée dans des applications telles que l'analyse sportive, la surveillance du comportement des animaux et la robotique pour aider les machines à interpréter les actions physiques en temps réel. Grâce à sa précision, son efficacité et sa rapidité accrues par rapport aux modèles précédents de la série YOLO (You Only Look Once), YOLO11 est bien adapté aux tâches d'estimation de la pose en temps réel.

__wf_reserved_inherit
Fig. 1. Exemple d'utilisation d'Ultralytics YOLO11 pour l'estimation de la pose.

Dans cet article, nous allons explorer ce qu'est l'estimation de la pose, discuter de certaines de ses applications, et voir comment vous pouvez utiliser YOLO11 avec le package Ultralytics Python pour l'estimation de la pose. Nous verrons également comment utiliser Ultralytics HUB pour tester YOLO11 et l'estimation de pose en quelques clics. C'est parti !

Qu'est-ce que l'estimation de la pose ?

Avant de voir comment utiliser le nouveau modèle YOLO11 d'Ultralytics pour l'estimation de la pose, il convient de mieux comprendre ce qu'est l'estimation de la pose.

L'estimation de la pose est une technique de vision par ordinateur utilisée pour analyser la pose d'une personne ou d'un objet dans une image ou une vidéo. Les modèles d'apprentissage profond comme YOLO11 peuvent identifier, localiser et suivre les points clés d'un objet ou d'une personne. Pour les objets, ces points clés peuvent être des coins, des arêtes ou des marques de surface distinctes, tandis que pour les humains, ces points clés représentent les principales articulations comme le coude, le genou ou l'épaule. 

L'estimation de la pose est une tâche unique et plus complexe que d'autres tâches de vision artificielle telles que la détection d'objets. Alors que la détection d'objets localise les objets dans une image en dessinant une boîte autour d'eux, l'estimation de la pose va plus loin en prédisant les positions exactes des points clés de l'objet.

__wf_reserved_inherit
Fig. 2. Utilisation de YOLO11 pour détecter et estimer les poses des personnes dans un bureau.

En ce qui concerne l'estimation de la pose, il existe deux méthodes principales : l'approche ascendante et l'approche descendante. L'approche ascendante détecte les points clés individuels et les regroupe en squelettes, tandis que l'approche descendante se concentre d'abord sur la détection des objets, puis sur l'estimation des points clés à l'intérieur de ceux-ci. 

YOLO11 combine les forces des méthodes descendante et ascendante. Comme l'approche ascendante, elle reste simple et rapide sans qu'il soit nécessaire de regrouper manuellement les points clés. En même temps, elle utilise la précision de la méthode descendante en détectant les personnes et en estimant leurs poses en une seule étape.

Cas d'utilisation de l'estimation de la pose pour YOLO11 

Les capacités polyvalentes de YOLO11 pour l'estimation de la pose ouvrent un large éventail d'applications possibles dans de nombreuses industries. Examinons de plus près quelques cas d'utilisation de YOLO11 pour l'estimation de la pose.

Estimation de la pose en temps réel avec YOLO11 : améliorer la sécurité des travailleurs

La sécurité est un aspect important de tout projet de construction. C'est d'autant plus vrai que, statistiquement, les chantiers de construction enregistrent un nombre plus élevé d'accidents du travail. En 2021, environ 20 % de tous les accidents mortels liés au travail se sont produits sur des chantiers de construction ou à proximité. Avec des risques quotidiens tels que les équipements lourds et les systèmes électriques, des mesures de sécurité strictes sont essentielles pour assurer la sécurité des travailleurs. Les méthodes traditionnelles telles que l'utilisation de panneaux, de barricades et la surveillance manuelle par les superviseurs ne sont pas toujours efficaces et détournent souvent les superviseurs de tâches plus importantes.

L'IA peut intervenir pour améliorer la sécurité et le risque d'accident peut être réduit en utilisant un système de surveillance des travailleurs basé sur l'estimation de la pose. Les modèles YOLO11 d'Ultralytics peuvent être utilisés pour suivre les mouvements et les postures des travailleurs. Tout danger potentiel, tel que des travailleurs se tenant trop près d'équipements dangereux ou exécutant des tâches de manière incorrecte, peut être rapidement repéré. Si un risque est détecté, les superviseurs peuvent être avertis ou une alarme peut alerter le travailleur. Un système de surveillance continue peut rendre les chantiers de construction plus sûrs en étant toujours à l'affût des dangers et en protégeant les travailleurs

__wf_reserved_inherit
Fig. 3. Exemple d'estimation de la pose sur un chantier de construction à l'aide de YOLO11.

Estimation de la pose avec YOLO11 pour la surveillance du bétail

Les agriculteurs et les chercheurs peuvent utiliser YOLO11 pour étudier les mouvements et le comportement des animaux de ferme, comme le bétail, afin de détecter les signes précoces de maladies telles que la boiterie. La boiterie est un état dans lequel un animal a du mal à se déplacer correctement en raison de douleurs dans les pattes ou les pieds. Chez les bovins, les maladies telles que la boiterie affectent non seulement leur santé et leur bien-être, mais entraînent également des problèmes de production dans les exploitations laitières. Des études montrent que les boiteries touchent entre 8 % des bovins dans les systèmes basés sur les pâturages et 15 à 30 % dans les systèmes confinés dans l'ensemble de l'industrie laitière mondiale. La détection et le traitement précoce des boiteries peuvent contribuer à améliorer le bien-être des animaux et à réduire les pertes de production associées à cette affection.

Les fonctions d'estimation de la pose de YOLO11 peuvent aider les éleveurs à suivre la démarche de l'animal et à identifier rapidement toute anomalie susceptible de signaler des problèmes de santé, tels que des problèmes d'articulation ou des infections. La détection précoce de ces problèmes permet un traitement plus rapide, réduisant ainsi l'inconfort des animaux et aidant les éleveurs à éviter les pertes économiques.

Les systèmes de surveillance basés sur l'IA Vision peuvent également aider à analyser le comportement au repos, les interactions sociales et les modes d'alimentation. Les agriculteurs peuvent également utiliser l'estimation de la pose pour observer les signes de stress ou d'agression. Ces informations peuvent être utilisées pour améliorer les conditions de vie des animaux et accroître leur bien-être.

__wf_reserved_inherit
Fig. 4. Visualisation de l'estimation de la pose de la vache.

Cas d'utilisation de YOLO11 dans l'industrie du fitness

L'estimation des poses peut également aider les gens à améliorer leur posture en temps réel pendant qu'ils s'entraînent. Avec YOLO11, les professeurs de gymnastique et de yoga peuvent surveiller et suivre les mouvements du corps des personnes qui s'entraînent, en se concentrant sur des points clés tels que les articulations et les membres afin d'évaluer leur posture. Les données recueillies peuvent être comparées aux poses et techniques d'entraînement idéales, et les instructeurs peuvent recevoir des alertes si quelqu'un exécute un mouvement de manière incorrecte, ce qui contribue à prévenir les blessures.

__wf_reserved_inherit
Fig. 5. Utilisation de l'estimation de la pose pour analyser une séance d'entraînement.

Par exemple, lors d'un cours de yoga, l'estimation de la pose peut permettre de vérifier si tous les élèves maintiennent un équilibre et un alignement corrects. Les applications mobiles intégrées à la vision par ordinateur et à l'estimation de la posture peuvent rendre le fitness plus accessible aux personnes qui s'entraînent à la maison ou à celles qui n'ont pas accès à des entraîneurs personnels. Ce retour d'information continu en temps réel aide les utilisateurs à améliorer leur technique et à atteindre leurs objectifs de remise en forme tout en réduisant le risque de blessure.

Essai d'estimation de la pose en temps réel avec le modèle YOLO11

Maintenant que nous avons exploré ce qu'est l'estimation de la pose et discuté de certaines de ses applications, nous allons voir comment vous pouvez essayer l'estimation de la pose avec le nouveau modèle YOLO11. Voyons maintenant comment vous pouvez tester l'estimation de la pose avec le nouveau modèle YOLO11. Pour commencer, il y a deux façons pratiques de le faire : en utilisant le package Ultralytics Python ou via Ultralytics HUB. Examinons ces deux options.

Effectuer des déductions avec YOLO11

L'exécution d'une inférence implique que le modèle YOLO11 traite de nouvelles données en dehors de ses ensembles d'apprentissage et utilise les modèles qu'il a appris pour faire des prédictions basées sur ces données. Vous pouvez exécuter des inférences par le biais du code avec le paquetage Ultralytics Python. Pour commencer , il vous suffit d'installer le paquet Ultralytics à l'aide de pip, conda ou Docker. Si vous rencontrez des difficultés lors de l'installation, notre Guide des problèmes courants vous propose des conseils de dépannage utiles. 

Une fois le paquet installé avec succès, le code suivant explique comment charger un modèle et l'utiliser pour prédire les poses des objets dans une image.

__wf_reserved_inherit
Fig. 6. Extrait de code illustrant l'exécution d'inférences à l'aide de YOLO11.

Formation d'un modèle YOLO11 personnalisé

Imaginons que vous travailliez sur un projet de vision par ordinateur et que vous disposiez d'un ensemble de données spécifiques pour une application particulière impliquant l'estimation de la pose. Vous pouvez alors affiner et entraîner un modèle YOLO11 personnalisé pour l'adapter à votre application. Par exemple, vous pouvez utiliser un jeu de données de points clés pour analyser et comprendre la pose d'un tigre dans des images en identifiant des caractéristiques clés telles que la position de ses membres, de sa tête et de sa queue.

Vous pouvez utiliser l'extrait de code suivant pour charger et entraîner un modèle d'estimation de pose YOLO11. Le modèle peut être construit à partir d'une configuration YAML, ou vous pouvez charger un modèle pré-entraîné pour l'entraînement. Ce script vous permet également de transférer des poids et de commencer à entraîner le modèle à l'aide d'un ensemble de données spécifié, tel que l'ensemble de données COCO pour l'estimation de la pose.

__wf_reserved_inherit
Fig. 7. Formation personnalisée YOLO11.

En utilisant le modèle personnalisé nouvellement formé, vous pouvez effectuer des déductions sur des images inédites liées à votre solution de vision par ordinateur. Le modèle formé peut également être converti dans d'autres formats à l'aide du mode d'exportation.

Essayez YOLO11 sur Ultralytics HUB

Jusqu'à présent, nous avons examiné les méthodes d'utilisation de YOLO11 nécessitant quelques connaissances de base en matière de codage. Si ce n'est pas ce que vous recherchez, ou si vous n'êtes pas familier avec le codage, il y a une autre option : Ultralytics HUB. Ultralytics HUB est une plateforme conviviale conçue pour simplifier le processus de formation et de déploiement des modèles YOLO. HUB vous permet de gérer facilement des ensembles de données, d'entraîner des modèles et de les déployer sans avoir besoin d'une expertise technique.

Pour effectuer des inférences sur des images, vous pouvez créer un compte, naviguer vers la section "Modèles" et choisir le modèle d'estimation de pose YOLO11 qui vous intéresse. Dans la section de prévisualisation, vous pouvez télécharger une image et visualiser les résultats de la prédiction, comme indiqué ci-dessous. 

__wf_reserved_inherit
Fig. 8. Estimation de la pose sur Ultralytics HUB avec YOLO11.

Les avancées de YOLO11 en matière de détection de la pose humaine

Ultralytics YOLO11 offre des solutions précises et flexibles pour des tâches telles que l'estimation de la pose dans un large éventail d'applications. Qu'il s'agisse d'améliorer la sécurité des travailleurs sur les chantiers de construction, de surveiller la santé du bétail ou d'aider à la correction de la posture dans les programmes de remise en forme, YOLO11 apporte une précision et un retour d'information en temps réel grâce à une technologie avancée de vision par ordinateur. 

Sa polyvalence, avec de multiples variantes de modèles et la possibilité d'une formation personnalisée pour des cas d'utilisation spécifiques, en fait un outil très précieux pour les développeurs et les entreprises. Que ce soit en codant avec le package Ultralytics Python ou en utilisant le HUB Ultralytics pour une mise en œuvre plus facile, YOLO11 rend l'estimation de la pose accessible et impactante.

Pour en savoir plus, visitez notre dépôt GitHub et participez à la vie de notre communauté. Explorez les applications de l'IA dans la fabrication et l'agriculture sur nos pages de solutions. 🚀

Construisons ensemble le futur
de l'IA !

Commencez votre voyage avec l'avenir de l'apprentissage automatique

Commencer gratuitement
Lien copié dans le presse-papiers