Yolo Vision Shenzhen
Shenzhen
Rejoindre maintenant

Comment utiliser Ultralytics YOLO11 pour l’estimation de pose

Abirami Vina

3 min de lecture

14 octobre 2024

Découvrez comment utiliser le modèle Ultralytics YOLO11 pour une estimation de pose précise. Nous aborderons l'inférence en temps réel et la formation de modèles personnalisés pour diverses applications.

Les recherches liées à la vision par ordinateur, une branche de l'intelligence artificielle (IA), remontent aux années 1960. Cependant, ce n'est qu'à partir des années 2010, avec l'essor de l'apprentissage profond, que nous avons constaté des avancées majeures dans la façon dont les machines comprennent les images. L'une des dernières avancées en vision par ordinateur est la gamme de modèles Ultralytics YOLO11 de pointe. Les modèles YOLO11, présentés pour la première fois lors de l'événement hybride annuel d'Ultralytics, YOLO Vision 2024 (YV24), prennent en charge une gamme de tâches de vision par ordinateur, y compris l'estimation de pose.

L'estimation de pose peut être utilisée pour détecter des points clés sur une personne ou un objet dans une image ou une vidéo afin de comprendre sa position, sa posture ou son mouvement. Elle est largement utilisée dans des applications telles que l'analyse sportive, la surveillance du comportement animal et la robotique pour aider les machines à interpréter les actions physiques en temps réel. Grâce à son amélioration de la précision, de l'efficacité et de la vitesse par rapport aux modèles précédents de la série YOLO (You Only Look Once), YOLO11 est bien adapté aux tâches d'estimation de pose en temps réel.

__wf_reserved_inherit
Fig 1. Un exemple d'utilisation d'Ultralytics YOLO11 pour l'estimation de pose.

Dans cet article, nous allons explorer ce qu'est l'estimation de pose, discuter de certaines de ses applications et vous expliquer comment utiliser YOLO11 avec le package Python Ultralytics pour l'estimation de pose. Nous verrons également comment vous pouvez utiliser Ultralytics HUB pour essayer YOLO11 et l'estimation de pose en quelques clics. Commençons !

Qu'est-ce que l'estimation de pose ?

Avant de nous plonger dans la façon d'utiliser le nouveau modèle Ultralytics YOLO11 pour l'estimation de pose, essayons de mieux comprendre ce qu'est l'estimation de pose.

L'estimation de pose est une technique de vision par ordinateur utilisée pour analyser la pose d'une personne ou d'un objet dans une image ou une vidéo. Les modèles d'apprentissage profond comme YOLO11 peuvent identifier, localiser et suivre les points clés sur un objet ou une personne donnée. Pour les objets, ces points clés peuvent inclure les coins, les bords ou les marques de surface distinctes, tandis que pour les humains, ces points clés représentent les principales articulations comme le coude, le genou ou l'épaule. 

L'estimation de pose est unique et plus complexe que d'autres tâches de vision par ordinateur telles que la détection d'objets. Alors que la détection d'objets localise les objets dans une image en dessinant une boîte autour d'eux, l'estimation de pose va plus loin en prédisant les positions exactes des points clés sur l'objet.

__wf_reserved_inherit
Fig 2. Utilisation de YOLO11 pour détecter et estimer les poses de personnes dans un bureau.

En ce qui concerne l'estimation de pose, il existe deux approches principales : ascendante (bottom-up) et descendante (top-down). L'approche ascendante détecte les points clés individuels et les regroupe en squelettes, tandis que l'approche descendante se concentre d'abord sur la détection des objets, puis sur l'estimation des points clés à l'intérieur de ceux-ci. 

YOLO11 combine les forces des méthodes descendantes et ascendantes. Comme l'approche ascendante, il maintient les choses simples et rapides sans avoir besoin de regrouper manuellement les points clés. En même temps, il utilise la précision de la méthode descendante en détectant les personnes et en estimant leurs poses en une seule étape.

Cas d'utilisation de l'estimation de pose pour YOLO11 

Les capacités polyvalentes de YOLO11 pour l'estimation de pose ouvrent un large éventail d'applications possibles dans de nombreux secteurs. Examinons de plus près quelques cas d'utilisation de l'estimation de pose de YOLO11.

Estimation de pose en temps réel avec YOLO11 : Amélioration de la sécurité des travailleurs

La sécurité est un aspect important de tout projet de construction. Cela est particulièrement vrai, car statistiquement, les chantiers de construction connaissent un nombre plus élevé de blessures liées au travail. En 2021, environ 20 % de toutes les blessures mortelles liées au travail se sont produites sur ou à proximité des chantiers de construction. Avec des risques quotidiens comme les équipements lourds et les systèmes électriques, des mesures de sécurité strictes sont essentielles pour assurer la sécurité des travailleurs. Les méthodes traditionnelles comme l'utilisation de panneaux, de barricades et la surveillance manuelle par les superviseurs ne sont pas toujours efficaces et éloignent souvent les superviseurs des tâches plus critiques.

L'IA peut intervenir pour améliorer la sécurité, et le risque d'accidents peut être réduit en utilisant un système de surveillance des travailleurs basé sur l'estimation de la pose. Les modèles YOLO11 d'Ultralytics peuvent être utilisés pour suivre les mouvements et les postures des travailleurs. Tout danger potentiel, comme les travailleurs se tenant trop près d'équipements dangereux ou effectuant des tâches de manière incorrecte, peut être rapidement détecté. Si un risque est détecté, les superviseurs peuvent être avertis, ou une alarme peut alerter le travailleur. Un système de surveillance continue peut rendre les chantiers de construction plus sûrs en étant toujours à l'affût des dangers et en protégeant les travailleurs

__wf_reserved_inherit
Fig 3. Un exemple d'estimation de pose sur un chantier de construction à l'aide de YOLO11.

Estimation de pose avec YOLO11 pour la surveillance du bétail

Les agriculteurs et les chercheurs peuvent utiliser YOLO11 pour étudier le mouvement et le comportement des animaux d'élevage, comme les bovins, afin de détecter les signes précoces de maladies telles que la boiterie. La boiterie est une condition dans laquelle un animal a du mal à se déplacer correctement en raison de douleurs dans les jambes ou les pieds. Chez les bovins, les maladies comme la boiterie affectent non seulement leur santé et leur bien-être, mais entraînent également des problèmes de production dans les exploitations laitières. Des études montrent que la boiterie touche entre 8 % des bovins dans les systèmes pastoraux et 15 % à 30 % dans les systèmes confinés dans l'industrie laitière mondiale. La détection et le traitement précoces de la boiterie peuvent contribuer à améliorer le bien-être animal et à réduire les pertes de production associées à cette condition.

Les fonctionnalités d'estimation de pose de YOLO11 peuvent aider les agriculteurs à suivre les schémas de démarche des animaux et à identifier rapidement toute anomalie pouvant signaler des problèmes de santé, tels que des problèmes articulaires ou des infections. La détection précoce de ces problèmes permet un traitement plus rapide, réduisant l'inconfort des animaux et aidant les agriculteurs à éviter les pertes économiques.

Les systèmes de surveillance basés sur l'IA de vision peuvent également aider à analyser le comportement au repos, les interactions sociales et les habitudes alimentaires. Les agriculteurs peuvent également utiliser l'estimation de la pose pour obtenir des observations sur les signes de stress ou d'agression. Ces informations peuvent être utilisées pour améliorer les conditions de vie des animaux et accroître leur bien-être.

__wf_reserved_inherit
Fig. 4. Une visualisation de l'estimation de la posture de la vache.

Cas d'utilisation de YOLO11 dans l'industrie du fitness

L'estimation de pose peut également aider les personnes à améliorer leur posture en temps réel pendant l'entraînement. Avec YOLO11, les instructeurs de fitness et de yoga peuvent surveiller et suivre les mouvements du corps des personnes qui s'entraînent, en se concentrant sur les points clés comme les articulations et les membres pour évaluer leur posture. Les données collectées peuvent être comparées aux poses idéales et aux techniques d'entraînement, et les instructeurs peuvent recevoir des alertes si une personne exécute un mouvement de manière incorrecte, ce qui contribue à prévenir les blessures.

__wf_reserved_inherit
Fig 5. Utilisation de l'estimation de pose pour analyser un entraînement.

Par exemple, lors d'un cours de yoga, l'estimation de la pose peut aider à vérifier si tous les élèves maintiennent un équilibre et un alignement corrects. Les applications mobiles intégrant la vision par ordinateur et l'estimation de la pose peuvent rendre le fitness plus accessible aux personnes qui s'entraînent à domicile ou à celles qui n'ont pas accès à des entraîneurs personnels. Ce retour d'information continu en temps réel aide les utilisateurs à améliorer leur technique et à atteindre leurs objectifs de remise en forme, tout en réduisant le risque de blessure.

Essayer l'estimation de pose en temps réel avec le modèle YOLO11

Maintenant que nous avons exploré ce qu'est l'estimation de pose et discuté de certaines de ses applications, regardons comment vous pouvez essayer l'estimation de pose avec le nouveau modèle YOLO11. Pour commencer, il existe deux façons pratiques de le faire : en utilisant le package Python Ultralytics ou via Ultralytics HUB. Examinons les deux options.

Exécution d'inférences en utilisant YOLO11

L'exécution d'une inférence implique que le modèle YOLO11 traite de nouvelles données en dehors de ses ensembles d'entraînement et utilise les modèles qu'il a appris pour faire des prédictions basées sur ces données. Vous pouvez exécuter des inférences via le code avec le package Python Ultralytics. Tout ce que vous avez à faire pour démarrer est d'installer le package Ultralytics en utilisant pip, conda ou Docker. Si vous rencontrez des difficultés lors de l'installation, notre Guide des problèmes courants offre des conseils de dépannage utiles. 

Une fois que vous avez installé le package avec succès, le code suivant décrit comment charger un modèle et l'utiliser pour prédire les poses d'objets dans une image.

__wf_reserved_inherit
Fig 6. Extrait de code présentant l'exécution d'inférences à l'aide de YOLO11.

Entraînement d'un modèle YOLO11 personnalisé

Supposons que vous travaillez sur un projet de vision par ordinateur et que vous disposez d'un ensemble de données spécifique pour une application particulière impliquant l'estimation de pose. Vous pouvez ensuite affiner et entraîner un modèle YOLO11 personnalisé pour l'adapter à votre application. Par exemple, vous pouvez utiliser un ensemble de données de points clés pour analyser et comprendre la pose d'un tigre dans les images en identifiant les caractéristiques clés telles que la position de ses membres, de sa tête et de sa queue.

Vous pouvez utiliser l'extrait de code suivant pour charger et entraîner un modèle d'estimation de pose YOLO11. Le modèle peut être construit à partir d'une configuration YAML, ou vous pouvez charger un modèle pré-entraîné pour l'entraînement. Ce script vous permet également de transférer des poids et de commencer à entraîner le modèle en utilisant un ensemble de données spécifié, tel que l'ensemble de données COCO pour l'estimation de pose.

__wf_reserved_inherit
Fig 7. Entraînement personnalisé de YOLO11.

En utilisant le modèle personnalisé nouvellement entraîné, vous pouvez exécuter des inférences sur des images inédites liées à votre solution de vision par ordinateur. Le modèle entraîné peut également être converti dans d'autres formats en utilisant le mode d'exportation.

Essayez YOLO11 sur Ultralytics HUB

Jusqu'à présent, nous avons examiné des méthodes pour utiliser YOLO11 nécessitant des connaissances de base en codage. Si ce n'est pas ce que vous recherchez, ou si vous n'êtes pas familier avec le codage, il existe une autre option : Ultralytics HUB. Ultralytics HUB est une plateforme conviviale conçue pour simplifier le processus d'entraînement et de déploiement des modèles YOLO. HUB vous permet de gérer facilement les ensembles de données, d'entraîner les modèles et de les déployer sans avoir besoin d'expertise technique.

Pour exécuter des inférences sur des images, vous pouvez créer un compte, naviguer jusqu'à la section « Modèles » et choisir le modèle d'estimation de pose YOLO11 qui vous intéresse. Dans la section d'aperçu, vous pouvez télécharger une image et afficher les résultats de la prédiction, comme indiqué ci-dessous. 

__wf_reserved_inherit
Fig 8. Estimation de pose sur Ultralytics HUB avec YOLO11.

Avancées de YOLO11 dans la détection de pose humaine

Ultralytics YOLO11 offre des solutions précises et flexibles pour des tâches telles que l'estimation de pose dans un large éventail d'applications. Qu'il s'agisse d'améliorer la sécurité des travailleurs sur les chantiers de construction, de surveiller la santé du bétail ou d'aider à la correction de la posture dans les exercices de fitness, YOLO11 apporte précision et retour d'information en temps réel grâce à une technologie avancée de vision par ordinateur. 

Sa polyvalence, avec de multiples variantes de modèles et la possibilité d'un entraînement personnalisé pour des cas d'utilisation spécifiques, en fait un outil très précieux pour les développeurs et les entreprises. Que ce soit par le biais du codage avec le package Python Ultralytics ou en utilisant Ultralytics HUB pour une implémentation plus facile, YOLO11 rend l'estimation de pose accessible et percutante.

Pour en savoir plus, consultez notre dépôt GitHub et rejoignez notre communauté. Explorez les applications de l'IA dans le secteur manufacturier et l'agriculture sur nos pages de solutions. 🚀

Construisons ensemble l'avenir
de l'IA !

Commencez votre parcours avec l'avenir de l'apprentissage automatique

Démarrer gratuitement
Lien copié dans le presse-papiers