Entraînement personnalisé d'Ultralytics YOLO11 pour l'estimation de la pose d'un chien

Abirami Vina

4 min lire

3 février 2025

Apprenez à former Ultralytics YOLO11 pour l'estimation de la pose d'un chien et exploitez le modèle formé pour des applications pratiques telles que les soins aux animaux de compagnie.

Et si la posture de votre chien pouvait vous donner des indications sur son état de santé ? Il n'est pas facile de les surveiller manuellement 24 heures sur 24. Toutefois, grâce aux progrès de l'intelligence artificielle (IA) et de la vision par ordinateur, nous pouvons analyser les séquences vidéo en temps réel pour mieux comprendre leur comportement.

Plus précisément, des modèles de vision par ordinateur comme Ultralytics YOLO11 peuvent aider à estimer la posture d'un chien et à suivre ses mouvements, fournissant ainsi des informations précieuses sur son bien-être. Comment cela fonctionne-t-il ? La capacité d'estimation de la pose de YOLO11 permet d'identifier les points clés du corps d'un sujet afin de comprendre sa posture et ses mouvements. 

En outre, YOLO11 peut être entraîné sur mesure à partir d'un ensemble de données conçu pour l'estimation de la position des chiens, ce qui permet d'analyser avec précision le langage corporel de votre animal de compagnie. Le logiciel Ultralytics Python prend en charge un ensemble de données sur la posture des chiens qui facilite l'entraînement et le déploiement de modèles d'intelligence artificielle pour les chiens. Cette technologie s'inscrit dans le marché en plein essor des technologies pour animaux de compagnie, évalué à 9,4 milliards de dollars en 2024 et qui devrait atteindre 64 milliards de dollars d'ici 2037.

L'inspiration derrière cet article est Blues, notre Dog Executive Officer (DEO). Si vous consultez notre page À propos de nous, vous verrez que Blues est un membre précieux de l'équipe et qu'il joue un rôle important pour que tout se passe bien chez Ultralytics ! 

Dans cet article, nous verrons comment entraîner YOLO11 à l'aide du Dog-Pose Dataset pour l'estimation de la pose des chiens. Nous explorerons également ses applications pratiques dans le domaine des soins aux animaux et de l'analyse du comportement.

__wf_reserved_inherit
Fig 1. Voici Blues, le directeur général d'Ultralytics.

Aperçu de l'ensemble de données Dog-Pose

Un ensemble de données est une collection de données utilisée pour former des modèles d'apprentissage automatique. Pour l'estimation de la pose, l'ensemble de données idéal comprend des images avec des points clés étiquetés pour cartographier les positions du corps. Il doit également comporter une grande variété de poses, d'angles, de conditions d'éclairage et d'arrière-plans afin d'aider le modèle à apprendre à reconnaître et à prédire les poses avec précision. Cette diversité rend le modèle plus fiable pour une utilisation dans le monde réel.

Le Dog-Pose Dataset, pris en charge par Ultralytics, est spécialement conçu pour aider les modèles à apprendre et à reconnaître efficacement les poses de chiens. Il comprend plus de 8 400 images annotées de différentes races de chiens, avec des étiquettes détaillées pour 24 points clés, tels que la queue, les oreilles et les pattes.

__wf_reserved_inherit
Fig. 2. Vue d'ensemble de l'ensemble de données Dog-Pose.

Comment entraîner YOLO11 avec le jeu de données Dog-Pose

L'entraînement personnalisé de YOLO11 avec l'ensemble de données Dog-Pose est un processus simple. Pour commencer, vous devez configurer votre environnement en installant le paquetage Ultralytics Python, qui comprend tous les outils nécessaires à l'entraînement et à l'évaluation. 

Ultralytics a un support intégré pour le Dog-Pose Dataset, ce qui élimine le besoin d'étiquetage manuel et vous permet de passer directement à l'entraînement. Une fois que tout est configuré, vous pouvez entraîner YOLO11 sur l'ensemble de données Dog-Pose en utilisant seulement quelques lignes de code, comme le montre l'image ci-dessous. 

Pendant l'entraînement, le modèle apprend à détecter et à suivre les poses des chiens en fonction de leur race, des conditions d'éclairage et de l'environnement. Après l'entraînement, vous pouvez visualiser les résultats et affiner le modèle pour améliorer la précision et les performances.

__wf_reserved_inherit
Fig. 3. Un extrait de code illustrant l'entraînement personnalisé de YOLO11 sur l'ensemble de données "Dog-Pose".

Si vous rencontrez des problèmes lors de la formation de votre modèle, voici quelques conseils de dépannage qui vous aideront à les résoudre rapidement :

  • Vérifiez votre connexion Internet: L'ensemble de données sur les chiens est automatiquement téléchargé lorsque vous exécutez le script de formation. Assurez-vous d'avoir une connexion internet stable pour éviter les échecs de téléchargement.
  • Mettre à jour Ultralytics: Assurez-vous que vous utilisez la dernière version du paquetage Python Ultralytics.
  • Recherchez les erreurs dans la console: Lisez attentivement les messages d'erreur, car ils fournissent souvent des indices sur ce qui doit être corrigé.

Vous pouvez consulter le Guide des problèmes communs d'Ultralytics pour plus de conseils de dépannage.

Que se passe-t-il pendant la formation au modèle personnalisé ?

Vous vous demandez peut-être ce qui se passe dans les coulisses lorsque vous entraînez YOLO11 sur l'ensemble de données Dog-Pose. Regardons de plus près le processus.

Plutôt que de partir de zéro, nous utilisons un modèle pré-entraîné YOLO11-pose, qui a déjà été entraîné sur l'ensemble de données COCO-Pose. Ce modèle pré-entraîné peut détecter les points clés humains puisque COCO-Pose est conçu pour l'estimation de la pose humaine. En fait, sans aucune formation supplémentaire, vous pouvez utiliser YOLO11-Pose pour effectuer l'estimation de la pose humaine dès sa sortie de l'emballage.

Grâce à l'apprentissage par transfert, nous adaptons ce modèle spécifiquement à l'estimation de la pose d'un chien, en l'aidant à reconnaître des points clés tels que les pattes, la queue et la tête. En exposant le modèle à des exemples spécifiques au chien, il apprend à se concentrer sur ces caractéristiques essentielles.

Au cours de la formation, certaines parties du modèle restent inchangées, conservant les connaissances générales acquises à partir de l'ensemble de données COCO. D'autres parties sont réapprises pour améliorer la précision de l'estimation des poses des chiens. Le modèle apprend en comparant ses prédictions avec les points clés réels de l'ensemble de données et en s'adaptant pour réduire les erreurs. Au fil du temps, ce processus lui permet de mieux suivre les mouvements d'un chien avec précision.

‍L'apprentissage par transfert permet également au modèle de s'adapter à des races, des tailles et des mouvements différents, ce qui garantit des performances fiables dans des scénarios réels.

__wf_reserved_inherit
Fig. 4. Détection des points clés de Blues et de sa sœur Happy.

Les avantages de YOLO11 dans l'estimation de la pose du chien

Il existe plusieurs modèles de vision par ordinateur. Pourquoi YOLO11 est-il le meilleur choix pour l'estimation de la pose d'un chien ? 

YOLO11 se distingue par sa vitesse et sa précision en temps réel, ce qui en fait une excellente option pour l'estimation de la pose d'un chien. Il est plus performant que les versions précédentes en termes de précision et de rapidité. Avec 22 % de paramètres en moins que YOLOv8, il atteint une précision moyenne plus élevée (mAP) sur l'ensemble de données COCO, ce qui signifie qu'il détecte les objets avec plus de précision et d'efficacité. Sa rapidité de traitement en fait un outil idéal pour les applications en temps réel, où une détection rapide et fiable est essentielle.

Au-delà de l'estimation de la pose, YOLO11 prend également en charge des tâches de vision artificielle telles que la segmentation d'instances et le suivi d'objets, ce qui permet de créer une solution Vision AI plus complète pour la surveillance de votre chien. Ces fonctions peuvent améliorer le suivi des mouvements, l'analyse du comportement et les soins généraux apportés à l'animal.

__wf_reserved_inherit
Fig. 5. YOLO11 en action : segmentation du blues sans effort !

Applications de l'estimation de la pose du chien et de YOLO11

Ensuite, nous aborderons les applications réelles de l'estimation de la pose du chien et son impact sur les soins aux animaux de compagnie. 

Améliorer le dressage des animaux de compagnie grâce à l'estimation de la position du chien

L'estimation de la pose du chien peut rendre l'éducation canine plus intelligente et plus efficace. Supposons qu'une caméra soit utilisée pour capturer les mouvements du chien, c'est là que YOLO11 peut intervenir. Il peut détecter des points clés tels que les pattes, la queue et la tête, et les analyser pour reconnaître des actions telles que s'asseoir, rester ou se coucher. 

Si le chien n'exécute pas l'action correctement, le système peut fournir un retour d'information instantané par le biais d'une application, aidant ainsi le dresseur en temps réel. Le dressage est ainsi plus efficace, plus précis et plus adapté aux progrès du chien.

Par exemple, vous pouvez apprendre à votre chien à s'asseoir sur commande. Le système peut surveiller la posture de votre chien et détecter s'il est complètement assis. Si le chien abaisse son corps mais ne s'assoit pas complètement, le système peut détecter l'action incomplète et envoyer un feedback instantané par le biais d'une application. Le dresseur peut être modifié pour apporter de petits ajustements au dressage, comme renforcer l'ordre ou guider le chien dans la bonne position.

__wf_reserved_inherit
Fig. 6. Blues aide l'équipe à estimer la pose du chien à l'aide de YOLO11.

Améliorer les soins vétérinaires grâce à des modèles d'estimation de la pose

La vision par ordinateur peut transformer l'approche des vétérinaires en matière de soins aux animaux. La capacité de l'estimation de la pose du chien à analyser les détails avec précision permet de repérer plus facilement les mouvements inhabituels et d'identifier les problèmes de santé potentiels. 

Par exemple, un vétérinaire qui surveille un chien se remettant d'une blessure aux ligaments peut s'appuyer sur YOLO11, formé sur l'ensemble de données "Dog-Pose", pour une analyse automatisée. Les boiteries ou les changements de position des pattes peuvent être facilement détectés. La surveillance continue, 24 heures sur 24 et 7 jours sur 7, basée sur la vision, fournit des informations claires sur le rétablissement du chien et aide à déterminer si le traitement est efficace ou si des ajustements sont nécessaires.

Le chemin à parcourir pour l'estimation des poses de chiens 

Au fur et à mesure que la technologie évolue, des solutions telles que l'estimation de la pose du chien avec YOLO11 joueront probablement un rôle plus important dans la surveillance et le bien-être des animaux. En fait, YOLO11 peut être intégré à la technologie portable, comme les colliers intelligents et les trackers de santé, pour surveiller les indicateurs de santé clés tels que la fréquence cardiaque, les niveaux d'activité et les schémas de mobilité.

Par exemple, un collier intelligent équipé de capteurs de mouvement peut suivre la démarche d'un chien qui marche ou court, tandis que l'estimation de la pose de YOLO11 analyse la posture en temps réel. Si le système détecte un mouvement irrégulier, tel qu'une boiterie ou une raideur, il peut corréler ces données avec la fréquence cardiaque et les niveaux d'activité afin d'évaluer les risques d'inconfort ou de blessure. Les propriétaires d'animaux et les vétérinaires peuvent utiliser ces informations pour identifier rapidement les problèmes et prendre des mesures proactives.

Grâce à ces avancées, l'estimation de la pose du chien évolue au-delà du simple suivi des mouvements - elle devient un élément clé d'un système complet de soins pour animaux de compagnie piloté par l'IA, aidant les chiens à rester en meilleure santé, à être plus en sécurité et à être mieux suivis en temps réel.

Principaux enseignements

Grâce à des innovations telles que YOLO11 et le Dog-Pose Dataset, nous ouvrons de nouvelles perspectives dans le domaine de la vision par ordinateur. Ces avancées nous aident à mieux comprendre le comportement et la santé des chiens d'une manière qui n'était pas possible auparavant.

En suivant avec précision les postures des chiens, nous pouvons améliorer le dressage, surveiller la santé et rendre les soins aux animaux de compagnie plus efficaces. Que ce soit dans le domaine de la recherche, des soins vétérinaires ou du dressage des chiens, Vision AI crée des moyens plus intelligents de prendre soin de nos chiens et d'améliorer leur bien-être.

Rejoignez notre communauté et explorez notre dépôt GitHub pour en savoir plus sur l'IA. Découvrez comment des innovations telles que la vision par ordinateur dans les soins de santé et l'IA dans les voitures auto-conduites façonnent l'avenir. Consultez nos options de licence pour commencer vos projets Vision AI dès aujourd'hui.

Construisons ensemble le futur
de l'IA !

Commencez votre voyage avec l'avenir de l'apprentissage automatique

Commencer gratuitement
Lien copié dans le presse-papiers