Yolo Vision Shenzhen
Shenzhen
Rejoindre maintenant

L'IA comportementale rend la vision par ordinateur plus percutante

Abirami Vina

4 min de lecture

6 janvier 2025

Rejoignez-nous pour revenir sur la conférence YOLO Vision 2024 de David Scott sur l'analyse comportementale pilotée par l'IA et ses applications concrètes dans des secteurs tels que l'élevage.

Pendant de nombreuses années, les innovations en matière de vision par ordinateur se sont concentrées sur des tâches telles que la détection d'objets - identifier des objets tels qu'un chien ou une voiture dans des images et des vidéos. Ces approches ont permis des applications dans des domaines tels que les véhicules autonomes, la fabrication et la santé. 

Cependant, ces tâches se concentrent souvent uniquement sur l'identification de ce qu'est un objet. Et si les systèmes d'IA de vision pouvaient aller plus loin ? Par exemple, au lieu de simplement détecter un chien, disons qu'il pourrait comprendre que le chien court après une balle ou qu'une voiture freine brusquement parce qu'un piéton traverse. Ce passage de la reconnaissance de base à la compréhension contextuelle représente un changement majeur vers une IA comportementale plus intelligente et sensible au contexte.

Lors de YOLO Vision 2024 (YV24), l'événement hybride annuel d'Ultralyticscélébrant les avancées en matière d'IA Vision, le concept d'analyse comportementale pilotée par l'IA a occupé le devant de la scène lors d'une intervention intéressante de David Scott, PDG de The Main Branch.

Dans son exposé, David a exploré la transition des tâches de base de vision par ordinateur au suivi comportemental. Fort de plus de 25 ans d'expérience dans la création d'applications technologiques de pointe, il a présenté l'impact de ce bond en avant. Il a souligné comment le décodage des schémas et des comportements remodèle des secteurs tels que l'agriculture et le bien-être animal.

Dans cet article, nous passerons en revue les points saillants de la conférence de David et explorerons comment le suivi comportemental rend l'IA plus pratique. 

Comprendre les défis de l'adoption de l'IA

David Scott a commencé son discours d'ouverture par un constat de réalité audacieux et a déclaré : « Un de mes collègues dit souvent : “La science ne se vend pas”, ce qui offense beaucoup d'entre nous ici parce que nous aimons vraiment la science. L'IA est vraiment cool - pourquoi les gens ne l'achèteraient-ils pas ? Mais la réalité est que les gens ne veulent pas l'acheter juste parce que nous pensons que c'est cool ; ils ont besoin d'une raison de l'acheter. »

Il a ensuite expliqué que dans son entreprise, The Main Branch, l'objectif est toujours de résoudre de vrais problèmes avec l'IA, et non pas seulement de montrer ses capacités. Beaucoup de clients viennent en voulant parler de la façon dont ils peuvent utiliser l'IA en général, mais il considère cela comme une approche à l'envers - c'est comme avoir une solution sans problème. Au lieu de cela, ils travaillent avec des clients qui apportent des défis spécifiques afin de pouvoir créer des solutions d'IA qui font réellement la différence.

__wf_reserved_inherit
Fig. 1. David Scott sur scène à YV24.

David a également partagé que leur travail va souvent au-delà de la simple reconnaissance d'objets dans une scène. Repérer ce qui est présent n'est que la première étape. La vraie valeur vient de la capacité à déterminer ce qu'il faut faire de cette information et à la rendre utile au sein de la chaîne de valeur globale. 

La technologie de suivi comportemental : la clé d'une IA exploitable

Une étape essentielle pour rendre l'IA vraiment utile consiste à dépasser les simples tâches de vision par ordinateur comme la détection d'objets et à utiliser ces informations pour le suivi comportemental. David a souligné que l'IA comportementale se concentre sur la compréhension des actions et des schémas, et pas seulement sur l'identification des objets. Cela rend l'IA capable de reconnaître les événements significatifs et de fournir des informations exploitables.

Il a donné l'exemple d'un animal qui se roule par terre, ce qui peut être le signe d'une maladie. S'il n'est pas possible de surveiller un animal 24 heures sur 24, les systèmes de surveillance pilotés par l'IA et dotés de capacités de suivi comportemental le peuvent. Ces solutions peuvent surveiller des objets en continu, detect comportements spécifiques, envoyer une alerte et permettre une action en temps voulu. Les données brutes sont ainsi transformées en quelque chose de pratique et de précieux.

David a également démontré que cette approche rend l'IA non seulement intéressante, mais aussi réellement percutante. En s'attaquant à des problèmes réels, comme la surveillance des comportements et la réaction à ceux-ci, le suivi comportemental peut devenir un élément clé des solutions d'IA efficaces dans divers secteurs.

Donner vie à l'IA comportementale

David Scott a ensuite expliqué comment Ultralytics YOLOv8un modèle de vision par ordinateur, a constitué une percée pour les projets de suivi comportemental de son équipe. Il leur a donné une base solide pour la détection, la classification et le suivi des objets. Son équipe est également allée plus loin et a personnalisé YOLOv8 pour qu'il se concentre sur le suivi des comportements au fil du temps, ce qui le rend plus pratique et plus utile dans des situations réelles.

Il est intéressant de noter qu'avec la sortie de Ultralytics YOLO11des solutions telles que celles créées par The Main Branch peuvent devenir encore plus fiables et plus précises. Ce dernier modèle offre des caractéristiques telles qu'une précision accrue et un traitement plus rapide qui améliorent sa capacité à track comportements. Nous y reviendrons plus en détail après avoir mieux compris les applications de l'IA comportementale.

Ensuite, explorons les solutions dont David a parlé et comment la technologie de suivi comportemental est utilisée dans des applications concrètes pour résoudre les défis quotidiens et avoir un impact significatif.

HerdSense avec analyse comportementale basée sur l'IA

Tout d'abord, David a fait part d'un défi passionnant qu'ils ont relevé dans le cadre d'un projet appelé HerdSense, qui consistait à surveiller la santé de milliers de vaches dans un immense parc d'engraissement. L'objectif était de track comportement de chaque vache afin d'identifier d'éventuels problèmes de santé. Il fallait donc surveiller des dizaines de milliers d'animaux en même temps, ce qui n'était pas une mince affaire.

__wf_reserved_inherit
Fig. 2. HerdSense s'est concentré sur la surveillance et l'identification des vaches à l'aide de l'IA comportementale.

Pour commencer à résoudre le problème de l'identification de chaque vache et du suivi de ses comportements, l'équipe de David a organisé un atelier de deux jours pour définir tous les comportements possibles qu'elle devait surveiller. Ils ont identifié plus de 200 comportements au total.

Chacun des 200 comportements dépendait de la capacité à reconnaître avec précision les vaches individuelles, car toutes les données devaient être liées à des animaux spécifiques. L'une des principales préoccupations était le suivi des vaches lorsqu'elles se regroupaient en troupeaux, ce qui rendait difficile l'observation des animaux individuels. 

L'équipe de David a développé un système de vision par ordinateur pour s'assurer que chaque vache était identifiée de manière cohérente, même dans des situations délicates. Ils ont pu confirmer que la même vache se verrait toujours attribuer le même identifiant, même si elle disparaissait de la vue, se mélangeait à d'autres ou réapparaissait plus tard.

Surveillance de la santé des chevaux à l'aide de la vision par ordinateur

David a ensuite présenté un autre projet fascinant dans le cadre duquel ils ont appliqué des techniques de suivi comportemental similaires pour surveiller les chevaux. Dans ce projet, l'équipe de David n'a pas eu besoin de track l'identification de chaque cheval aussi précisément qu'avec les vaches. Elle s'est plutôt concentrée sur des comportements spécifiques et a suivi des détails tels que les habitudes alimentaires et les niveaux d'activité généraux afin de détecter rapidement tout problème de santé. L'identification de petits changements de comportement pourrait permettre des interventions plus rapides afin de fournir de meilleurs soins et de prévenir les problèmes avant qu'ils ne s'aggravent.

__wf_reserved_inherit
Fig. 3. Surveillance des chevaux à l'aide de l'IA comportementale.

Pourquoi l'IA comportementale n'est pas aussi simple qu'il n'y paraît

David a également abordé la complexité du suivi comportemental à l'aide d'un exemple intriguant. Alors qu'elle recherchait des moyens d'améliorer l'analyse comportementale, son équipe est tombée sur une société qui prétendait detect vols à l'étalage en analysant des postures spécifiques, comme celle d'une personne qui mettrait la main à la poche. À première vue, l'idée semblait judicieuse : certains mouvements pouvaient suggérer un comportement suspect, n'est-ce pas ?

__wf_reserved_inherit
Fig 4. Comprendre les défis de la technologie de suivi comportemental.

Cependant, en explorant davantage, David a réalisé les limites de cette méthode. Une simple pose, comme une main dans une poche, ne signifie pas nécessairement qu'une personne est en train de voler à l'étalage. Cela pourrait simplement indiquer qu'elle est détendue, qu'elle réfléchit ou même qu'elle a froid. Le problème de se concentrer sur des poses isolées est que cela ignore le contexte plus large. Le comportement n'est pas seulement une action unique, c'est un ensemble d'actions au fil du temps, façonné par le contexte et l'intention.

David a souligné que le véritable suivi comportemental est beaucoup plus complexe et nécessite une approche holistique. Il s'agit d'analyser des séquences d'actions et de comprendre ce qu'elles signifient dans un contexte plus large. Bien que l'industrie de l'IA fasse des progrès, il a noté qu'il reste encore du travail à faire pour faire progresser le suivi comportemental afin de fournir des informations significatives et précises.

Créer des modèles d'IA de vision plus intelligents qui comprennent les actions

David a ensuite emmené le public dans les coulisses pour lui montrer comment son équipe a construit une solution de vision par ordinateur pour surveiller la santé des vaches à l'aide de YOLOv8 et de ses capacités d'estimation de la pose.

Ils ont commencé par créer un ensemble de données personnalisé pour l'estimation de la pose d'une vache, augmentant le nombre standard de points clés de 17 à 145 afin d'améliorer la capacité du modèle à analyser les mouvements. Ensuite, le modèle a été entraîné sur un ensemble de données massif de plus de 2 millions d'images et 110 millions d'exemples de comportement. 

Grâce à une infrastructure matérielle avancée, l'équipe de David a pu entraîner le modèle en deux jours seulement, au lieu des semaines qu'il aurait fallu avec du matériel conventionnel. Le modèle formé a ensuite été intégré à un outil de suivi du comportement personnalisé qui a analysé simultanément plusieurs images vidéo afin de detect schémas dans les actions des vaches.

Le résultat est une solution visionnaire basée sur l'IA qui peut detect et track huit comportements différents des vaches, comme manger, boire et se coucher, afin de repérer les changements de comportement mineurs qui pourraient signaler des problèmes de santé. Cela permet aux éleveurs d'agir rapidement et d'améliorer la gestion du troupeau.

La voie à suivre pour l'IA comportementale

David a conclu son intervention en partageant une leçon importante avec le public : « Si vous ne donnez pas à l'IA la possibilité d'échouer, vous vous préparez à l'échec car, en fin de compte, c'est statistique. » Il a souligné que l'IA, malgré ses forces, n'est pas sans défaut. C'est un outil qui apprend des schémas, et il y aura toujours des moments où elle ne fera pas les choses correctement. Au lieu de craindre ces erreurs, la clé est de construire des systèmes capables de les gérer et de continuer à s'améliorer au fil du temps.

Il en va de même pour les modèles de vision par ordinateur. Par exemple, Ultralytics YOLO11, la dernière version des modèles Ultralytics YOLO , a été conçue en gardant à l'esprit la nécessité de passer à la vitesse supérieure par rapport à YOLOv8.

 

__wf_reserved_inherit
Fig. 5. Tâches de vision par ordinateur prises en charge par YOLO11.

En particulier, YOLO11 offre de meilleures performances, notamment en ce qui concerne les applications en temps réel où la précision est essentielle, comme l'agriculture et les soins de santé. Grâce à ses fonctionnalités avancées, YOLO11 redéfinit la manière dont les industries utilisent l'IA en fournissant des informations innovantes en temps réel et en les aidant à relever les défis de manière plus efficace.

Principaux points à retenir

Le discours d'ouverture de David à YV24 a rappelé que l'IA est plus qu'une simple innovation cool : c'est un outil puissant pour résoudre des problèmes réels et améliorer notre façon de vivre et de travailler. En se concentrant sur le comportement, l'IA a déjà un impact dans des domaines tels que le suivi de la santé animale et la reconnaissance de schémas significatifs dans les actions quotidiennes. 

Le potentiel de l'IA comportementale est passionnant, et nous n'en sommes qu'au début. En transformant les données brutes en informations exploitables, l'IA comportementale passe d'une surveillance passive à une résolution active des problèmes. Au fur et à mesure de son développement, l'IA comportementale est appelée à stimuler des décisions plus intelligentes, à rationaliser les processus et à apporter des améliorations significatives à nos vies.

Restez connecté avec notre communauté pour en savoir plus sur l'IA et ses applications dans le monde réel. Visitez notre dépôt GitHub pour découvrir les innovations dans des domaines tels que l'IA dans l'agriculture et la vision par ordinateur dans la fabrication.

Construisons ensemble l'avenir
de l'IA !

Commencez votre parcours avec l'avenir de l'apprentissage automatique

Démarrer gratuitement