Yolo Vision Shenzhen
Shenzhen
Rejoindre maintenant

L'IA comportementale rend la vision par ordinateur plus percutante

Abirami Vina

4 min de lecture

6 janvier 2025

Joignez-vous à nous pour revoir la présentation de David Scott à YOLO Vision 2024 sur l’analyse comportementale axée sur l’IA et ses applications concrètes dans des secteurs comme l’élevage.

Pendant de nombreuses années, les innovations en matière de vision par ordinateur se sont concentrées sur des tâches telles que la détection d'objets - identifier des objets tels qu'un chien ou une voiture dans des images et des vidéos. Ces approches ont permis des applications dans des domaines tels que les véhicules autonomes, la fabrication et la santé. 

Cependant, ces tâches se concentrent souvent uniquement sur l'identification de ce qu'est un objet. Et si les systèmes d'IA de vision pouvaient aller plus loin ? Par exemple, au lieu de simplement détecter un chien, disons qu'il pourrait comprendre que le chien court après une balle ou qu'une voiture freine brusquement parce qu'un piéton traverse. Ce passage de la reconnaissance de base à la compréhension contextuelle représente un changement majeur vers une IA comportementale plus intelligente et sensible au contexte.

Lors de YOLO Vision 2024 (YV24), l'événement hybride annuel d'Ultralytics célébrant les avancées en matière de Vision AI, le concept d'analyse comportementale basée sur l'IA a été au centre d'une présentation intéressante de David Scott, PDG de The Main Branch.

Dans son exposé, David a exploré la transition des tâches de base de vision par ordinateur au suivi comportemental. Fort de plus de 25 ans d'expérience dans la création d'applications technologiques de pointe, il a présenté l'impact de ce bond en avant. Il a souligné comment le décodage des schémas et des comportements remodèle des secteurs tels que l'agriculture et le bien-être animal.

Dans cet article, nous passerons en revue les points saillants de la conférence de David et explorerons comment le suivi comportemental rend l'IA plus pratique. 

Comprendre les défis de l'adoption de l'IA

David Scott a commencé son discours d'ouverture par un constat de réalité audacieux et a déclaré : « Un de mes collègues dit souvent : “La science ne se vend pas”, ce qui offense beaucoup d'entre nous ici parce que nous aimons vraiment la science. L'IA est vraiment cool - pourquoi les gens ne l'achèteraient-ils pas ? Mais la réalité est que les gens ne veulent pas l'acheter juste parce que nous pensons que c'est cool ; ils ont besoin d'une raison de l'acheter. »

Il a ensuite expliqué que dans son entreprise, The Main Branch, l'objectif est toujours de résoudre de vrais problèmes avec l'IA, et non pas seulement de montrer ses capacités. Beaucoup de clients viennent en voulant parler de la façon dont ils peuvent utiliser l'IA en général, mais il considère cela comme une approche à l'envers - c'est comme avoir une solution sans problème. Au lieu de cela, ils travaillent avec des clients qui apportent des défis spécifiques afin de pouvoir créer des solutions d'IA qui font réellement la différence.

__wf_reserved_inherit
Fig. 1. David Scott sur scène à YV24.

David a également partagé que leur travail va souvent au-delà de la simple reconnaissance d'objets dans une scène. Repérer ce qui est présent n'est que la première étape. La vraie valeur vient de la capacité à déterminer ce qu'il faut faire de cette information et à la rendre utile au sein de la chaîne de valeur globale. 

La technologie de suivi comportemental : la clé d'une IA exploitable

Une étape essentielle pour rendre l'IA vraiment utile consiste à dépasser les simples tâches de vision par ordinateur comme la détection d'objets et à utiliser ces informations pour le suivi comportemental. David a souligné que l'IA comportementale se concentre sur la compréhension des actions et des schémas, et pas seulement sur l'identification des objets. Cela rend l'IA capable de reconnaître les événements significatifs et de fournir des informations exploitables.

Il a donné l'exemple d'un animal qui se roule par terre, ce qui pourrait indiquer une maladie. Bien que les gens ne puissent pas surveiller un animal 24 heures sur 24, les systèmes de surveillance pilotés par l'IA dotés de capacités de suivi du comportement le peuvent. De telles solutions peuvent surveiller les objets en continu, détecter des comportements spécifiques, envoyer une alerte et permettre une action rapide. Cela transforme les données brutes en quelque chose de pratique et de précieux.

David a également démontré que cette approche rend l'IA non seulement intéressante, mais aussi réellement percutante. En s'attaquant à des problèmes réels, comme la surveillance des comportements et la réaction à ceux-ci, le suivi comportemental peut devenir un élément clé des solutions d'IA efficaces dans divers secteurs.

Donner vie à l'IA comportementale

David Scott a ensuite illustré comment Ultralytics YOLOv8, un modèle de vision par ordinateur, a été une percée pour les projets de suivi comportemental de son équipe. Il leur a fourni une base solide pour la détection, la classification et le suivi d'objets. Son équipe est également allée plus loin et a personnalisé l'entraînement de YOLOv8 pour se concentrer sur la surveillance des comportements au fil du temps, ce qui l'a rendu plus pratique et utile pour les situations réelles.

Il est intéressant de noter qu'avec la sortie d'Ultralytics YOLO11, des solutions comme celles créées par The Main Branch peuvent devenir encore plus fiables et précises. Ce dernier modèle offre des fonctionnalités telles qu'une précision améliorée et un traitement plus rapide qui améliorent sa capacité à suivre les comportements. Nous en discuterons plus en détail après avoir mieux compris les applications pour lesquelles l'IA comportementale peut être utilisée.

Ensuite, explorons les solutions dont David a parlé et comment la technologie de suivi comportemental est utilisée dans des applications concrètes pour résoudre les défis quotidiens et avoir un impact significatif.

HerdSense avec analyse comportementale basée sur l'IA

Tout d'abord, David a partagé un défi passionnant qu'ils ont relevé avec un projet appelé HerdSense, qui consistait à surveiller la santé de milliers de vaches dans un immense parc d'engraissement. L'objectif était de suivre le comportement de chaque vache pour identifier les problèmes de santé potentiels. Cela signifiait surveiller des dizaines de milliers d'animaux en même temps, et ce n'était pas une tâche simple.

__wf_reserved_inherit
Fig. 2. HerdSense s'est concentré sur la surveillance et l'identification des vaches à l'aide de l'IA comportementale.

Pour commencer à résoudre le problème de l'identification de chaque vache et du suivi de ses comportements, l'équipe de David a organisé un atelier de deux jours pour définir tous les comportements possibles qu'elle devait surveiller. Ils ont identifié plus de 200 comportements au total.

Chacun des 200 comportements dépendait de la capacité à reconnaître avec précision les vaches individuelles, car toutes les données devaient être liées à des animaux spécifiques. L'une des principales préoccupations était le suivi des vaches lorsqu'elles se regroupaient en troupeaux, ce qui rendait difficile l'observation des animaux individuels. 

L'équipe de David a développé un système de vision par ordinateur pour s'assurer que chaque vache était identifiée de manière cohérente, même dans des situations délicates. Ils ont pu confirmer que la même vache se verrait toujours attribuer le même identifiant, même si elle disparaissait de la vue, se mélangeait à d'autres ou réapparaissait plus tard.

Surveillance de la santé des chevaux à l'aide de la vision par ordinateur

Ensuite, David a présenté un autre projet fascinant dans lequel ils ont appliqué des techniques similaires de suivi du comportement pour surveiller les chevaux. Dans ce projet, l'équipe de David n'avait pas besoin de suivre les identifiants individuels des chevaux d'aussi près qu'avec les vaches. Au lieu de cela, ils se sont concentrés sur des comportements spécifiques et ont suivi des détails tels que les habitudes alimentaires et les niveaux d'activité généraux afin de détecter rapidement tout problème de santé. L'identification de petits changements de comportement pourrait conduire à des interventions plus rapides pour fournir de meilleurs soins et prévenir les problèmes avant qu'ils ne deviennent graves.

__wf_reserved_inherit
Fig. 3. Surveillance des chevaux à l'aide de l'IA comportementale.

Pourquoi l'IA comportementale n'est pas aussi simple qu'il n'y paraît

David a également évoqué la complexité du suivi comportemental à travers un exemple intéressant. Lors de recherches sur les moyens d'améliorer l'analyse comportementale, son équipe a rencontré une entreprise affirmant pouvoir détecter le vol à l'étalage en analysant des poses spécifiques, comme une personne ayant la main dans sa poche. Au début, cela semblait être une idée intelligente : certains mouvements pourraient suggérer un comportement suspect, n'est-ce pas ?

__wf_reserved_inherit
Fig 4. Comprendre les défis de la technologie de suivi comportemental.

Cependant, en explorant davantage, David a réalisé les limites de cette méthode. Une simple pose, comme une main dans une poche, ne signifie pas nécessairement qu'une personne est en train de voler à l'étalage. Cela pourrait simplement indiquer qu'elle est détendue, qu'elle réfléchit ou même qu'elle a froid. Le problème de se concentrer sur des poses isolées est que cela ignore le contexte plus large. Le comportement n'est pas seulement une action unique, c'est un ensemble d'actions au fil du temps, façonné par le contexte et l'intention.

David a souligné que le véritable suivi comportemental est beaucoup plus complexe et nécessite une approche holistique. Il s'agit d'analyser des séquences d'actions et de comprendre ce qu'elles signifient dans un contexte plus large. Bien que l'industrie de l'IA fasse des progrès, il a noté qu'il reste encore du travail à faire pour faire progresser le suivi comportemental afin de fournir des informations significatives et précises.

Créer des modèles d'IA de vision plus intelligents qui comprennent les actions

Par la suite, David a emmené le public dans les coulisses pour leur montrer comment son équipe a créé une solution de vision par ordinateur pour surveiller la santé des vaches à l'aide de YOLOv8 et de ses capacités d'estimation de pose.

Ils ont commencé par créer un ensemble de données personnalisé pour l'estimation de la pose d'une vache, augmentant le nombre standard de points clés de 17 à 145 afin d'améliorer la capacité du modèle à analyser les mouvements. Ensuite, le modèle a été entraîné sur un ensemble de données massif de plus de 2 millions d'images et 110 millions d'exemples de comportement. 

Grâce à une infrastructure matérielle avancée, l'équipe de David a pu entraîner le modèle en seulement deux jours au lieu des semaines qu'il aurait fallu sur du matériel conventionnel. Le modèle entraîné a ensuite été intégré à un outil de suivi du comportement personnalisé qui analysait simultanément plusieurs trames vidéo pour détecter les schémas dans les actions des vaches.

Le résultat a été une solution basée sur la vision par ordinateur qui peut détecter et suivre huit comportements différents des vaches, comme manger, boire et se coucher, afin de repérer les changements de comportement mineurs qui pourraient signaler des problèmes de santé. Cela permet aux agriculteurs d'agir rapidement et d'améliorer la gestion du troupeau.

La voie à suivre pour l'IA comportementale

David a conclu son intervention en partageant une leçon importante avec le public : « Si vous ne donnez pas à l'IA la possibilité d'échouer, vous vous préparez à l'échec car, en fin de compte, c'est statistique. » Il a souligné que l'IA, malgré ses forces, n'est pas sans défaut. C'est un outil qui apprend des schémas, et il y aura toujours des moments où elle ne fera pas les choses correctement. Au lieu de craindre ces erreurs, la clé est de construire des systèmes capables de les gérer et de continuer à s'améliorer au fil du temps.

Cela est également vrai en ce qui concerne les modèles de vision par ordinateur eux-mêmes. Par exemple, Ultralytics YOLO11, la dernière version des modèles Ultralytics YOLO, a été conçue en gardant à l'esprit la nécessité de passer à la vitesse supérieure par rapport à YOLOv8.

 

__wf_reserved_inherit
Fig 5. Tâches de vision par ordinateur prises en charge par YOLO11.

En particulier, YOLO11 offre de meilleures performances, notamment en ce qui concerne les applications en temps réel où la précision est essentielle, comme l'agriculture et les soins de santé. Grâce à ses fonctionnalités avancées, YOLO11 redéfinit la façon dont les industries utilisent l'IA en fournissant des informations innovantes en temps réel et en les aidant à relever les défis plus efficacement.

Principaux points à retenir

Le discours d'ouverture de David à YV24 a rappelé que l'IA est plus qu'une simple innovation cool : c'est un outil puissant pour résoudre des problèmes réels et améliorer notre façon de vivre et de travailler. En se concentrant sur le comportement, l'IA a déjà un impact dans des domaines tels que le suivi de la santé animale et la reconnaissance de schémas significatifs dans les actions quotidiennes. 

Le potentiel de l'IA comportementale est passionnant, et nous n'en sommes qu'au début. En transformant les données brutes en informations exploitables, l'IA comportementale passe d'une surveillance passive à une résolution active des problèmes. Au fur et à mesure de son développement, l'IA comportementale est appelée à stimuler des décisions plus intelligentes, à rationaliser les processus et à apporter des améliorations significatives à nos vies.

Restez connecté avec notre communauté pour en savoir plus sur l'IA et ses applications dans le monde réel. Visitez notre dépôt GitHub pour découvrir les innovations dans des domaines tels que l'IA dans l'agriculture et la vision par ordinateur dans la fabrication.

Construisons ensemble l'avenir
de l'IA !

Commencez votre parcours avec l'avenir de l'apprentissage automatique

Démarrer gratuitement
Lien copié dans le presse-papiers