Explorer comment la vision par ordinateur peut être utilisée pour la détection du regard

Abirami Vina

5 minutes de lecture

19 février 2025

Découvrez comment les techniques d'IA Vision, telles que la détection d'objets et l'estimation de la pose, peuvent être utilisées pour le suivi des yeux et la détection du regard dans diverses applications.

La vision par ordinateur est une branche de l'intelligence artificielle (IA) qui vise à permettre aux machines d'analyser et d'interpréter des données visuelles d'une manière similaire à celle des humains. Une application particulièrement fascinante de la vision artificielle est la détection du regard, qui permet aux machines de suivre et de comprendre où une personne regarde.

En tant qu'êtres humains, nous pouvons naturellement suivre le regard d'une personne et comprendre ce sur quoi elle se concentre. Par exemple, si vous parlez à un ami et qu'il regarde soudain vers la porte, vous vous retournerez instinctivement pour voir ce qui a attiré son attention. Les machines, en revanche, n'ont pas cette capacité intégrée. Elles doivent être formées à l'aide de techniques de vision par ordinateur pour reconnaître les mouvements oculaires et interpréter la direction du regard. 

Le marché mondial de la détection du regard devrait atteindre 11,9 milliards de dollars d'ici 2032, et de nombreuses industries l'adoptent pour différentes applications. Par exemple, la détection du regard dans les voitures est utilisée pour améliorer la sécurité du conducteur en contrôlant les niveaux d'attention et en détectant les signes de somnolence ou de distraction.

Dans cet article, nous verrons comment la vision par ordinateur est utilisée pour le suivi des yeux et la détection du regard. Nous examinerons également quelques-unes de ses principales applications dans divers secteurs d'activité. Commençons par le commencement !

Qu'est-ce que l'oculométrie et la détection du regard ?

Le suivi des yeux et la détection du regard sont des techniques utilisées pour déterminer le centre d'attention d'une personne en analysant les mouvements des yeux et la direction du regard. Grâce aux progrès de l'IA et de la technologie des capteurs, il est désormais possible de suivre les yeux d'une personne en temps réel. 

Traditionnellement, la plupart des systèmes de suivi oculaire reposent sur des caméras infrarouges (IR), qui détectent les mouvements de la pupille en illuminant les yeux avec une lumière proche de l'infrarouge et en capturant les reflets de la cornée. Ces systèmes offrent une grande précision. Cependant, ils nécessitent souvent un casque spécialisé, qui peut être inconfortable à porter et sujet à des problèmes d'étalonnage.

Avec l'essor de l'IA, les chercheurs ont activement exploré les méthodes de suivi oculaire basées sur la vision par ordinateur. Contrairement aux systèmes traditionnels basés sur l'infrarouge, ces approches s'appuient sur des modèles de vision artificielle comme Ultralytics YOLO11 pour détecter les caractéristiques faciales telles que les yeux et les pupilles, ainsi que pour effectuer l'estimation de la pose de la tête. En outre, des modèles d'apprentissage profond spécialisés comme GazeNet de NVIDIA sont conçus spécifiquement pour l'estimation du regard. 

__wf_reserved_inherit
Fig. 1. Exemple d'utilisation de YOLO11 pour détecter les yeux et la pupille d'une personne.

Bien qu'il s'agisse encore d'un domaine en évolution, le suivi du regard basé sur la vision par ordinateur pourrait rendre le suivi des yeux plus accessible, en réduisant les coûts et en améliorant la facilité d'utilisation pour des applications dans les domaines du marketing, de la psychologie et des neurosciences.

L'évolution de la détection et du suivi du regard

Ensuite, examinons le passage des systèmes traditionnels basés sur l'infrarouge à des solutions plus accessibles, basées sur des logiciels.

Vous vous demandez peut-être si l'oculométrie et la détection du regard peuvent être réalisées sans l'IA - alors pourquoi y a-t-il des recherches en cours sur l'intégration de l'IA et de la vision par ordinateur dans ces technologies ? S'il existe des méthodes traditionnelles de suivi du regard, elles reposent souvent sur des caméras infrarouges spécialisées et des dispositifs de suivi du regard montés sur la tête, qui peuvent être coûteux, encombrants et nécessiter des conditions d'éclairage contrôlées. Les solutions basées sur l'IA, en revanche, permettent de suivre l'œil à l'aide de webcams standard et d'appareils photo de smartphones, ce qui permet de réduire les coûts et d'améliorer l'accessibilité. 

__wf_reserved_inherit
Fig. 2. Dispositif de suivi oculaire monté sur la tête.

Voici quelques-uns des autres facteurs à l'origine de l'évolution de la technologie de l'oculométrie et de la détection du regard :

  • Applications: Les approches basées sur les logiciels permettent à cet espace de s'étendre au-delà de la recherche vers les appareils grand public et des domaines tels que les jeux.
  • Évolutivité: L'IA peut intervenir pour mettre les solutions de détection du regard à la disposition d'un public plus large, des utilisateurs individuels aux grandes industries.
  • Les progrès de la technologie des appareils photo: Aujourd'hui, nous avons accès à des caméras de smartphones et de webcams à plus haute résolution qui améliorent la précision de l'oculométrie, ce qui n'était pas possible il y a 20 ans.

Utilisation de Ultralytics YOLO11 pour la détection et le suivi du regard

Maintenant que nous avons discuté du rôle de la vision par ordinateur dans le suivi des yeux et la détection du regard, voyons comment YOLO11 peut être utilisé ici.

Ultralytics YOLO11 prend en charge des tâches telles que la détection d'objets et l'estimation de la pose. Pré-entraîné sur l'ensemble de données COCO, il atteint une grande précision dans la détection de divers objets. En particulier, pour une solution de détection du regard, YOLO11 peut jouer un rôle de soutien. 

Bien qu'il ne puisse pas prédire directement la direction du regard, il peut être affiné pour détecter les visages, les yeux et les pupilles, qui sont essentiels pour une analyse plus approfondie. Une fois ces caractéristiques identifiées, des modèles supplémentaires peuvent traiter les données relatives aux mouvements oculaires afin d'estimer la direction du regard. 

Par exemple, pour améliorer la précision, YOLO11 peut être entraîné sur mesure sur des ensembles de données tels que WIDER FACE pour la détection des visages. De même, en ce qui concerne les capacités d'estimation de la pose de YOLO11, il peut aider à suivre l'orientation de la tête, ce qui améliore la précision de la détection du regard.

__wf_reserved_inherit
Fig. 3. YOLO11 peut être utilisé pour détecter les visages humains.

Applications de la détection du regard dans le monde réel

La détection du regard, rendue possible par la vision par ordinateur, a un large éventail d'applications dans tous les secteurs, qu'il s'agisse d'améliorer la sécurité dans le secteur automobile ou d'analyser la concentration dans les jeux. Voyons comment différents domaines tirent parti de cette technologie.

Suivi du regard dans les jeux

L'oculométrie est utilisée dans les jeux vidéo pour fournir des informations en temps réel sur la concentration, la prise de décision et les temps de réaction des joueurs. En suivant les mouvements oculaires, cette technologie aide les joueurs à affiner leurs stratégies, améliore les programmes d'entraînement et accroît l'engagement du public en affichant visuellement où les joueurs regardent pendant les moments clés.

Un exemple intéressant est celui de la simulation de course, un sport automobile virtuel compétitif dans lequel les joueurs courent en utilisant des simulations de conduite réalistes. L'oculométrie permet d'analyser la manière dont les conducteurs se concentrent sur la piste, réagissent aux adversaires et négocient les virages serrés. En suivant leur regard en temps réel, les formateurs peuvent identifier des schémas, repérer les distractions et améliorer les stratégies de course. 

__wf_reserved_inherit
Fig. 4. L'oculométrie peut être utilisée pour surveiller et analyser les coureurs de simulateurs. 

Au-delà de la simulation de course, l'oculométrie est également utilisée dans les jeux de compétition rapides pour analyser les réflexes des joueurs, leurs temps de réaction et la manière dont ils se concentrent sur les éléments clés du jeu. En comprenant où un joueur regarde avant de faire un mouvement, ces données permettent d'affiner la prise de décision, d'améliorer la précision et de renforcer l'entraînement pour le jeu de haut niveau.

Estimation du regard pour la recherche en psychologie

Il existe de nombreuses applications Vision AI de l'estimation du regard liées à la recherche. Un bon exemple est son utilisation en psychologie pour étudier l'attention, la charge cognitive et le comportement social. En analysant les mouvements oculaires, les chercheurs peuvent obtenir des informations sur la perception, la prise de décision et les troubles mentaux tels que l'autisme et le TDAH. 

Plus précisément, le suivi du regard à l'aide de la vision par ordinateur permet d'identifier des schémas dans les mouvements oculaires, la durée de fixation et l'attention visuelle, qui peuvent révéler des états cognitifs et émotionnels. Grâce aux progrès de l'apprentissage profond et de l'estimation du regard pilotée par l'IA, ces méthodes deviennent plus précises et plus accessibles, ce qui permet d'élargir les applications dans le domaine de la recherche neurologique.

Sécurité automobile

Au fil des ans, les chercheurs ont utilisé différentes méthodes pour étudier l'attention et la concentration des conducteurs dans différentes conditions de circulation. Parmi ces méthodes, l'oculométrie s'est avérée cruciale et peut fournir des indications sur l'endroit où le conducteur regarde pendant qu'il conduit. 

Avec l'aide de modèles de vision par ordinateur, la détection du regard peut encore améliorer cette analyse en suivant avec précision les mouvements des yeux en temps réel. Cette analyse peut nous permettre de mieux comprendre le comportement du conducteur, d'identifier les distractions, la fatigue ou les manques d'attention, ce qui peut améliorer la sécurité routière et contribuer au développement de systèmes avancés d'aide à la conduite.

__wf_reserved_inherit
Fig. 5. Exemple de surveillance d'un conducteur à l'aide de la détection des visages et du suivi du regard.

Par exemple, si un conducteur détourne fréquemment le regard de la route pour consulter son téléphone ou s'il est lent à réagir aux intersections, le système peut détecter ces comportements et émettre des alertes pour recentrer l'attention du conducteur, ce qui peut éviter des accidents.

Avantages et inconvénients de l'oculométrie et de la détection du regard

Voici quelques-uns des principaux avantages que les technologies d'oculométrie et de détection du regard peuvent apporter à notre vie quotidienne :

  • Une meilleure prise de conscience : L'oculométrie permet de comprendre comment les gens interagissent visuellement avec leur environnement, ce qui aide à mieux comprendre les modèles d'attention et de concentration.
  • Une meilleure prise de décision: Les données recueillies par l'oculométrie aident les chercheurs et les professionnels à prendre des décisions éclairées sur la base de modèles d'attention objectifs.
  • Amélioration de l'ergonomie visuelle: L'analyse du comportement du regard peut aider à concevoir des écrans, des espaces de travail et des environnements qui réduisent la fatigue visuelle et améliorent le confort.

Si ces avantages soulignent l'impact positif de la détection du regard sur nos vies, il est également important de prendre en compte les défis liés à sa mise en œuvre. Voici quelques-unes des principales limitations à garder à l'esprit :

  • Protection de la vie privée: Le suivi continu des yeux peut poser des problèmes de confidentialité et mettre les utilisateurs mal à l'aise. La transparence, le consentement de l'utilisateur et le traitement local des données peuvent contribuer à atténuer ces problèmes.
  • Demande de calcul élevée : Le suivi du regard en temps réel peut nécessiter un matériel puissant, ce qui limite l'accessibilité des appareils à faible puissance. Toutefois, des modèles optimisés permettent d'améliorer l'efficacité.
  • Limites de précision : Le suivi du regard peut être moins fiable dans le monde réel en raison des changements d'éclairage, des mouvements de la tête ou des obstacles tels que les lunettes et les cheveux. Les angles de la caméra peuvent également affecter les performances.

Garder les yeux sur l'avenir

L'oculométrie et la détection du regard, soutenues par des modèles de vision artificielle tels que YOLO11, modifient la façon dont nous interagissons avec le monde. Qu'il s'agisse de rendre les routes plus sûres ou de comprendre le comportement humain, cette technologie devient de plus en plus utile dans la vie de tous les jours.

Bien qu'il y ait des défis à relever, comme le respect de la vie privée et la nécessité de disposer d'ordinateurs puissants, les progrès de l'IA et de la vision par ordinateur rendent l'oculométrie plus précise et plus facile à utiliser. Au fur et à mesure qu'il s'améliore, il est probable qu'il jouera un rôle plus important dans toute une série d'industries.

Pour en savoir plus, visitez notre dépôt GitHub et participez à la vie de notre communauté. Explorez les innovations dans des secteurs tels que l 'IA dans les voitures auto-conduites et la vision par ordinateur dans l'agriculture sur nos pages de solutions. Consultez nos options de licence et donnez vie à vos projets de vision artificielle. 🚀

Construisons ensemble le futur
de l'IA !

Commencez votre voyage avec l'avenir de l'apprentissage automatique

Commencer gratuitement
Lien copié dans le presse-papiers