Connectez-vous à YOLO Vision 2025 !
25 septembre 2025
10:00 — 18:00, heure d'été britannique
Événement hybride
Yolo Vision 2024

Explorer comment la vision par ordinateur peut être utilisée pour la détection du regard

Abirami Vina

5 min de lecture

19 février 2025

Découvrez comment les techniques de vision IA telles que la détection d'objets et l'estimation de la pose peuvent être utilisées pour le suivi oculaire et la détection du regard dans diverses applications.

La vision par ordinateur est une branche de l'intelligence artificielle (IA) qui se concentre sur la capacité des machines à analyser et à interpréter les données visuelles d'une manière similaire à celle des humains. Une application particulièrement fascinante de la vision IA est la détection du regard, qui permet aux machines de suivre et de comprendre où une personne regarde.

En tant qu'humains, nous pouvons naturellement suivre le regard de quelqu'un et comprendre ce sur quoi il se concentre. Par exemple, si vous parlez à un ami et qu'il regarde soudainement vers la porte, vous pourriez instinctivement vous tourner pour voir ce qui a attiré son attention. Les machines, en revanche, n'ont pas cette capacité intégrée - elles doivent être entraînées à l'aide de techniques de vision par ordinateur pour reconnaître les mouvements oculaires et interpréter la direction du regard. 

Avec un marché mondial de la détection du regard qui devrait atteindre 11,9 milliards de dollars d'ici 2032, de nombreux secteurs l'adoptent pour différentes applications. Par exemple, la détection du regard dans les voitures est utilisée pour améliorer la sécurité du conducteur en surveillant les niveaux d'attention et en détectant les signes de somnolence ou de distraction.

Dans cet article, nous allons explorer comment la vision par ordinateur est utilisée pour le suivi oculaire et la détection du regard. Nous examinerons également certaines de ses principales applications dans divers secteurs. Commençons !

Qu'est-ce que le suivi oculaire et la détection du regard ?

Le suivi oculaire et la détection du regard sont des techniques utilisées pour déterminer le centre d'attention d'une personne en analysant les mouvements oculaires et la direction du regard. Grâce aux progrès de l'IA et de la technologie des capteurs, il est désormais possible de suivre les yeux d'une personne en temps réel. 

Traditionnellement, la plupart des systèmes de suivi oculaire reposent sur des caméras infrarouges (IR) qui détectent les mouvements de la pupille en éclairant les yeux avec une lumière proche infrarouge et en capturant les réflexions cornéennes. Ces systèmes offrent une haute précision. Cependant, ils nécessitent souvent un casque spécialisé, qui peut être inconfortable à porter et sujet à des problèmes d'étalonnage.

Avec l'essor de l'IA, les chercheurs explorent activement les méthodes de suivi oculaire basées sur la vision par ordinateur. Contrairement aux systèmes traditionnels basés sur l'IR, ces approches s'appuient sur des modèles de vision par ordinateur comme Ultralytics YOLO11 pour détecter les caractéristiques faciales telles que les yeux et les pupilles, ainsi que pour effectuer l'estimation de la pose de la tête. Au-delà de cela, des modèles spécialisés d'apprentissage profond comme GazeNet de NVIDIA sont conçus spécifiquement pour l'estimation du regard. 

__wf_reserved_inherit
Fig. 1. Exemple d'utilisation de YOLO11 pour détecter l'œil et la pupille d'une personne.

Bien qu'il s'agisse encore d'un domaine en évolution, le suivi du regard basé sur la vision par ordinateur a le potentiel de rendre le suivi oculaire plus accessible, en réduisant les coûts et en améliorant la convivialité pour les applications dans le marketing, la psychologie et les neurosciences.

L'évolution de la détection du regard et du suivi oculaire

Ensuite, explorons le passage des systèmes traditionnels basés sur l'infrarouge à des solutions plus accessibles, pilotées par logiciel.

Vous vous demandez peut-être si le suivi oculaire et la détection du regard peuvent être réalisés sans IA. Alors, pourquoi y a-t-il des recherches en cours sur l'intégration de l'IA et de la vision par ordinateur dans ces technologies ? Bien que les méthodes traditionnelles de suivi oculaire existent, elles reposent souvent sur des caméras infrarouges spécialisées et des dispositifs de suivi oculaire montés sur la tête, qui peuvent être coûteux, encombrants et nécessitent des conditions d'éclairage contrôlées. Les solutions basées sur l'IA, cependant, permettent le suivi oculaire à l'aide de webcams standard et de caméras de smartphone, ce qui réduit les coûts et améliore l'accessibilité. 

__wf_reserved_inherit
Fig. 2. Un dispositif de suivi oculaire monté sur la tête.

Voici quelques-uns des autres facteurs à l'origine de l'évolution de la technologie de suivi oculaire et de détection du regard :

  • Applications : Les approches pilotées par logiciel permettent à cet espace de s'étendre au-delà de la recherche, aux appareils grand public et à des domaines comme le jeu.
  • Évolutivité : L'IA peut intervenir pour rendre les solutions de détection du regard accessibles à un public plus large, des utilisateurs individuels aux industries à grande échelle.
  • Progrès de la technologie des caméras : Aujourd'hui, nous avons accès à des caméras de smartphone et de webcam à plus haute résolution qui améliorent la précision du suivi oculaire, ce qui n'était pas possible il y a 20 ans.

Utilisation d'Ultralytics YOLO11 pour la détection du regard et le suivi oculaire

Maintenant que nous avons discuté du rôle de la vision par ordinateur dans le suivi oculaire et la détection du regard, voyons comment YOLO11 peut être utilisé ici.

Ultralytics YOLO11 prend en charge des tâches telles que la détection d'objets et l'estimation de la pose. Pré-entraîné sur le jeu de données COCO, il atteint une grande précision dans la détection de divers objets. Plus précisément, pour une solution de détection du regard, YOLO11 peut jouer un rôle de soutien. 

Bien qu'il ne puisse pas prédire directement la direction du regard, il peut être affiné pour détecter les visages, les yeux et les pupilles, qui sont essentiels pour une analyse plus approfondie. Une fois ces caractéristiques identifiées, des modèles supplémentaires peuvent traiter les données de mouvement des yeux pour estimer la direction du regard. 

Par exemple, pour améliorer la précision, YOLO11 peut être entraîné sur mesure sur des ensembles de données comme WIDER FACE pour la détection des visages. De plus, en ce qui concerne les capacités d'estimation de la pose de YOLO11, il peut aider à suivre l'orientation de la tête, ce qui améliore la précision de la détection du regard.

__wf_reserved_inherit
Fig. 3. YOLO11 peut être utilisé pour détecter les visages humains.

Applications concrètes de la détection du regard

La détection du regard, rendue possible par la vision par ordinateur, a un large éventail d'applications dans divers secteurs, de l'amélioration de la sécurité dans le secteur automobile à l'analyse de la concentration dans le jeu. Explorons comment différents domaines tirent parti de cette technologie.

Suivi du regard dans le jeu

Le suivi oculaire est utilisé dans le jeu pour fournir des informations en temps réel sur la concentration, la prise de décision et les temps de réaction des joueurs. En suivant les mouvements des yeux, cette technologie aide les joueurs à affiner leurs stratégies, améliore les programmes d'entraînement et améliore l'engagement du public en affichant visuellement où les joueurs regardent pendant les moments clés.

Un exemple intéressant est celui de la course automobile virtuelle, un sport automobile virtuel compétitif où les joueurs courent en utilisant des simulations de conduite réalistes. Le suivi oculaire aide à analyser la façon dont les pilotes se concentrent sur la piste, réagissent aux adversaires et négocient les virages serrés. En suivant leur regard en temps réel, les entraîneurs peuvent identifier des schémas, repérer les distractions et améliorer les stratégies de course. 

__wf_reserved_inherit
Fig. 4. Le suivi oculaire peut être utilisé pour surveiller et analyser les coureurs automobiles virtuels. 

Au-delà de la course automobile virtuelle, le suivi oculaire est également utilisé dans les jeux compétitifs rapides pour analyser les réflexes, les temps de réaction des joueurs et la façon dont ils se concentrent sur les éléments clés du jeu. En comprenant où un joueur regarde avant de faire un mouvement, ces données aident à affiner la prise de décision, à améliorer la précision et à améliorer l'entraînement pour un gameplay de haut niveau.

Estimation du regard pour la recherche psychologique

Il existe de nombreuses applications de l'IA de vision pour l'estimation du regard liées à la recherche. Un bon exemple est son utilisation en psychologie pour étudier l'attention, la charge cognitive et le comportement social. En analysant les mouvements oculaires, les chercheurs peuvent obtenir des informations sur la perception, la prise de décision et les troubles de la santé mentale comme l'autisme et le TDAH. 

Plus précisément, le suivi du regard à l'aide de la vision par ordinateur permet d'identifier les schémas de mouvement des yeux, la durée de fixation et l'attention visuelle, ce qui peut révéler des états cognitifs et émotionnels. Grâce aux progrès de l'apprentissage profond et de l'estimation du regard basée sur l'IA, ces méthodes deviennent plus précises et accessibles, ce qui permet des applications plus larges dans la recherche neurologique.

Sécurité automobile

Au fil des ans, les chercheurs ont utilisé différentes méthodes pour étudier l'attention et la concentration des conducteurs dans différentes conditions de circulation. Parmi ces méthodes, le suivi oculaire a été essentiel et peut fournir des informations sur l'endroit où le conducteur regarde pendant la conduite. 

Grâce aux modèles de vision par ordinateur, la détection du regard peut améliorer encore cette analyse en suivant avec précision les mouvements oculaires en temps réel. Cette analyse peut nous donner une meilleure compréhension du comportement du conducteur, en aidant à identifier les distractions, la fatigue ou les baisses d'attention, ce qui peut améliorer la sécurité routière et aider au développement de systèmes avancés d'aide à la conduite.

__wf_reserved_inherit
Fig 5. Un exemple de surveillance d'un conducteur utilisant la détection de visage et le suivi du regard.

Par exemple, si un conducteur détourne fréquemment le regard de la route pour consulter son téléphone ou tarde à réagir aux intersections, le système peut détecter ces comportements et émettre des alertes pour recentrer son attention, ce qui pourrait éviter des accidents.

Avantages et inconvénients du suivi oculaire et de la détection du regard

Voici quelques-uns des principaux avantages que les technologies de suivi oculaire et de détection du regard peuvent apporter à notre vie quotidienne :

  • Sensibilisation accrue : Le suivi oculaire fournit des informations sur la façon dont les gens interagissent visuellement avec leur environnement, ce qui permet de mieux comprendre les schémas d'attention et de concentration.
  • Meilleure prise de décision : Les données collectées par le suivi oculaire aident les chercheurs et les professionnels à prendre des décisions éclairées basées sur des schémas d'attention objectifs.
  • Ergonomie visuelle améliorée : L'analyse du comportement du regard peut aider à concevoir des écrans, des espaces de travail et des environnements qui réduisent la fatigue oculaire et améliorent le confort.

Bien que ces avantages soulignent l'impact positif de la détection du regard sur nos vies, il est également important de tenir compte des défis liés à sa mise en œuvre. Voici quelques-unes des principales limitations à garder à l'esprit :

  • Préoccupations relatives à la vie privée: Le suivi oculaire continu peut soulever des problèmes de confidentialité, mettant les utilisateurs mal à l'aise. Assurer la transparence, le consentement de l'utilisateur et le traitement local des données peut aider à atténuer ces préoccupations.
  • Forte demande de calcul : Le suivi du regard en temps réel peut nécessiter un matériel puissant, ce qui limite l'accessibilité sur les appareils à faible consommation d'énergie. Cependant, les modèles optimisés contribuent à améliorer l'efficacité.
  • Limitations de la précision : Le suivi du regard peut être moins fiable dans des contextes réels en raison des changements d'éclairage, des mouvements de la tête ou des obstacles tels que les lunettes et les cheveux. Les angles de la caméra peuvent également affecter les performances.

Garder les yeux rivés sur l'avenir

Le suivi oculaire et la détection du regard, pris en charge par des modèles de vision par ordinateur comme YOLO11, modifient notre façon d'interagir avec le monde. Qu'il s'agisse de rendre les routes plus sûres ou de comprendre le comportement humain, cette technologie devient de plus en plus utile dans la vie de tous les jours.

Bien qu'il existe des défis tels que les préoccupations relatives à la vie privée et la nécessité d'ordinateurs puissants, les progrès de l'IA et de la vision par ordinateur rendent le suivi oculaire plus précis et plus facile à utiliser. Au fur et à mesure qu'il continue de s'améliorer, il jouera probablement un rôle plus important dans un éventail d'industries.

Pour en savoir plus, visitez notre dépôt GitHub et échangez avec notre communauté. Découvrez les innovations dans des secteurs tels que l'IA dans les voitures autonomes et la vision par ordinateur dans l'agriculture sur nos pages de solutions. Consultez nos options de licence et donnez vie à vos projets d'IA de vision. 🚀

Construisons ensemble l'avenir
de l'IA !

Commencez votre parcours avec l'avenir de l'apprentissage automatique

Démarrer gratuitement
Lien copié dans le presse-papiers