Connectez-vous à YOLO Vision 2025 !
25 septembre 2025
10:00 — 18:00, heure d'été britannique
Événement hybride
Yolo Vision 2024
Glossaire

Reconnaissance des actions

Explore Action Recognition (Reconnaissance de l'activité humaine) : comment la vidéo, l'estimation de la pose et l'apprentissage profond détectent les actions humaines pour les soins de santé, la sécurité et les sports.

La reconnaissance d'actions, également connue sous le nom de reconnaissance d'activités humaines (HAR), est un domaine de la vision par ordinateur qui se concentre sur l'identification et la compréhension d'actions humaines à partir d'une série d'observations, généralement des séquences vidéo. Contrairement aux tâches d'identification d'objets dans des images statiques, la reconnaissance d'actions analyse les mouvements et les changements posturaux au fil du temps pour déterminer ce que fait une personne, par exemple marcher, courir ou faire un signe de la main. Cette capacité permet aux systèmes d'intelligence artificielle (IA) d'interpréter le comportement humain dynamique, ce qui est essentiel pour créer des applications plus interactives et contextuelles. Le marché mondial de cette technologie se développe rapidement, reflétant son importance croissante dans diverses industries.

Comment fonctionne la reconnaissance des actions

Les systèmes de reconnaissance d'action traitent des données visuelles, principalement issues de vidéos, pour classer les mouvements humains. Le processus implique souvent une combinaison de plusieurs techniques de vision par ordinateur et de modèles d'apprentissage profond (DL).

  • Entrée des données: Le système commence généralement par un flux vidéo ou une séquence d'images. Ces données peuvent être capturées à l'aide de caméras standard ou de capteurs spécialisés.
  • Extraction des caractéristiques: Des informations clés sont extraites des images vidéo. Cela commence souvent par des tâches fondamentales telles que la détection d'objets pour localiser les personnes dans la scène. Ensuite, le suivi d'objets est utilisé pour suivre les personnes sur plusieurs images, créant ainsi une compréhension temporelle de leurs mouvements.
  • Analyse du mouvement: Pour comprendre l'action spécifique, les modèles s'appuient souvent sur l'estimation de la pose, qui identifie et suit les principales articulations du corps. En analysant le mouvement de ces points clés au fil du temps, le système peut différencier des actions similaires, telles que la marche ou la course.
  • Classification: Des architectures de réseaux neuronaux avancées, telles que les réseaux neuronaux convolutifs 3D ou une combinaison de réseaux neuronaux convolutifs (CNN) et de réseaux neuronaux récurrents (RNN), sont utilisées pour classer la séquence de mouvements dans des catégories d'actions prédéfinies. La qualité des données d'entraînement, qui proviennent souvent d'ensembles de données de référence à grande échelle tels que Kinetics ou UCF101, est essentielle pour la précision du modèle.

Reconnaissance des actions et concepts connexes

Il est important de différencier la reconnaissance d'actions des autres tâches liées au CV afin de comprendre son rôle unique.

  • Reconnaissance d'actions et reconnaissance d'images: La reconnaissance d'images concerne l'identification et la classification d'objets ou de scènes dans une seule image statique. La reconnaissance d'actions, quant à elle, va plus loin en analysant une séquence d'images afin de comprendre les événements dynamiques et les mouvements dans le temps.
  • Reconnaissance d'actions et compréhension de vidéos: La compréhension vidéo est un domaine plus large qui englobe la reconnaissance d'actions. Alors que la reconnaissance d'actions se concentre spécifiquement sur l'identification des actions, la compréhension vidéo vise une compréhension plus globale du contenu de la vidéo, y compris les changements de scène, les interactions entre les objets et la narration générale. Par exemple, reconnaître qu'une personne ouvre une porte relève de la reconnaissance d'action ; comprendre qu'elle entre dans une pièce pour saluer quelqu'un relève de la compréhension vidéo.
  • Reconnaissance des actions et estimation de la pose: L'estimation de la pose est un composant souvent utilisé dans les systèmes de reconnaissance d'action pour déterminer la posture d'une personne en localisant ses articulations. L'estimation de la pose fournit les données brutes sur le positionnement du corps, tandis que la reconnaissance d'action interprète la séquence de ces poses pour classer l'action exécutée.

Applications concrètes

La reconnaissance des actions est une technologie clé pour de nombreux systèmes d'intelligence artificielle modernes, qui leur permet d'interagir avec le monde physique et de le comprendre de manière plus sophistiquée.

  • Soins de santé et soins aux personnes âgées: Dans le domaine de l 'IA pour les soins de santé, les systèmes de reconnaissance des actions peuvent surveiller les patients pour assurer leur sécurité et leur bien-être. Par exemple, ces systèmes peuvent être déployés dans les hôpitaux ou à domicile pour détecter automatiquement la chute d'une personne âgée et envoyer une alerte pour une assistance immédiate. Ils sont également utilisés dans le cadre de la rééducation physique pour vérifier que les patients effectuent correctement leurs exercices.
  • Surveillance et sécurité intelligentes: Au-delà de la simple détection de mouvements, la reconnaissance d'actions améliore la surveillance de la sécurité en identifiant des comportements spécifiques. Un système peut être formé pour détecter des activités suspectes, telles que la flânerie dans une zone interdite ou des actes de vandalisme, et en informer le personnel de sécurité en temps réel. Cela permet une approche plus proactive de la sécurité.
  • L'analyse sportive: Dans le domaine de l'analyse sportive, les entraîneurs et les analystes utilisent la reconnaissance des actions pour analyser automatiquement les mouvements des joueurs, suivre les mesures de performance et identifier les schémas tactiques au cours d'un match.
  • Interaction homme-machine: La reconnaissance des gestes est fondamentale pour développer des systèmes de contrôle basés sur les gestes pour tout ce qui va des consoles de jeu aux appareils domestiques intelligents, permettant aux utilisateurs d'interagir avec la technologie de manière plus naturelle sans contrôleurs physiques.

Rejoignez la communauté Ultralytics

Rejoignez le futur de l'IA. Connectez-vous, collaborez et évoluez avec des innovateurs mondiaux.

Rejoindre maintenant
Lien copié dans le presse-papiers