Connectez-vous à YOLO Vision 2025 !
25 septembre 2025
10:00 — 18:00, heure d'été britannique
Événement hybride
Yolo Vision 2024
Glossaire

Points clés

Découvrez les points clés de la vision par ordinateur : l'estimation de la pose avec Ultralytics YOLO11 pour le fitness, la reconnaissance des gestes et le suivi rapide et précis.

Dans le domaine de la vision par ordinateur, les points clés sont des points d'intérêt spécifiques dans une image qui sont distinctifs et reproductibles. Ces points servent de repères structurels compacts qui représentent un objet ou une scène, permettant aux machines de comprendre et d'analyser le contenu visuel avec plus de détails. Au lieu de traiter chaque pixel, les algorithmes se concentrent sur ces points clés, tels que les coins, les bords ou les articulations d'un corps humain, pour effectuer des tâches complexes telles que le suivi des mouvements, la reconnaissance d'objets et la reconstruction de scènes en 3D. En se concentrant sur ces points d'information, les modèles de vision par ordinateur peuvent atteindre une efficacité et une précision élevées.

Détection des points clés et estimation de la pose

La principale application des points-clés est l'estimation de la pose, une tâche de vision par ordinateur axée sur l'identification de la position et de l'orientation d'un objet ou d'une personne. Dans l'estimation de la pose humaine, les points clés correspondent aux principales articulations du corps comme les épaules, les coudes, les genoux et les poignets. En détectant ces points dans une image ou une vidéo, un modèle peut construire une représentation squelettique du corps humain. Ce "squelette numérique" permet à un système d'intelligence artificielle d'analyser la posture, les gestes et les mouvements sans avoir besoin de comprendre l'apparence de la personne, ses vêtements ou son environnement.

Les modèles avancés d'apprentissage profond, tels que Ultralytics YOLO11, sont entraînés sur de grands ensembles de données annotées comme COCO pour prédire avec précision l'emplacement de ces points clés en temps réel. Les premiers systèmes comme OpenPose ont ouvert la voie en démontrant leur capacité à détecter les points clés du corps entier, des mains et du visage pour plusieurs personnes simultanément. Les architectures modernes se sont appuyées sur ces fondations pour fournir des résultats plus rapides et plus précis pour un large éventail d'applications.

Points clés et autres concepts de vision par ordinateur

Il est important de différencier la détection des points clés des autres tâches liées à la vision par ordinateur :

  • Boîtes de délimitation: La détection d'objets utilise généralement une boîte de délimitation (unsimple rectangle) pour indiquer l'emplacement d'un objet. La détection de points clés offre une compréhension plus détaillée en identifiant des points structurels spécifiques à l'intérieur de cette boîte, décrivant la pose et la forme de l'objet.
  • Segmentation par instance: Alors que les points clés créent un contour squelettique, la segmentation d'instance va plus loin en définissant la forme exacte d'un objet au niveau du pixel. La segmentation fournit une frontière complète, tandis que les points clés offrent un résumé structurel.
  • Descripteurs de caractéristiques: Après la détection d'un point clé, un descripteur de caractéristiques peut être calculé pour décrire la zone d'image qui l'entoure. Des algorithmes tels que SIFT et ORB génèrent ces descripteurs, qui agissent comme une "empreinte digitale" numérique utilisée pour faire correspondre des points clés entre différentes images.

Applications concrètes

La capacité à détecter et à suivre les points clés a permis des avancées significatives dans divers secteurs. En voici deux exemples marquants :

  1. Analyse intelligente de la condition physique et du sport: Dans les applications de fitness, les modèles d'estimation de la posture suivent les principales articulations du corps pour contrôler la forme de l'utilisateur pendant des exercices tels que les squats ou le yoga. Le système peut compter les répétitions, fournir un retour d'information en temps réel sur la posture pour prévenir les blessures et analyser les performances athlétiques avec une grande précision. Cette technologie permet de créer des expériences d'entraînement personnalisées et interactives accessibles à partir d'une caméra standard.
  2. Reconnaissance des gestes de la main: En identifiant les points clés de la main et des doigts, les systèmes d'IA peuvent interpréter les mouvements complexes de la main. Cela est essentiel pour développer des commandes intuitives dans la réalité augmentée et virtuelle, créer des outils de traduction en langue des signes et permettre une interaction sans contact avec les appareils intelligents. Les modèles formés sur des ensembles de données de points clés de la main peuvent reconnaître des gestes allant d'un simple pincement à des signes complexes.

Parmi les autres applications, citons la détection des repères faciaux pour l'analyse des émotions et les filtres AR, l'estimation de la pose des animaux pour les études comportementales dans le domaine de la conservation de la faune, et la robotique pour aider les machines à naviguer et à interagir avec leur environnement.

Rejoignez la communauté Ultralytics

Rejoignez le futur de l'IA. Connectez-vous, collaborez et évoluez avec des innovateurs mondiaux.

Rejoindre maintenant
Lien copié dans le presse-papiers