Yolo Vision Shenzhen
Shenzhen
Rejoindre maintenant
Glossaire

Points clés

Découvrez les points clés de la vision par ordinateur : l'estimation de la pose avec Ultralytics YOLO11 pour le fitness, la reconnaissance des gestes et le suivi rapide et précis.

Les points clés sont des emplacements spatiaux spécifiques et informatifs dans une image qui définissent les caractéristiques distinctives d'un objet ou d'une scène. Dans le domaine de la vision par ordinateur (CV), ces points, généralement représentés par des coordonnées X et Y, marquent des zones d'intérêt significatives, telles que les angles d'un bâtiment, les traits du visage comme les yeux et le nez, ou les articulations anatomiques du corps humain. Contrairement au traitement de chaque pixel dans une grille dense, le fait de se concentrer sur ces points clairsemés et riches en sémantique permet aux modèles d'intelligence artificielle (IA) de comprendre efficacement la géométrie, d'analyser les formes et track avec une grande précision. Ce concept est fondamental pour les tâches avancées qui nécessitent une compréhension structurelle du sujet plutôt que simplement sa présence ou son emplacement.

Le rôle des points clés dans l'IA de la vision

Les points clés servent de base pour cartographier la structure des objets dynamiques. Lorsque plusieurs points clés sont détectés et connectés, ils forment un graphe squelettique ou une structure filaire qui représente la pose de l'objet. Cette technique est le plus souvent appliquée à l'estimation de la pose, où des algorithmes d'apprentissage profond (DL) prédisent l'emplacement des articulations (épaules, coudes, hanches et genoux) afin de reconstruire la posture humaine ou animale.

En tirant parti d'architectures avancées telles que le modèle Ultralytics , les systèmes peuvent régresser ces coordonnées directement à partir des images d'entrée avec une vitesse remarquable. Ce processus implique une extraction de caractéristiques complexe, où le réseau neuronal apprend à identifier des modèles locaux invariants à l'éclairage, à la rotation et à l'échelle. Comme les points clés représentent un résumé condensé de l'état d'un objet, ils sont efficaces sur le plan informatique, ce qui les rend idéaux pour l' inférence en temps réel sur les dispositifs informatiques de pointe.

Distinguer les points clés des concepts connexes

Pour comprendre l'utilité spécifique des points clés, il est utile de les comparer à d'autres tâches primaires de vision par ordinateur présentes dans la Ultralytics :

  • Points clés vs détection d'objets: La détection standard identifie ce qu'est un objet et il se trouve en l'entourant d'un cadre. Cependant, ce cadre traite l'objet comme un rectangle rigide. Les points clés examinent l'intérieur du cadre pour identifier l'articulation interne, la posture et la structure flexible.
  • Points clés vs. Segmentation par instance: La segmentation crée un masque parfait en pixels de la silhouette de l'objet. Bien que la segmentation fournisse les détails détails des limites, elle est souvent plus lourde en termes de calcul. Les points clés fournissent un résumé structurel simplifié, souvent préféré lors de l'analyse de la cinématique. souvent préférés lors de l'analyse de la cinématique ou de la dynamique du mouvement.
  • Points clés vs annotation des données: L'annotation est le processus humain qui consiste à étiqueter les données, tandis que la détection des points clés est la prédiction du modèle. La création d'un ensemble de données d'apprentissage implique de cliquer manuellement sur des points spécifiques (par exemple, « poignet gauche ») pour enseigner au modèle via l' apprentissage supervisé.

Applications concrètes

La possibilité de track points spécifiques sur un sujet ouvre la porte à diverses applications dans différents secteurs :

  • L'IA dans les soins de santé et la rééducation : Les applications de physiothérapie surveillent à distance les exercices des patients. En suivant les repères corporels, le système garantit que les exercices sont effectués correctement, ce qui contribue à une rééducation efficace. Cela implique souvent de calculer les degrés de liberté afin de comprendre l' amplitude des mouvements du patient.
  • Analyse sportive: Les entraîneurs et les athlètes utilisent la détection des points clés pour analyser la biomécanique. En suivant les angles entre les articulations pendant un swing de golf ou un sprint, les systèmes peuvent fournir un retour d'information automatisé afin d'optimiser les performances et de prévenir les blessures.
  • Systèmes de surveillance des conducteurs : dans l'industrie automobile, les systèmes de reconnaissance faciale track les repères faciaux (yeux, bouche) pour detect de fatigue ou de distraction, alertant les conducteurs afin de prévenir les accidents.
  • Réalité augmentée (RA): dans les filtres des réseaux sociaux et les applications d'essayage virtuel, des points clés sur le visage permettent aux masques ou lunettes numériques de s'aligner parfaitement sur les mouvements de l'utilisateur, ce qui nécessite une interaction homme-machine précise .

Mise en œuvre de la détection des points clés

Les bibliothèques modernes facilitent la mise en œuvre de la détection des points clés à l'aide de modèles pré-entraînés. Les ultralytics Le package fournit un accès instantané à des modèles de pointe tels que YOLO26 et YOLO11, qui peut être entraîné sur des ensembles de données tels que COCO ou Posture du tigre.

L'exemple suivant montre comment charger un modèle d'estimation de pose et visualiser les points clés détectés à l'aide de Python:

from ultralytics import YOLO

# Load a pretrained YOLO26n-pose model
model = YOLO("yolo26n-pose.pt")

# Run inference on a local image
results = model("path/to/runner.jpg")

# Visualize the results, showing the skeletal keypoints
results[0].show()

Dans ce flux de travail, le modèle génère un objet résultat contenant les coordonnées et un score de confiance pour chaque point détecté. Les développeurs peuvent extraire ces données brutes x, y pour construire une logique personnalisée, telle que le comptage des répétitions dans une application de gymnastique ou le contrôle d'un personnage de jeu par l'intermédiaire d'un système d'information. le contrôle d'un personnage de jeu par capture de mouvement.

Rejoindre la communauté Ultralytics

Rejoignez le futur de l'IA. Connectez-vous, collaborez et évoluez avec des innovateurs mondiaux.

Rejoindre maintenant