Yolo Vision Shenzhen
Shenzhen
Rejoindre maintenant
Glossaire

Points clés

Découvrez les points clés de la vision par ordinateur : l'estimation de la pose avec Ultralytics YOLO11 pour le fitness, la reconnaissance des gestes et le suivi rapide et précis.

Les points clés sont des emplacements spatiaux précis et informatifs dans une image qui définissent des caractéristiques distinctes d'un objet ou d'une scène. scène. Dans le domaine de la vision par ordinateur, ces coordonnées - typiquement représentées par des valeurs X et Y - marquent des points d'intérêt significatifs, tels que les coins d'un bâtiment, le centre d'un œil ou les articulations d'un corps humain. d'un bâtiment, le centre d'un œil ou les articulations d'un corps humain. Contrairement au traitement de chaque pixel d'une image, le fait de se concentrer sur sur ces points épars et sémantiquement riches. modèles d'intelligence artificielle (IA) de de comprendre efficacement la géométrie, d'analyser les formes et de track mouvements avec une grande précision. Ce concept est fondamental Ce concept est fondamental pour les tâches avancées nécessitant une compréhension structurelle du sujet, plutôt que sa simple présence ou son emplacement.

Le rôle des points clés dans l'IA de la vision

Les points clés sont les éléments fondamentaux permettant de cartographier la structure des objets dynamiques. Lorsque plusieurs points-clés sont détectés et connectés, ils forment un graphique squelettique ou une image filaire qui représente la pose de l'objet. Cette est le plus souvent appliqué à l'estimation de la pose, où algorithmes prédisent l'emplacement des articulations anatomiques - épaules, coudes, hanches et genoux - afin de reconstruire la posture humaine.

En tirant parti d'architectures d'apprentissage profond telles que YOLO11les systèmes peuvent régresser ces coordonnées directement à partir des images d'entrée. Ce processus implique d 'extraction de caractéristiques complexes où le réseau apprend à d'identifier des motifs locaux invariants à l'éclairage, à la rotation et à l'échelle. Les données obtenues sont légères et de calcul, ce qui les rend idéales pour l'inférence en pour l'inférence en temps réel sur les appareils périphériques.

Distinguer les points clés des concepts connexes

Pour comprendre l'utilité spécifique des points-clés, il est utile de les comparer à d'autres tâches primaires de vision par ordinateur. de vision par ordinateur :

  • Points clés et détection d'objets: La détection standard identifie la nature et l'emplacement d' un objet en l'entourant d'une boîte de délimitation. boîte englobante. Cependant, la boîte traite l'objet comme un rectangle rigide. un rectangle rigide. Les points clés regardent à l'intérieur de la boîte pour identifier l'articulation interne et la posture.
  • Points clés vs. Segmentation par instance: La segmentation crée un masque parfait en pixels de la silhouette de l'objet. Bien que la segmentation fournisse les détails détails des limites, elle est souvent plus lourde en termes de calcul. Les points clés fournissent un résumé structurel simplifié, souvent préféré lors de l'analyse de la cinématique. souvent préférés lors de l'analyse de la cinématique ou de la dynamique du mouvement.
  • Points clés et annotation des données: L'annotation est le processus humain d'étiquetage des données, tandis que la détection des points clés est la prédiction du modèle. La création d'un consiste à cliquer manuellement sur des points spécifiques (par exemple, "poignet gauche") pour entraîner le modèle.

Applications concrètes

La possibilité de track points spécifiques sur un sujet ouvre la porte à diverses applications dans différents secteurs :

  • Analyse du sport: Les entraîneurs et les athlètes utilisent la détection des points clés pour analyser la biomécanique. En suivant les angles entre les articulations pendant un de golf ou d'un sprint, les systèmes peuvent fournir un retour d'information automatisé afin d'optimiser les performances et de prévenir les blessures. Il s'agit souvent de calculer le nombre de points de contact entre les articulations et le corps. Il s'agit souvent de calculer les degrés de liberté pour comprendre l'amplitude du mouvement.
  • L'IA dans la robotique: Les robots s'appuient sur des points clés pour la saisie et la manipulation d'objets. L'identification de points de préhension spécifiques sur un objet permet à un bras robotique de calculer la cinématique inverse et de positionner son effecteur correctement.
  • L'IA dans les soins de santé: Les applications de physiothérapie Les applications de thérapie physique surveillent les exercices des patients à distance. En suivant les repères corporels, le système s'assure que les exercices sont effectués avec la bonne forme, ce qui contribue à une rééducation efficace.
  • Réalité augmentée (RA): Dans les filtres dans les filtres des médias sociaux et les applications d'essayage virtuel, des points clés du visage (repères faciaux) permettent aux masques ou lunettes numériques de s'aligner parfaitement sur les mouvements de l'utilisateur. s'aligner parfaitement sur les mouvements de l'utilisateur.

Mise en œuvre de la détection des points clés

Les bibliothèques modernes facilitent la mise en œuvre de la détection des points clés à l'aide de modèles pré-entraînés. Les ultralytics offre un accès instantané à YOLO11 modèles formés sur des ensembles de données massifs tels que COCO pour identifier les articulations humaines.

L'exemple suivant montre comment charger un modèle d'estimation de la pose et visualiser les points clés détectés :

from ultralytics import YOLO

# Load a pretrained YOLO11n-pose model
model = YOLO("yolo11n-pose.pt")

# Run inference on a local image or URL
results = model("https://docs.ultralytics.com/tasks/detect/")

# Visualize the results, showing the skeletal keypoints
results[0].show()

Dans ce processus, le modèle produit un Keypoints contenant les coordonnées et un objet score de confiance pour chaque point détecté. Les développeurs peuvent extraire ces données brutes x, y pour construire une logique personnalisée, telle que le comptage des répétitions dans une application de gymnastique ou le contrôle d'un personnage de jeu par l'intermédiaire d'un système d'information. le contrôle d'un personnage de jeu par l'interaction homme-machine.

Rejoindre la communauté Ultralytics

Rejoignez le futur de l'IA. Connectez-vous, collaborez et évoluez avec des innovateurs mondiaux.

Rejoindre maintenant