Découvrez les points clés de la vision par ordinateur : l'estimation de la pose avec Ultralytics YOLO11 pour le fitness, la reconnaissance des gestes et le suivi rapide et précis.
Les points clés sont des emplacements spatiaux précis et informatifs dans une image qui définissent des caractéristiques distinctes d'un objet ou d'une scène. scène. Dans le domaine de la vision par ordinateur, ces coordonnées - typiquement représentées par des valeurs X et Y - marquent des points d'intérêt significatifs, tels que les coins d'un bâtiment, le centre d'un œil ou les articulations d'un corps humain. d'un bâtiment, le centre d'un œil ou les articulations d'un corps humain. Contrairement au traitement de chaque pixel d'une image, le fait de se concentrer sur sur ces points épars et sémantiquement riches. modèles d'intelligence artificielle (IA) de de comprendre efficacement la géométrie, d'analyser les formes et de track mouvements avec une grande précision. Ce concept est fondamental Ce concept est fondamental pour les tâches avancées nécessitant une compréhension structurelle du sujet, plutôt que sa simple présence ou son emplacement.
Les points clés sont les éléments fondamentaux permettant de cartographier la structure des objets dynamiques. Lorsque plusieurs points-clés sont détectés et connectés, ils forment un graphique squelettique ou une image filaire qui représente la pose de l'objet. Cette est le plus souvent appliqué à l'estimation de la pose, où algorithmes prédisent l'emplacement des articulations anatomiques - épaules, coudes, hanches et genoux - afin de reconstruire la posture humaine.
En tirant parti d'architectures d'apprentissage profond telles que YOLO11les systèmes peuvent régresser ces coordonnées directement à partir des images d'entrée. Ce processus implique d 'extraction de caractéristiques complexes où le réseau apprend à d'identifier des motifs locaux invariants à l'éclairage, à la rotation et à l'échelle. Les données obtenues sont légères et de calcul, ce qui les rend idéales pour l'inférence en pour l'inférence en temps réel sur les appareils périphériques.
Pour comprendre l'utilité spécifique des points-clés, il est utile de les comparer à d'autres tâches primaires de vision par ordinateur. de vision par ordinateur :
La possibilité de track points spécifiques sur un sujet ouvre la porte à diverses applications dans différents secteurs :
Les bibliothèques modernes facilitent la mise en œuvre de la détection des points clés à l'aide de modèles pré-entraînés. Les
ultralytics offre un accès instantané à
YOLO11 modèles formés sur des ensembles de données massifs tels que
COCO pour identifier les articulations humaines.
L'exemple suivant montre comment charger un modèle d'estimation de la pose et visualiser les points clés détectés :
from ultralytics import YOLO
# Load a pretrained YOLO11n-pose model
model = YOLO("yolo11n-pose.pt")
# Run inference on a local image or URL
results = model("https://docs.ultralytics.com/tasks/detect/")
# Visualize the results, showing the skeletal keypoints
results[0].show()
Dans ce processus, le modèle produit un Keypoints contenant les coordonnées et un objet
score de confiance pour chaque point détecté. Les développeurs peuvent
extraire ces données brutes x, y pour construire une logique personnalisée, telle que le comptage des répétitions dans une application de gymnastique ou le contrôle d'un personnage de jeu par l'intermédiaire d'un système d'information.
le contrôle d'un personnage de jeu par
l'interaction homme-machine.