Entdecken Sie die wichtigsten Punkte der Computer Vision: Posenschätzung mit Ultralytics YOLO11 für Fitness, Gestenerkennung und schnelles, präzises Tracking.
Keypoints sind präzise, informative räumliche Positionen innerhalb eines Bildes, die bestimmte Merkmale eines Objekts oder einer Szene definieren. Szene definieren. Im Bereich der Computer Vision markieren diese Koordinaten - typischerweise als X- und Y-Werte dargestellt - signifikante Punkte von Interesse, wie z. B. die Ecken eines Gebäudes, das Zentrum eines Auges oder die Gelenke eines menschlichen Körpers. Anders als bei der Verarbeitung jedes Pixels in einem Bild ist die Konzentration auf diese spärlichen, semantisch reichen Punkte ermöglicht Modelle der künstlichen Intelligenz (KI), die Geometrie effizient zu verstehen, Formen zu analysieren und Bewegungen mit hoher Präzision track . Dieses Konzept ist grundlegend für fortgeschrittene Aufgaben, die ein strukturelles Verständnis des Objekts und nicht nur seiner Anwesenheit oder seines Standorts erfordern.
Keypoints dienen als grundlegende Bausteine für die Abbildung der Struktur von dynamischen Objekten. Wenn mehrere Keypoints erkannt und verbunden werden, bilden sie einen Skelettgraphen oder ein Drahtgitter, das die Haltung des Objekts darstellt. Diese wird am häufigsten bei der Posenschätzung verwendet, wo Algorithmen die Position der anatomischen Gelenke - Schultern, Ellbogen, Hüfte und Knie - vorhersagen, um die menschliche Haltung zu rekonstruieren.
Durch die Nutzung von Deep-Learning-Architekturen wie YOLO11können Systeme diese Koordinaten direkt aus den Eingabebildern regressieren. Dieser Prozess beinhaltet komplexe Merkmalsextraktion, bei der das Netzwerk lernt, lokale lokale Muster zu erkennen, die unabhängig von Beleuchtung, Drehung und Maßstab sind. Die resultierenden Daten sind leicht und und rechnerisch effizient, wodurch sie ideal für Echtzeit-Inferenz auf Edge-Geräten.
Um den spezifischen Nutzen von Keypoints zu verstehen, ist es hilfreich, sie mit anderen primären Computer-Vision-Aufgaben zu vergleichen Aufgaben zu vergleichen:
Die Möglichkeit, bestimmte Punkte eines Themas track , öffnet die Tür zu vielfältigen Anwendungen in verschiedenen Branchen:
Moderne Bibliotheken machen es einfach, die Erkennung von Keypoints mit Hilfe von vortrainierten Modellen zu implementieren. Die
ultralytics Paket bietet sofortigen Zugang zu
YOLO11 Modelle, die auf umfangreichen Datensätzen wie
COCO um menschliche Gelenke zu identifizieren.
Das folgende Beispiel zeigt, wie man ein Modell zur Posenschätzung lädt und die erkannten Keypoints visualisiert:
from ultralytics import YOLO
# Load a pretrained YOLO11n-pose model
model = YOLO("yolo11n-pose.pt")
# Run inference on a local image or URL
results = model("https://docs.ultralytics.com/tasks/detect/")
# Visualize the results, showing the skeletal keypoints
results[0].show()
In diesem Arbeitsablauf gibt das Modell eine Keypoints Objekt, das die Koordinaten enthält, und ein
Konfidenzniveau für jeden erkannten Punkt. Die Entwickler können
diese Rohdaten extrahieren x, y Werte, um eine benutzerdefinierte Logik zu erstellen, wie z. B. das Zählen von Wiederholungen in einer Fitnessanwendung oder
Steuerung einer Spielfigur über
Mensch-Computer-Interaktion.