Yolo Vision Shenzhen
Shenzhen
Jetzt beitreten
Glossar

Stichpunkte

Entdecken Sie die wichtigsten Punkte der Computer Vision: Posenschätzung mit Ultralytics YOLO11 für Fitness, Gestenerkennung und schnelles, präzises Tracking.

Keypoints sind präzise, informative räumliche Positionen innerhalb eines Bildes, die bestimmte Merkmale eines Objekts oder einer Szene definieren. Szene definieren. Im Bereich der Computer Vision markieren diese Koordinaten - typischerweise als X- und Y-Werte dargestellt - signifikante Punkte von Interesse, wie z. B. die Ecken eines Gebäudes, das Zentrum eines Auges oder die Gelenke eines menschlichen Körpers. Anders als bei der Verarbeitung jedes Pixels in einem Bild ist die Konzentration auf diese spärlichen, semantisch reichen Punkte ermöglicht Modelle der künstlichen Intelligenz (KI), die Geometrie effizient zu verstehen, Formen zu analysieren und Bewegungen mit hoher Präzision track . Dieses Konzept ist grundlegend für fortgeschrittene Aufgaben, die ein strukturelles Verständnis des Objekts und nicht nur seiner Anwesenheit oder seines Standorts erfordern.

Die Rolle der Keypoints bei Vision AI

Keypoints dienen als grundlegende Bausteine für die Abbildung der Struktur von dynamischen Objekten. Wenn mehrere Keypoints erkannt und verbunden werden, bilden sie einen Skelettgraphen oder ein Drahtgitter, das die Haltung des Objekts darstellt. Diese wird am häufigsten bei der Posenschätzung verwendet, wo Algorithmen die Position der anatomischen Gelenke - Schultern, Ellbogen, Hüfte und Knie - vorhersagen, um die menschliche Haltung zu rekonstruieren.

Durch die Nutzung von Deep-Learning-Architekturen wie YOLO11können Systeme diese Koordinaten direkt aus den Eingabebildern regressieren. Dieser Prozess beinhaltet komplexe Merkmalsextraktion, bei der das Netzwerk lernt, lokale lokale Muster zu erkennen, die unabhängig von Beleuchtung, Drehung und Maßstab sind. Die resultierenden Daten sind leicht und und rechnerisch effizient, wodurch sie ideal für Echtzeit-Inferenz auf Edge-Geräten.

Unterscheidung zwischen Kernpunkten und verwandten Konzepten

Um den spezifischen Nutzen von Keypoints zu verstehen, ist es hilfreich, sie mit anderen primären Computer-Vision-Aufgaben zu vergleichen Aufgaben zu vergleichen:

  • Keypoints vs. Objekterkennung: Bei der Standarderkennung wird festgestellt, was und wo ein Objekt ist, indem es von einem Begrenzungsrahmen. Der Rahmen behandelt das Objekt jedoch als ein starres Rechteck. Bei der Keypoints-Erkennung wird das Innere des Kastens betrachtet, um interne Gelenke und die Körperhaltung zu erkennen.
  • Keypoints vs. Instanz-Segmentierung: Bei der Segmentierung wird eine pixelgenaue Maske der Objektsilhouette erstellt. Die Segmentierung bietet zwar die ultimative Grenzdetails bietet, ist sie oft rechenintensiver. Keypoints liefern eine vereinfachte strukturelle Zusammenfassung, die oft bevorzugt bei der Analyse von Kinematik oder Bewegungsdynamik.
  • Keypoints vs. Datenbeschriftung: Bei der Beschriftung handelt es sich um den menschlichen Prozess der Kennzeichnung von Daten, während die Erkennung von Keypoints die Vorhersage des Modells ist. Das Erstellen eines Datensatzes ist das manuelle Anklicken bestimmter Punkte (z. B. "linkes Handgelenk"), um das Modell zu trainieren.

Anwendungsfälle in der Praxis

Die Möglichkeit, bestimmte Punkte eines Themas track , öffnet die Tür zu vielfältigen Anwendungen in verschiedenen Branchen:

  • Sport-Analytik: Trainer und Sportler nutzen die Keypoint-Erkennung zur Analyse der Biomechanik. Durch die Verfolgung der Winkel zwischen den Gelenken während eines Golfschwunges oder eines Sprints können Systeme automatisiertes Feedback geben, um die Leistung zu optimieren und Verletzungen zu vermeiden. Diese beinhaltet oft die Berechnung von Freiheitsgrade zum Verständnis des Bewegungsumfangs Bewegung zu verstehen.
  • KI in der Robotik: Roboter verlassen sich auf für das Erfassen und Manipulieren von Objekten. Die Identifizierung bestimmter Greifpunkte an einem Objekt ermöglicht es einem Roboterarm zu berechnen inverse Kinematik und die korrekte Positionierung seinen Endeffektor korrekt zu positionieren.
  • KI im Gesundheitswesen: Physikalische Anwendungen für die Physiotherapie überwachen die Übungen der Patienten aus der Ferne. Durch die Verfolgung von Körpermerkmalen stellt das System sicher, dass die Übungen dass die Übungen in der richtigen Form durchgeführt werden, was zu einer effektiven Rehabilitation beiträgt.
  • Erweiterte Realität (AR): In sozialen Media-Filtern und virtuellen Anprobe-Apps können sich digitale Masken oder Brillen dank Schlüsselpunkten im Gesicht (Gesichtsmerkmale) perfekt auf die Bewegungen des Nutzers auszurichten.

Implementierung der Keypoint-Erkennung

Moderne Bibliotheken machen es einfach, die Erkennung von Keypoints mit Hilfe von vortrainierten Modellen zu implementieren. Die ultralytics Paket bietet sofortigen Zugang zu YOLO11 Modelle, die auf umfangreichen Datensätzen wie COCO um menschliche Gelenke zu identifizieren.

Das folgende Beispiel zeigt, wie man ein Modell zur Posenschätzung lädt und die erkannten Keypoints visualisiert:

from ultralytics import YOLO

# Load a pretrained YOLO11n-pose model
model = YOLO("yolo11n-pose.pt")

# Run inference on a local image or URL
results = model("https://docs.ultralytics.com/tasks/detect/")

# Visualize the results, showing the skeletal keypoints
results[0].show()

In diesem Arbeitsablauf gibt das Modell eine Keypoints Objekt, das die Koordinaten enthält, und ein Konfidenzniveau für jeden erkannten Punkt. Die Entwickler können diese Rohdaten extrahieren x, y Werte, um eine benutzerdefinierte Logik zu erstellen, wie z. B. das Zählen von Wiederholungen in einer Fitnessanwendung oder Steuerung einer Spielfigur über Mensch-Computer-Interaktion.

Werden Sie Mitglied der Ultralytics

Gestalten Sie die Zukunft der KI mit. Vernetzen Sie sich, arbeiten Sie zusammen und wachsen Sie mit globalen Innovatoren

Jetzt beitreten