Yolo Vision Shenzhen
Shenzhen
Jetzt beitreten
Glossar

Stichpunkte

Entdecken Sie die wichtigsten Punkte der Computer Vision: Posenschätzung mit Ultralytics YOLO11 für Fitness, Gestenerkennung und schnelles, präzises Tracking.

Schlüsselpunkte sind spezifische, informative räumliche Positionen innerhalb eines Bildes, die bestimmte Merkmale eines Objekts oder einer Szene definieren. Im Bereich der Computervision (CV) markieren diese Punkte – die in der Regel als X- und Y-Koordinaten dargestellt werden – wichtige Bereiche von Interesse, wie beispielsweise die Ecken eines Gebäudes, Gesichtszüge wie Augen und Nase oder die anatomischen Gelenke eines menschlichen Körpers. Im Gegensatz zur Verarbeitung jedes einzelnen Pixels in einem dichten Raster ermöglicht die Konzentration auf diese wenigen, semantisch reichhaltigen Punkte Modellen der künstlichen Intelligenz (KI) ein effizientes Verständnis der Geometrie, die Analyse von Formen und track mit hoher Präzision. Dieses Konzept ist grundlegend für fortgeschrittene Aufgaben, die ein strukturelles Verständnis des Objekts erfordern und nicht nur dessen Vorhandensein oder Position.

Die Rolle der Keypoints bei Vision AI

Schlüsselpunkte dienen als grundlegende Bausteine für die Abbildung der Struktur dynamischer Objekte. Wenn mehrere Schlüsselpunkte erkannt und miteinander verbunden werden, bilden sie ein Skelett oder Drahtgitter, das die Pose des Objekts darstellt. Dies wird am häufigsten bei der Posenschätzung angewendet, bei der Deep-Learning-Algorithmen (DL) die Position von Gelenken – Schultern, Ellbogen, Hüften und Knien – vorhersagen, um die Haltung von Menschen oder Tieren zu rekonstruieren.

Durch die Nutzung fortschrittlicher Architekturen wie dem Ultralytics können Systeme diese Koordinaten mit bemerkenswerter Geschwindigkeit direkt aus den Eingabebildern zurückverfolgen. Dieser Prozess beinhaltet eine komplexe Merkmalsextraktion, bei der das neuronale Netzwerk lernt, lokale Muster zu identifizieren, die unabhängig von Beleuchtung, Drehung und Skalierung sind. Da Schlüsselpunkte eine komprimierte Zusammenfassung des Zustands eines Objekts darstellen, sind sie rechnerisch effizient und eignen sich daher ideal für die Echtzeit-Inferenz auf Edge-Computing-Geräten.

Unterscheidung zwischen Kernpunkten und verwandten Konzepten

Um den spezifischen Nutzen von Schlüsselpunkten zu verstehen, ist es hilfreich, sie mit anderen primären Computer-Vision-Aufgaben in der Ultralytics zu vergleichen:

  • Keypoints vs. Objekterkennung: Bei der Standarderkennung wird ein Objekt identifiziert, indem es in einem Begrenzungsrahmen eingezeichnet wird. Der Rahmen behandelt das Objekt jedoch als starres Rechteck. Keypoints betrachten das Innere des Rahmens, um die innere Gliederung, Haltung und flexible Struktur zu identifizieren.
  • Keypoints vs. Instanz-Segmentierung: Bei der Segmentierung wird eine pixelgenaue Maske der Objektsilhouette erstellt. Die Segmentierung bietet zwar die ultimative Grenzdetails bietet, ist sie oft rechenintensiver. Keypoints liefern eine vereinfachte strukturelle Zusammenfassung, die oft bevorzugt bei der Analyse von Kinematik oder Bewegungsdynamik.
  • Keypoints vs. Datenannotation: Annotation ist der manuelle Prozess der Datenkennzeichnung, während die Keypoint-Erkennung die Vorhersage des Modells ist. Die Erstellung eines Trainingsdatensatzes umfasst das manuelle Anklicken bestimmter Punkte (z. B. „linkes Handgelenk”), um das Modell durch überwachtes Lernen zu trainieren.

Anwendungsfälle in der Praxis

Die Möglichkeit, bestimmte Punkte eines Themas track , öffnet die Tür zu vielfältigen Anwendungen in verschiedenen Branchen:

  • KI im Gesundheitswesen undin der Rehabilitation: Physiotherapieanwendungen überwachen die Übungen der Patienten aus der Ferne. Durch die Verfolgung von Körpermerkmalen stellt das System sicher, dass die Übungen in der richtigen Form ausgeführt werden, was zu einer effektiven Rehabilitation beiträgt. Dazu gehört oft die Berechnung von Freiheitsgraden, um den Bewegungsumfang des Patienten zu verstehen.
  • Sportanalytik: Trainer und Sportler nutzen die Keypoint-Erkennung zur Analyse der Biomechanik. Durch die Verfolgung der Winkel zwischen den Gelenken während eines Golfschwungs oder eines Sprints können Systeme automatisiertes Feedback geben, um die Leistung zu optimieren und Verletzungen zu vermeiden.
  • Fahrerüberwachungssysteme: In der Automobilindustrie track Gesichtserkennungssysteme Gesichtsmerkmale (Augen, Mund), um detect von Müdigkeit oder Ablenkung detect und Fahrer zu warnen, um Unfälle zu verhindern.
  • Augmented Reality (AR): In Social-Media-Filtern und Apps zum virtuellen Anprobieren ermöglichen Schlüsselpunkte im Gesicht, dass digitale Masken oder Brillen sich perfekt an die Bewegungen des Benutzers anpassen, was eine präzise Mensch-Computer-Interaktion erfordert.

Implementierung der Keypoint-Erkennung

Moderne Bibliotheken machen es einfach, die Erkennung von Keypoints mit Hilfe von vortrainierten Modellen zu implementieren. Die ultralytics Das Paket bietet sofortigen Zugriff auf modernste Modelle wie YOLO26 und YOLO11, das anhand von Datensätzen wie COCO oder Tiger-Pose.

Das folgende Beispiel zeigt, wie man ein Posenschätzungsmodell lädt und die erkannten Schlüsselpunkte mit Python visualisiert :

from ultralytics import YOLO

# Load a pretrained YOLO26n-pose model
model = YOLO("yolo26n-pose.pt")

# Run inference on a local image
results = model("path/to/runner.jpg")

# Visualize the results, showing the skeletal keypoints
results[0].show()

In diesem Workflow gibt das Modell ein Ergebnisobjekt aus, das die Koordinaten und ein Konfidenzniveau für jeden erkannten Punkt. Die Entwickler können diese Rohdaten extrahieren x, y Werte, um eine benutzerdefinierte Logik zu erstellen, wie z. B. das Zählen von Wiederholungen in einer Fitnessanwendung oder Steuerung einer Spielfigur über Bewegungserfassung.

Werden Sie Mitglied der Ultralytics

Gestalten Sie die Zukunft der KI mit. Vernetzen Sie sich, arbeiten Sie zusammen und wachsen Sie mit globalen Innovatoren

Jetzt beitreten