Erfahren Sie, wie die Posenschätzung mithilfe von Schlüsselpunkten track . Entdecken Sie Anwendungsbeispiele aus der Praxis und starten Sie mit Ultralytics , um schnelle und genaue Ergebnisse zu erzielen.
Die Posenschätzung ist eine spezielle Technik der Bildverarbeitung, die über die einfache Erkennung von Objekten hinausgeht und deren geometrische Struktur und physikalische Ausrichtung erfasst. Während bei der Standard-Objekterkennung ein einfacher rechteckiger Rahmen um ein Objekt gezogen wird, identifiziert die Posenschätzung bestimmte semantische Punkte, sogenannte Keypoints, wie beispielsweise Gelenke am menschlichen Körper (Ellbogen, Knie, Schultern) oder strukturelle Ecken an einem Fahrzeug. Durch die Kartierung dieser Orientierungspunkte können Maschinelle-Lernmodelle eine Skelettrepräsentation des Objekts rekonstruieren, wodurch Systeme die Körpersprache, Bewegungsdynamik und genaue Positionierung im 2D- oder 3D-Raum interpretieren können.
Die moderne Posenschätzung stützt sich stark auf ausgefeilte Deep-Learning-Architekturen, wobei häufig Convolutional Neural Networks (CNNs) zur Verarbeitung visueller Daten eingesetzt werden. Die Algorithmen folgen im Allgemeinen einer von zwei Hauptstrategien zur Identifizierung von Schlüsselpunkten:
Modernste Modelle wie YOLO26 nutzen fortschrittliche End-to-End-Architekturen, die diese Anforderungen in Einklang bringen und eine schnelle Posenschätzung ermöglichen, die für den Einsatz auf Edge-KI- Geräten und mobilen Plattformen geeignet ist.
Es ist hilfreich, die Posenschätzung von anderen visuellen Erkennungsaufgaben zu unterscheiden, um ihren einzigartigen Wert in Computer-Vision -Workflows zu verstehen:
Die Möglichkeit, die Bewegungen von Menschen und Objekten zu digitalisieren, hat zu transformativen Anwendungen in verschiedenen Branchen geführt, die häufig mit Tools wie der Ultralytics trainiert werden, um große Datensätze mit kommentierten Schlüsselpunkten zu verwalten.
Im medizinischen Bereich nutzt KI im Gesundheitswesen die Posenabschätzung, um die Rehabilitation von Patienten aus der Ferne zu überwachen. Durch die Verfolgung von Gelenkwinkeln und Bewegungsumfang können automatisierte Systeme sicherstellen, dass Patienten Physiotherapieübungen zu Hause korrekt ausführen. Dies verringert das Risiko einer erneuten Verletzung und ermöglicht es Ärzten, den Genesungsfortschritt zu quantifizieren, ohne dass teure Laborgeräte erforderlich sind.
Trainer und Sportler nutzen Sportanalysen zur Leistungsoptimierung. Modelle zur Posenschätzung können die Schwungebene eines Golfers, die Schrittlänge eines Läufers oder die Biomechanik eines Pitchers analysieren, ohne dass dafür aufdringliche Markeranzüge erforderlich sind, wie sie bei der herkömmlichen Bewegungserfassung verwendet werden. Dies liefert sofortiges, datengestütztes Feedback zur Verbesserung der Technik und zur Vermeidung von Überlastungsverletzungen.
In kommerziellen Umgebungen wird KI in Einzelhandelssystemen eingesetzt, um das Kundenverhalten zu erfassen, beispielsweise wenn Kunden nach Produkten in hohen Regalen greifen oder sich in bestimmten Gängen aufhalten. Diese Daten helfen dabei, die Ladengestaltung zu optimieren und die Bestandsverwaltung zu verbessern, indem physische Handlungen mit Kaufentscheidungen in Zusammenhang gebracht werden.
Die Implementierung der Posenschätzung ist mit modernen Python Frameworks.
Das folgende Beispiel zeigt, wie man das ultralytics Paket zum Laden eines vortrainierten
YOLO26 Modell (der Nachfolger von
YOLO11) und detect Schlüsselpunkte in einem Bild detect .
from ultralytics import YOLO
# Load the YOLO26 pose model (nano version for speed)
model = YOLO("yolo26n-pose.pt")
# Perform inference on an image source
# The model identifies bounding boxes and specific keypoints (joints)
results = model("https://ultralytics.com/images/bus.jpg")
# Print the xy coordinates of detected keypoints
print(results[0].keypoints.xy)
# Visualize the skeletal results directly
results[0].show()