Yolo Vision Shenzhen
Shenzhen
Jetzt beitreten
Glossar

Schätzung der Pose

Erfahren Sie, wie die Posenschätzung mithilfe von Schlüsselpunkten track . Entdecken Sie Anwendungsbeispiele aus der Praxis und starten Sie mit Ultralytics , um schnelle und genaue Ergebnisse zu erzielen.

Die Posenschätzung ist eine spezielle Technik der Bildverarbeitung, die über die einfache Erkennung von Objekten hinausgeht und deren geometrische Struktur und physikalische Ausrichtung erfasst. Während bei der Standard-Objekterkennung ein einfacher rechteckiger Rahmen um ein Objekt gezogen wird, identifiziert die Posenschätzung bestimmte semantische Punkte, sogenannte Keypoints, wie beispielsweise Gelenke am menschlichen Körper (Ellbogen, Knie, Schultern) oder strukturelle Ecken an einem Fahrzeug. Durch die Kartierung dieser Orientierungspunkte können Maschinelle-Lernmodelle eine Skelettrepräsentation des Objekts rekonstruieren, wodurch Systeme die Körpersprache, Bewegungsdynamik und genaue Positionierung im 2D- oder 3D-Raum interpretieren können.

Kernmechanismen: Top-Down vs. Bottom-Up

Die moderne Posenschätzung stützt sich stark auf ausgefeilte Deep-Learning-Architekturen, wobei häufig Convolutional Neural Networks (CNNs) zur Verarbeitung visueller Daten eingesetzt werden. Die Algorithmen folgen im Allgemeinen einer von zwei Hauptstrategien zur Identifizierung von Schlüsselpunkten:

  • Top-Down-Ansätze: Bei dieser Methode wird zunächst ein Objekterkennungsmodell eingesetzt, um einzelne Instanzen innerhalb von Begrenzungsrahmen zu lokalisieren. Sobald eine Person oder ein Objekt aus dem größeren Bild ausgeschnitten wurde, sagt der Posenschätzer die Schlüsselpunkte innerhalb dieses bestimmten Bereichs voraus. Dieser Ansatz ist oft sehr genau, kann jedoch unter einer höheren Inferenzlatenz leiden, wenn die Anzahl der Motive im Bild zunimmt.
  • Bottom-up-Ansätze: Umgekehrt erkennt diese Strategie alle potenziellen Schlüsselpunkte im gesamten Bild gleichzeitig (z. B. jedes „linke Knie” in einer Menschenmenge) und gruppiert sie dann mithilfe von Assoziationsalgorithmen zu einzelnen Skeletten. Diese Methode wird im Allgemeinen für die Echtzeit-Inferenz in überfüllten Szenen bevorzugt, da der Rechenaufwand relativ konstant bleibt, unabhängig davon, wie viele Personen anwesend sind.

Modernste Modelle wie YOLO26 nutzen fortschrittliche End-to-End-Architekturen, die diese Anforderungen in Einklang bringen und eine schnelle Posenschätzung ermöglichen, die für den Einsatz auf Edge-KI- Geräten und mobilen Plattformen geeignet ist.

Unterscheidung verwandter Begriffe aus dem Bereich Computer Vision

Es ist hilfreich, die Posenschätzung von anderen visuellen Erkennungsaufgaben zu unterscheiden, um ihren einzigartigen Wert in Computer-Vision -Workflows zu verstehen:

  • Objekterkennung: Konzentriert sich darauf, zu identifizieren, was ein Objekt ist und wo es sich befindet, und gibt ein rechteckiges Feld aus. Es behandelt das Motiv als starres Objekt, ohne dessen innere Gliederung zu verstehen.
  • Instanzsegmentierung: Erzeugt eine pixelgenaue Maske, die die genaue Form des Objekts umreißt. Die Segmentierung liefert zwar Grenzen, identifiziert jedoch nicht explizit Gelenke oder Skelettverbindungen, die für die kinematische Analyse erforderlich sind.
  • Posen-Schätzung: Konzentriert sich speziell auf die innere Struktur und bildet Verbindungen zwischen vorab festgelegten Orientierungspunkten (z. B. Hüfte zu Knie) ab, um Haltung und Bewegung zu analysieren.

Anwendungsfälle in der Praxis

Die Möglichkeit, die Bewegungen von Menschen und Objekten zu digitalisieren, hat zu transformativen Anwendungen in verschiedenen Branchen geführt, die häufig mit Tools wie der Ultralytics trainiert werden, um große Datensätze mit kommentierten Schlüsselpunkten zu verwalten.

Gesundheitswesen und Rehabilitation

Im medizinischen Bereich nutzt KI im Gesundheitswesen die Posenabschätzung, um die Rehabilitation von Patienten aus der Ferne zu überwachen. Durch die Verfolgung von Gelenkwinkeln und Bewegungsumfang können automatisierte Systeme sicherstellen, dass Patienten Physiotherapieübungen zu Hause korrekt ausführen. Dies verringert das Risiko einer erneuten Verletzung und ermöglicht es Ärzten, den Genesungsfortschritt zu quantifizieren, ohne dass teure Laborgeräte erforderlich sind.

Sport-Analytik

Trainer und Sportler nutzen Sportanalysen zur Leistungsoptimierung. Modelle zur Posenschätzung können die Schwungebene eines Golfers, die Schrittlänge eines Läufers oder die Biomechanik eines Pitchers analysieren, ohne dass dafür aufdringliche Markeranzüge erforderlich sind, wie sie bei der herkömmlichen Bewegungserfassung verwendet werden. Dies liefert sofortiges, datengestütztes Feedback zur Verbesserung der Technik und zur Vermeidung von Überlastungsverletzungen.

Einzelhandel und Verhaltensanalyse

In kommerziellen Umgebungen wird KI in Einzelhandelssystemen eingesetzt, um das Kundenverhalten zu erfassen, beispielsweise wenn Kunden nach Produkten in hohen Regalen greifen oder sich in bestimmten Gängen aufhalten. Diese Daten helfen dabei, die Ladengestaltung zu optimieren und die Bestandsverwaltung zu verbessern, indem physische Handlungen mit Kaufentscheidungen in Zusammenhang gebracht werden.

Code-Beispiel: Posenschätzung mit YOLO26

Die Implementierung der Posenschätzung ist mit modernen Python Frameworks. Das folgende Beispiel zeigt, wie man das ultralytics Paket zum Laden eines vortrainierten YOLO26 Modell (der Nachfolger von YOLO11) und detect Schlüsselpunkte in einem Bild detect .

from ultralytics import YOLO

# Load the YOLO26 pose model (nano version for speed)
model = YOLO("yolo26n-pose.pt")

# Perform inference on an image source
# The model identifies bounding boxes and specific keypoints (joints)
results = model("https://ultralytics.com/images/bus.jpg")

# Print the xy coordinates of detected keypoints
print(results[0].keypoints.xy)

# Visualize the skeletal results directly
results[0].show()

Werden Sie Mitglied der Ultralytics

Gestalten Sie die Zukunft der KI mit. Vernetzen Sie sich, arbeiten Sie zusammen und wachsen Sie mit globalen Innovatoren

Jetzt beitreten