Schalten Sie ein zu YOLO Vision 2025!
25. September 2025
10:00 — 18:00 Uhr BST
Hybride Veranstaltung
Yolo Vision 2024

So verwenden Sie Ultralytics YOLO11 für die Pose-Schätzung

Abirami Vina

3 Minuten Lesezeit

14. Oktober 2024

Erfahren Sie, wie Sie das Ultralytics YOLO11-Modell für eine genaue Pose-Schätzung verwenden. Wir werden Echtzeit-Inferencing und benutzerdefiniertes Modelltraining für verschiedene Anwendungen behandeln.

Die Forschung im Bereich Computer Vision, einem Zweig der künstlichen Intelligenz (KI), lässt sich bis in die 1960er Jahre zurückverfolgen. Allerdings sahen wir erst in den 2010er Jahren mit dem Aufkommen von Deep Learning bedeutende Durchbrüche in der Art und Weise, wie Maschinen Bilder verstehen. Eine der neuesten Entwicklungen im Bereich Computer Vision sind die hochmodernen Ultralytics YOLO11-Modelle. Die YOLO11-Modelle, die erstmals auf dem jährlichen Hybrid-Event von Ultralytics, YOLO Vision 2024 (YV24), vorgestellt wurden, unterstützen eine Reihe von Computer-Vision-Aufgaben, einschließlich der Pose-Schätzung.

Pose Estimation kann verwendet werden, um Keypoints zu erkennen auf einer Person oder einem Objekt in einem Bild oder Video, um ihre Position, Haltung oder Bewegung zu verstehen. Es wird häufig in Anwendungen wie Sportanalytik, Überwachung des Tierverhaltens und Robotik eingesetzt, um Maschinen zu helfen, physische Aktionen in Echtzeit zu interpretieren. Dank seiner verbesserten Genauigkeit, Effizienz und Geschwindigkeit gegenüber früheren Modellen in der YOLO (You Only Look Once) Serie, ist YOLO11 gut geeignet für Echtzeit-Pose-Estimation-Aufgaben.

__wf_reserved_inherit
Abb. 1. Ein Beispiel für die Verwendung von Ultralytics YOLO11 zur Pose-Schätzung.

In diesem Artikel werden wir untersuchen, was Pose Estimation ist, einige ihrer Anwendungen diskutieren und Sie durch die Verwendung von YOLO11 mit dem Ultralytics Python-Paket für die Pose Estimation führen. Wir werden uns auch ansehen, wie Sie Ultralytics HUB verwenden können, um YOLO11 und Pose Estimation mit wenigen einfachen Klicks auszuprobieren. Los geht's!

Was ist Pose Estimation?

Bevor wir uns damit beschäftigen, wie man das neue Ultralytics YOLO11-Modell für die Pose-Schätzung verwendet, wollen wir uns ein besseres Verständnis der Pose-Schätzung aneignen.

Die Pose-Schätzung ist eine Computer-Vision-Technik, die verwendet wird, um die Pose einer Person oder eines Objekts in einem Bild oder Video zu analysieren. Deep-Learning-Modelle wie YOLO11 können wichtige Punkte auf einem bestimmten Objekt oder einer Person identifizieren, lokalisieren und verfolgen. Bei Objekten können diese wichtigen Punkte Ecken, Kanten oder deutliche Oberflächenmarkierungen umfassen, während sie bei Menschen wichtige Gelenke wie Ellbogen, Knie oder Schulter darstellen. 

Die Pose-Schätzung ist einzigartig und komplexer im Vergleich zu anderen Computer-Vision-Aufgaben wie der Objekterkennung. Während die Objekterkennung Objekte in einem Bild lokalisiert, indem sie ein Feld um sie herum zeichnet, geht die Pose-Schätzung noch weiter, indem sie die genauen Positionen von Schlüsselpunkten auf dem Objekt vorhersagt.

__wf_reserved_inherit
Abb. 2. Verwendung von YOLO11 zur Erkennung und Schätzung der Körperhaltung von Personen in einem Büro.

Wenn es um die Pose-Schätzung geht, gibt es zwei Hauptansätze: Bottom-up und Top-down. Der Bottom-up-Ansatz erkennt einzelne Keypoints und gruppiert sie zu Skeletten, während sich der Top-down-Ansatz darauf konzentriert, zuerst Objekte zu erkennen und dann Keypoints innerhalb dieser Objekte zu schätzen. 

YOLO11 kombiniert die Stärken von Top-Down- und Bottom-Up-Methoden. Wie der Bottom-Up-Ansatz hält es die Dinge einfach und schnell, ohne dass Schlüsselpunkte manuell gruppiert werden müssen. Gleichzeitig nutzt es die Genauigkeit der Top-Down-Methode, indem es Personen erkennt und ihre Posen in einem einzigen Schritt schätzt.

Anwendungsfälle für die Pose-Schätzung mit YOLO11 

Die vielseitigen Fähigkeiten von YOLO11 für die Pose-Schätzung eröffnen eine breite Palette möglicher Anwendungen in vielen Branchen. Werfen wir einen genaueren Blick auf einige Anwendungsfälle der Pose-Schätzung von YOLO11.

Echtzeit-Pose-Schätzung mit YOLO11: Verbesserung der Arbeitssicherheit

Sicherheit ist ein wichtiger Aspekt jedes Bauprojekts. Dies gilt insbesondere, da Baustellen statistisch gesehen eine höhere Anzahl von Arbeitsunfällen aufweisen. Im Jahr 2021 ereigneten sich etwa 20 % aller tödlichen Arbeitsunfälle auf oder in der Nähe von Baustellen. Angesichts täglicher Risiken wie schwere Geräte und elektrische Systeme sind starke Sicherheitsmaßnahmen unerlässlich, um die Sicherheit der Arbeiter zu gewährleisten. Traditionelle Methoden wie die Verwendung von Schildern, Barrikaden und die manuelle Überwachung durch Vorgesetzte sind nicht immer effektiv und entziehen den Vorgesetzten oft wichtigere Aufgaben.

KI kann eingreifen, um die Sicherheit zu verbessern, und das Unfallrisiko kann durch den Einsatz eines auf Pose-Schätzung basierenden Arbeiterüberwachungssystems reduziert werden. Ultralytics YOLO11-Modelle können verwendet werden, um die Bewegungen und Körperhaltungen von Arbeitern zu verfolgen. Potenzielle Gefahren, wie z. B. Arbeiter, die sich zu nahe an gefährlichen Geräten aufhalten oder Aufgaben falsch ausführen, können schnell erkannt werden. Wenn eine Gefahr erkannt wird, können Vorgesetzte benachrichtigt werden oder ein Alarm kann den Arbeiter warnen. Ein kontinuierliches Überwachungssystem kann Baustellen sicherer machen, indem es ständig nach Gefahren Ausschau hält und Arbeiter schützt

__wf_reserved_inherit
Abb. 3. Ein Beispiel für die Schätzung der Körperhaltung auf einer Baustelle mit YOLO11.

Posenschätzung mit YOLO11 zur Überwachung von Nutztieren

Landwirte und Forscher können YOLO11 verwenden, um die Bewegung und das Verhalten von Nutztieren, wie z. B. Rindern, zu untersuchen, um frühe Anzeichen von Krankheiten wie Lahmheit zu erkennen. Lahmheit ist ein Zustand, in dem ein Tier aufgrund von Schmerzen in seinen Beinen oder Füßen Schwierigkeiten hat, sich richtig zu bewegen. Bei Rindern beeinträchtigen Krankheiten wie Lahmheit nicht nur ihre Gesundheit und ihr Wohlbefinden, sondern führen auch zu Produktionsproblemen in Milchviehbetrieben. Studien zeigen, dass Lahmheit zwischen 8 % der Rinder in Weidesystemen und 15 % bis 30 % in Haltungssystemen in der globalen Milchindustrie betrifft. Das frühzeitige Erkennen und Behandeln von Lahmheit kann dazu beitragen, das Tierwohl zu verbessern und die mit dieser Erkrankung verbundenen Produktionsausfälle zu reduzieren.

Die Pose-Schätzungsfunktionen von YOLO11 können Landwirten helfen, die Gangmuster der Tiere zu verfolgen und schnell Anomalien zu erkennen, die auf Gesundheitsprobleme hindeuten könnten, wie z. B. Gelenkprobleme oder Infektionen. Das frühzeitige Erkennen dieser Probleme ermöglicht eine schnellere Behandlung, wodurch das Unbehagen der Tiere reduziert und Landwirten geholfen wird, wirtschaftliche Verluste zu vermeiden.

Vision AI-gestützte Überwachungssysteme können auch helfen, das Ruheverhalten, soziale Interaktionen und Fressmuster zu analysieren. Landwirte können auch die Pose-Schätzung verwenden, um Beobachtungen zu Anzeichen von Stress oder Aggression zu erhalten. Diese Erkenntnisse können genutzt werden, um bessere Lebensbedingungen für Tiere zu schaffen und ihr Wohlbefinden zu steigern.

__wf_reserved_inherit
Abb. 4. Eine Visualisierung der Kuh-Pose-Schätzung.

Anwendungsfälle von YOLO11 in der Fitnessbranche

Die Pose-Schätzung kann Menschen auch helfen, ihre Körperhaltung in Echtzeit beim Training zu verbessern. Mit YOLO11 können Fitness- und Yogalehrer die Körperbewegungen verfolgen von trainierenden Personen überwachen und sich dabei auf wichtige Punkte wie Gelenke und Gliedmaßen konzentrieren, um ihre Körperhaltung zu beurteilen. Die gesammelten Daten können mit idealen Posen und Trainingstechniken verglichen werden, und die Trainer können Benachrichtigungen erhalten, wenn jemand eine Bewegung falsch ausführt, um Verletzungen vorzubeugen.

__wf_reserved_inherit
Abb. 5. Verwendung von Pose Estimation zur Analyse eines Workouts.

Beispielsweise kann die Posenschätzung während eines Yoga-Kurses helfen zu überwachen, ob alle Schüler das richtige Gleichgewicht und die richtige Ausrichtung halten. Mobile Anwendungen, die in Computer Vision und Posenschätzung integriert sind, können Fitness zugänglicher machen für Menschen, die zu Hause trainieren oder keinen Zugang zu Personal Trainern haben. Dieses kontinuierliche Echtzeit-Feedback hilft den Benutzern, ihre Technik zu verbessern und ihre Fitnessziele zu erreichen und gleichzeitig das Verletzungsrisiko zu verringern.

Echtzeit-Pose-Schätzung mit dem YOLO11-Modell ausprobieren

Nachdem wir nun untersucht haben, was Pose Estimation ist und einige ihrer Anwendungen erörtert haben, wollen wir uns ansehen, wie Sie Pose Estimation mit dem neuen YOLO11-Modell ausprobieren können. Um loszulegen, gibt es zwei bequeme Möglichkeiten: mit dem Ultralytics Python-Paket oder über Ultralytics HUB. Wir wollen uns beide Optionen ansehen.

Inferenzläufe mit YOLO11 durchführen

Eine Inferenz auszuführen bedeutet, dass das YOLO11-Modell neue Daten außerhalb seiner Trainingsdatensätze verarbeitet und die gelernten Muster verwendet, um Vorhersagen auf der Grundlage dieser Daten zu treffen. Sie können Inferenzläufe über Code mit dem Ultralytics Python-Paket durchführen. Alles, was Sie für den Einstieg tun müssen, ist die Installation des Ultralytics-Pakets mit pip, conda oder Docker. Wenn Sie während der Installation auf Probleme stoßen, bietet unser Leitfaden zu häufigen Problemen hilfreiche Tipps zur Fehlerbehebung. 

Sobald Sie das Paket erfolgreich installiert haben, beschreibt der folgende Code, wie Sie ein Modell laden und damit Posen von Objekten in einem Bild vorhersagen können.

__wf_reserved_inherit
Abb. 6. Ein Code-Snippet, das das Ausführen von Inferenz mit YOLO11 zeigt.

Training eines benutzerdefinierten YOLO11-Modells

Nehmen wir an, Sie arbeiten an einem Computer-Vision-Projekt und haben einen bestimmten Datensatz für eine bestimmte Anwendung, die die Schätzung der Körperhaltung beinhaltet. Dann können Sie ein benutzerdefiniertes YOLO11-Modell feinabstimmen und trainieren, um es an Ihre Anwendung anzupassen. Sie können beispielsweise einen Datensatz von Keypoints verwenden, um die Pose eines Tigers in Bildern zu analysieren und zu verstehen, indem Sie wichtige Merkmale wie die Position seiner Gliedmaßen, seines Kopfes und seines Schwanzes identifizieren.

Sie können den folgenden Code-Schnipsel verwenden, um ein YOLO11-Pose-Schätzungsmodell zu laden und zu trainieren. Das Modell kann aus einer YAML-Konfiguration erstellt werden, oder Sie können ein vortrainiertes Modell zum Trainieren laden. Dieses Skript ermöglicht es Ihnen auch, Gewichte zu übertragen und mit dem Training des Modells unter Verwendung eines bestimmten Datensatzes zu beginnen, wie z. B. dem COCO-Datensatz für die Pose-Schätzung.

__wf_reserved_inherit
Abb. 7. Benutzerdefiniertes Training von YOLO11.

Mit dem neu trainierten, benutzerdefinierten Modell können Sie Inferenz auf ungesehenen Bildern im Zusammenhang mit Ihrer Computer Vision Lösung durchführen. Das trainierte Modell kann auch mit dem Exportmodus in andere Formate konvertiert werden.

Probieren Sie YOLO11 auf Ultralytics HUB aus

Bisher haben wir uns Methoden zur Verwendung von YOLO11 angesehen, die grundlegende Programmierkenntnisse erfordern. Wenn das nicht das ist, wonach Sie suchen, oder wenn Sie mit dem Programmieren nicht vertraut sind, gibt es eine andere Möglichkeit: Ultralytics HUB. Ultralytics HUB ist eine benutzerfreundliche Plattform, die den Prozess des Trainierens und Bereitstellens von YOLO-Modellen vereinfachen soll. Mit HUB können Sie auf einfache Weise Datensätze verwalten, Modelle trainieren und diese bereitstellen, ohne dass technische Fachkenntnisse erforderlich sind.

Um Inferenz auf Bildern auszuführen, können Sie ein Konto erstellen, zum Abschnitt „Modelle“ navigieren und das YOLO11-Pose-Schätzungsmodell auswählen, an dem Sie interessiert sind. Im Vorschaubereich können Sie ein Bild hochladen und die Ergebnisse der Vorhersage wie unten dargestellt anzeigen. 

__wf_reserved_inherit
Abb. 8. Pose Estimation auf Ultralytics HUB mit YOLO11.

YOLO11-Fortschritte in der Erkennung der menschlichen Körperhaltung

Ultralytics YOLO11 bietet genaue und flexible Lösungen für Aufgaben wie die Pose-Schätzung in einer Vielzahl von Anwendungen. Von der Verbesserung der Sicherheit von Arbeitern auf Baustellen über die Überwachung der Gesundheit von Nutztieren bis hin zur Unterstützung der Haltungskorrektur bei Fitnessübungen bietet YOLO11 Präzision und Echtzeit-Feedback durch fortschrittliche Computer-Vision-Technologie. 

Seine Vielseitigkeit mit mehreren Modellvarianten und die Möglichkeit zum benutzerdefinierten Training für spezifische Anwendungsfälle machen es zu einem sehr wertvollen Werkzeug für Entwickler und Unternehmen gleichermaßen. Ob durch Codierung mit dem Ultralytics Python-Paket oder durch die Verwendung des Ultralytics HUB für eine einfachere Implementierung, YOLO11 macht die Pose-Schätzung zugänglich und wirkungsvoll.

Um mehr zu erfahren, besuchen Sie unser GitHub-Repository und treten Sie mit unserer Community in Kontakt. Entdecken Sie KI-Anwendungen in der Fertigung und Landwirtschaft auf unseren Lösungsseiten. 🚀

Lasst uns gemeinsam die Zukunft
der KI gestalten!

Beginnen Sie Ihre Reise mit der Zukunft des maschinellen Lernens

Kostenlos starten
Link in die Zwischenablage kopiert