Indem Sie auf „Alle Cookies akzeptieren“ klicken, stimmen Sie der Speicherung von Cookies auf Ihrem Gerät zu, um die Website-Navigation zu verbessern, die Website-Nutzung zu analysieren und unsere Marketingbemühungen zu unterstützen. Mehr Infos
Cookie-Einstellungen
Indem Sie auf „Alle Cookies akzeptieren“ klicken, stimmen Sie der Speicherung von Cookies auf Ihrem Gerät zu, um die Website-Navigation zu verbessern, die Website-Nutzung zu analysieren und unsere Marketingbemühungen zu unterstützen. Mehr Infos
Erfahren Sie, wie Sie das Ultralytics YOLO11-Modell für eine genaue Pose-Schätzung verwenden. Wir werden Echtzeit-Inferencing und benutzerdefiniertes Modelltraining für verschiedene Anwendungen behandeln.
Abb. 1. Ein Beispiel für die Verwendung von Ultralytics YOLO11 zur Pose-Schätzung.
In diesem Artikel werden wir untersuchen, was Pose Estimation ist, einige ihrer Anwendungen diskutieren und Sie durch die Verwendung von YOLO11 mit dem Ultralytics Python-Paket für die Pose Estimation führen. Wir werden uns auch ansehen, wie Sie Ultralytics HUB verwenden können, um YOLO11 und Pose Estimation mit wenigen einfachen Klicks auszuprobieren. Los geht's!
Was ist Pose Estimation?
Bevor wir uns damit beschäftigen, wie man das neue Ultralytics YOLO11-Modell für die Pose-Schätzung verwendet, wollen wir uns ein besseres Verständnis der Pose-Schätzung aneignen.
Die Pose-Schätzung ist eine Computer-Vision-Technik, die verwendet wird, um die Pose einer Person oder eines Objekts in einem Bild oder Video zu analysieren. Deep-Learning-Modelle wie YOLO11 können wichtige Punkte auf einem bestimmten Objekt oder einer Person identifizieren, lokalisieren und verfolgen. Bei Objekten können diese wichtigen Punkte Ecken, Kanten oder deutliche Oberflächenmarkierungen umfassen, während sie bei Menschen wichtige Gelenke wie Ellbogen, Knie oder Schulter darstellen.
Die Pose-Schätzung ist einzigartig und komplexer im Vergleich zu anderen Computer-Vision-Aufgaben wie der Objekterkennung. Während die Objekterkennung Objekte in einem Bild lokalisiert, indem sie ein Feld um sie herum zeichnet, geht die Pose-Schätzung noch weiter, indem sie die genauen Positionen von Schlüsselpunkten auf dem Objekt vorhersagt.
Abb. 2. Verwendung von YOLO11 zur Erkennung und Schätzung der Körperhaltung von Personen in einem Büro.
Wenn es um die Pose-Schätzung geht, gibt es zwei Hauptansätze: Bottom-up und Top-down. Der Bottom-up-Ansatz erkennt einzelne Keypoints und gruppiert sie zu Skeletten, während sich der Top-down-Ansatz darauf konzentriert, zuerst Objekte zu erkennen und dann Keypoints innerhalb dieser Objekte zu schätzen.
YOLO11 kombiniert die Stärken von Top-Down- und Bottom-Up-Methoden. Wie der Bottom-Up-Ansatz hält es die Dinge einfach und schnell, ohne dass Schlüsselpunkte manuell gruppiert werden müssen. Gleichzeitig nutzt es die Genauigkeit der Top-Down-Methode, indem es Personen erkennt und ihre Posen in einem einzigen Schritt schätzt.
Anwendungsfälle für die Pose-Schätzung mit YOLO11
Die vielseitigen Fähigkeiten von YOLO11 für die Pose-Schätzung eröffnen eine breite Palette möglicher Anwendungen in vielen Branchen. Werfen wir einen genaueren Blick auf einige Anwendungsfälle der Pose-Schätzung von YOLO11.
Echtzeit-Pose-Schätzung mit YOLO11: Verbesserung der Arbeitssicherheit
Sicherheit ist ein wichtiger Aspekt jedes Bauprojekts. Dies gilt insbesondere, da Baustellen statistisch gesehen eine höhere Anzahl von Arbeitsunfällen aufweisen. Im Jahr 2021 ereigneten sich etwa 20 % aller tödlichen Arbeitsunfälle auf oder in der Nähe von Baustellen. Angesichts täglicher Risiken wie schwere Geräte und elektrische Systeme sind starke Sicherheitsmaßnahmen unerlässlich, um die Sicherheit der Arbeiter zu gewährleisten. Traditionelle Methoden wie die Verwendung von Schildern, Barrikaden und die manuelle Überwachung durch Vorgesetzte sind nicht immer effektiv und entziehen den Vorgesetzten oft wichtigere Aufgaben.
KI kann eingreifen, um die Sicherheit zu verbessern, und das Unfallrisiko kann durch den Einsatz eines auf Pose-Schätzung basierenden Arbeiterüberwachungssystems reduziert werden. Ultralytics YOLO11-Modelle können verwendet werden, um die Bewegungen und Körperhaltungen von Arbeitern zu verfolgen. Potenzielle Gefahren, wie z. B. Arbeiter, die sich zu nahe an gefährlichen Geräten aufhalten oder Aufgaben falsch ausführen, können schnell erkannt werden. Wenn eine Gefahr erkannt wird, können Vorgesetzte benachrichtigt werden oder ein Alarm kann den Arbeiter warnen. Ein kontinuierliches Überwachungssystem kann Baustellen sicherer machen, indem es ständig nach Gefahren Ausschau hält und Arbeiter schützt.
Abb. 3. Ein Beispiel für die Schätzung der Körperhaltung auf einer Baustelle mit YOLO11.
Posenschätzung mit YOLO11 zur Überwachung von Nutztieren
Landwirte und Forscher können YOLO11 verwenden, um die Bewegung und das Verhalten von Nutztieren, wie z. B. Rindern, zu untersuchen, um frühe Anzeichen von Krankheiten wie Lahmheit zu erkennen. Lahmheit ist ein Zustand, in dem ein Tier aufgrund von Schmerzen in seinen Beinen oder Füßen Schwierigkeiten hat, sich richtig zu bewegen. Bei Rindern beeinträchtigen Krankheiten wie Lahmheit nicht nur ihre Gesundheit und ihr Wohlbefinden, sondern führen auch zu Produktionsproblemen in Milchviehbetrieben. Studien zeigen, dass Lahmheit zwischen 8 % der Rinder in Weidesystemen und 15 % bis 30 % in Haltungssystemen in der globalen Milchindustrie betrifft. Das frühzeitige Erkennen und Behandeln von Lahmheit kann dazu beitragen, das Tierwohl zu verbessern und die mit dieser Erkrankung verbundenen Produktionsausfälle zu reduzieren.
Die Pose-Schätzungsfunktionen von YOLO11 können Landwirten helfen, die Gangmuster der Tiere zu verfolgen und schnell Anomalien zu erkennen, die auf Gesundheitsprobleme hindeuten könnten, wie z. B. Gelenkprobleme oder Infektionen. Das frühzeitige Erkennen dieser Probleme ermöglicht eine schnellere Behandlung, wodurch das Unbehagen der Tiere reduziert und Landwirten geholfen wird, wirtschaftliche Verluste zu vermeiden.
Vision AI-gestützte Überwachungssysteme können auch helfen, das Ruheverhalten, soziale Interaktionen und Fressmuster zu analysieren. Landwirte können auch die Pose-Schätzung verwenden, um Beobachtungen zu Anzeichen von Stress oder Aggression zu erhalten. Diese Erkenntnisse können genutzt werden, um bessere Lebensbedingungen für Tiere zu schaffen und ihr Wohlbefinden zu steigern.
Abb. 4. Eine Visualisierung der Kuh-Pose-Schätzung.
Anwendungsfälle von YOLO11 in der Fitnessbranche
Die Pose-Schätzung kann Menschen auch helfen, ihre Körperhaltung in Echtzeit beim Training zu verbessern. Mit YOLO11 können Fitness- und Yogalehrer die Körperbewegungen verfolgen von trainierenden Personen überwachen und sich dabei auf wichtige Punkte wie Gelenke und Gliedmaßen konzentrieren, um ihre Körperhaltung zu beurteilen. Die gesammelten Daten können mit idealen Posen und Trainingstechniken verglichen werden, und die Trainer können Benachrichtigungen erhalten, wenn jemand eine Bewegung falsch ausführt, um Verletzungen vorzubeugen.
Abb. 5. Verwendung von Pose Estimation zur Analyse eines Workouts.
Beispielsweise kann die Posenschätzung während eines Yoga-Kurses helfen zu überwachen, ob alle Schüler das richtige Gleichgewicht und die richtige Ausrichtung halten. Mobile Anwendungen, die in Computer Vision und Posenschätzung integriert sind, können Fitness zugänglicher machen für Menschen, die zu Hause trainieren oder keinen Zugang zu Personal Trainern haben. Dieses kontinuierliche Echtzeit-Feedback hilft den Benutzern, ihre Technik zu verbessern und ihre Fitnessziele zu erreichen und gleichzeitig das Verletzungsrisiko zu verringern.
Echtzeit-Pose-Schätzung mit dem YOLO11-Modell ausprobieren
Nachdem wir nun untersucht haben, was Pose Estimation ist und einige ihrer Anwendungen erörtert haben, wollen wir uns ansehen, wie Sie Pose Estimation mit dem neuen YOLO11-Modell ausprobieren können. Um loszulegen, gibt es zwei bequeme Möglichkeiten: mit dem Ultralytics Python-Paket oder über Ultralytics HUB. Wir wollen uns beide Optionen ansehen.
Inferenzläufe mit YOLO11 durchführen
Eine Inferenz auszuführen bedeutet, dass das YOLO11-Modell neue Daten außerhalb seiner Trainingsdatensätze verarbeitet und die gelernten Muster verwendet, um Vorhersagen auf der Grundlage dieser Daten zu treffen. Sie können Inferenzläufe über Code mit dem Ultralytics Python-Paket durchführen. Alles, was Sie für den Einstieg tun müssen, ist die Installation des Ultralytics-Pakets mit pip, conda oder Docker. Wenn Sie während der Installation auf Probleme stoßen, bietet unser Leitfaden zu häufigen Problemen hilfreiche Tipps zur Fehlerbehebung.
Sobald Sie das Paket erfolgreich installiert haben, beschreibt der folgende Code, wie Sie ein Modell laden und damit Posen von Objekten in einem Bild vorhersagen können.
Abb. 6. Ein Code-Snippet, das das Ausführen von Inferenz mit YOLO11 zeigt.
Training eines benutzerdefinierten YOLO11-Modells
Nehmen wir an, Sie arbeiten an einem Computer-Vision-Projekt und haben einen bestimmten Datensatz für eine bestimmte Anwendung, die die Schätzung der Körperhaltung beinhaltet. Dann können Sie ein benutzerdefiniertes YOLO11-Modellfeinabstimmen und trainieren, um es an Ihre Anwendung anzupassen. Sie können beispielsweise einen Datensatz von Keypoints verwenden, um die Pose eines Tigers in Bildern zu analysieren und zu verstehen, indem Sie wichtige Merkmale wie die Position seiner Gliedmaßen, seines Kopfes und seines Schwanzes identifizieren.
Sie können den folgenden Code-Schnipsel verwenden, um ein YOLO11-Pose-Schätzungsmodell zu laden und zu trainieren. Das Modell kann aus einer YAML-Konfiguration erstellt werden, oder Sie können ein vortrainiertes Modell zum Trainieren laden. Dieses Skript ermöglicht es Ihnen auch, Gewichte zu übertragen und mit dem Training des Modells unter Verwendung eines bestimmten Datensatzes zu beginnen, wie z. B. dem COCO-Datensatz für die Pose-Schätzung.
Abb. 7. Benutzerdefiniertes Training von YOLO11.
Mit dem neu trainierten, benutzerdefinierten Modell können Sie Inferenz auf ungesehenen Bildern im Zusammenhang mit Ihrer Computer Vision Lösung durchführen. Das trainierte Modell kann auch mit dem Exportmodus in andere Formate konvertiert werden.
Probieren Sie YOLO11 auf Ultralytics HUB aus
Bisher haben wir uns Methoden zur Verwendung von YOLO11 angesehen, die grundlegende Programmierkenntnisse erfordern. Wenn das nicht das ist, wonach Sie suchen, oder wenn Sie mit dem Programmieren nicht vertraut sind, gibt es eine andere Möglichkeit: Ultralytics HUB. Ultralytics HUB ist eine benutzerfreundliche Plattform, die den Prozess des Trainierens und Bereitstellens von YOLO-Modellen vereinfachen soll. Mit HUB können Sie auf einfache Weise Datensätze verwalten, Modelle trainieren und diese bereitstellen, ohne dass technische Fachkenntnisse erforderlich sind.
Um Inferenz auf Bildern auszuführen, können Sie ein Konto erstellen, zum Abschnitt „Modelle“ navigieren und das YOLO11-Pose-Schätzungsmodell auswählen, an dem Sie interessiert sind. Im Vorschaubereich können Sie ein Bild hochladen und die Ergebnisse der Vorhersage wie unten dargestellt anzeigen.
Abb. 8. Pose Estimation auf Ultralytics HUB mit YOLO11.
YOLO11-Fortschritte in der Erkennung der menschlichen Körperhaltung
Ultralytics YOLO11 bietet genaue und flexible Lösungen für Aufgaben wie die Pose-Schätzung in einer Vielzahl von Anwendungen. Von der Verbesserung der Sicherheit von Arbeitern auf Baustellen über die Überwachung der Gesundheit von Nutztieren bis hin zur Unterstützung der Haltungskorrektur bei Fitnessübungen bietet YOLO11 Präzision und Echtzeit-Feedback durch fortschrittliche Computer-Vision-Technologie.
Seine Vielseitigkeit mit mehreren Modellvarianten und die Möglichkeit zum benutzerdefinierten Training für spezifische Anwendungsfälle machen es zu einem sehr wertvollen Werkzeug für Entwickler und Unternehmen gleichermaßen. Ob durch Codierung mit dem Ultralytics Python-Paket oder durch die Verwendung des Ultralytics HUB für eine einfachere Implementierung, YOLO11 macht die Pose-Schätzung zugänglich und wirkungsvoll.
Um mehr zu erfahren, besuchen Sie unser GitHub-Repository und treten Sie mit unserer Community in Kontakt. Entdecken Sie KI-Anwendungen in der Fertigung und Landwirtschaft auf unseren Lösungsseiten. 🚀