Poz tahminini keşfedin: anahtar nokta modellerinin (yukarıdan aşağıya ve aşağıdan yukarıya) nasıl çalıştığı, sağlıktan spora gerçek dünyadaki kullanımları, ayrıca temel faydalar ve zorluklar.
Poz tahmini, nesneleri algılamanın ötesine geçerek nesnelerin belirli geometrisini ve yönelimini tanımlayan özel bir bilgisayar görme görevidir. Yapısal işaret noktalarının ( anahtar noktalarolarak bilinir) koordinatlarını belirleyerek, bu teknoloji bir nesnenin iskelet temsilini oluşturur. İnsanlarda bu anahtar noktalar genellikle omuzlar, dirsekler, kalçalar ve dizler gibi büyük eklemlere karşılık gelir. Bu özellik, makine öğrenimi modellerinin vücut dilini, aktiviteyi ve duruşu yorumlamasına olanak tanıyarak, basit piksel algılama ile karmaşık fiziksel davranışları anlama arasındaki boşluğu doldurur.
Modern poz tahmini, büyük ölçüde derin öğrenme mimarilerine, özellikle Convolutional Neural Networks (CNNs) ve giderek artan bir şekilde Transformers'a dayanmaktadır. Bu süreç genel olarak iki temel metodolojiye ayrılır:
Yüksek performanslı uygulamalar için, en yeni YOLO26 modelleri bu kavramları entegre ederek kenar cihazları için uygun hızlı poz tahminini sağlar.
Poz tahminini benzer görme görevlerinden ayırmak çok önemlidir:
Poz tahmininin faydası, hareket analizinin kritik olduğu çeşitli sektörlere yayılmaktadır.
Sağlık hizmetlerinde yapay zeka alanında, poz tahmini hasta hareketlerini otomatik olarak takip ederek fizik tedaviye yardımcı olur. Sistemler eklemlerin açısını ölçebilir Rehabilitasyon egzersizleri sırasında hastaların uygun formu korumasını sağlayarak yeniden yaralanma riskini azaltır. Bu sayede uzaktan izleme ve tele-sağlık gelişmeleri için, kaliteli bakımı daha erişilebilir kılmak.
Antrenörler ve sporcular spor anali̇zi̇ performansı incelemek için. Çıkararak videodan biyomekanik veriler görüntü, yapay zeka bir golfçünün vuruş düzlemini veya bir koşucunun yürüyüş verimliliğini müdahaleci işaretleyiciye ihtiyaç duymadan analiz edebilir geleneksel hareket yakalamada kullanılan giysiler.
Aşağıdakiler Python Bu snippet, önceden eğitilmiş bir YOLO26 modelini nasıl yükleyeceğinizi
ve bir görüntü üzerinde poz tahminini nasıl gerçekleştireceğinizi gösterir. Bunun için ultralytics paketi ile görselleştirir ve
iskelet çıkışı.
from ultralytics import YOLO
# Load the official YOLO26 nano pose model
model = YOLO("yolo26n-pose.pt")
# Run inference on an image source to detect keypoints
results = model("path/to/image.jpg")
# Visualize the detected keypoints and skeleton
results[0].show()
Sağlam poz modellerinin eğitimi için büyük açıklamalı veri kümeleri gerekir. COCO Pose veri kümesi gibi standart ölçütler binlerce etiketli insan figürü. Bununla birlikte, oklüzyon gibi zorluklar devam etmektedir (vücut parçaları gizlenir) ve kendi kendini engel leme (bir kişi kendi uzuvlarını engellediğinde). Bunların ele alınması şunları gerektirir gelişmiş veri artırma teknikleri ve çeşitli çeşitli açıları ve aydınlatmayı kapsayan eğitim verileri koşullar.
Ayrıca, bu modelleri uç AI cihazlarında kullanmak hızdan ödün vermeden yüksek doğruluğu korumak için model niceleme gibi dikkatli optimizasyonlar gerektirir. Kullanıcılar, eğitimi ve dağıtımı basitleştiren Ultralytics kullanarak bu iş akışını kolaylaştırabilirler.