Yolo Vision Shenzhen
Shenzhen
Şimdi katılın
Sözlük

Poz Tahmini

Poz tahmininin track için kilit noktaları nasıl kullandığını öğrenin. Gerçek dünya uygulamalarını keşfedin ve hızlı, doğru sonuçlar için Ultralytics kullanmaya başlayın.

Poz tahmini, nesnelerin varlığını tespit etmenin ötesine geçerek onların geometrik yapısını ve fiziksel yönelimini anlamaya yönelik özel bir bilgisayar görme tekniğidir. Standart nesne tespiti, nesnenin etrafına basit bir dikdörtgen kutu çizerken, poz tahmini, insan vücudundaki eklemler (dirsekler, dizler, omuzlar) veya bir aracın yapısal köşeleri gibi anahtar noktalar olarak bilinen belirli anlamsal noktaları tanımlar. Bu işaretleri haritalayarak, makine öğrenimi modelleri nesnenin iskeletini yeniden oluşturabilir ve sistemlerin beden dilini, hareket dinamiklerini ve 2D veya 3D uzayda kesin konumlandırmayı yorumlamasını sağlar.

Temel Mekanizmalar: Yukarıdan Aşağıya ve Aşağıdan Yukarıya

Modern poz tahmini, görsel verileri işlemek için genellikle Convolutional Neural Networks (CNNs) kullanan sofistike derin öğrenme mimarilerine büyük ölçüde dayanmaktadır. Algoritmalar genellikle kilit noktaları belirlemek için iki temel stratejiden birini izler:

  • Yukarıdan Aşağıya Yaklaşımlar: Bu yöntem ilk olarak bir nesne algılama modeli kullanarak sınırlayıcı kutular içindeki tek tek örnekleri bulur. Bir kişi veya nesne daha büyük bir görüntüden kırpıldıktan sonra, poz tahmincisi o belirli bölge içindeki anahtar noktaları tahmin eder. Bu yaklaşım genellikle oldukça doğrudur, ancak çerçevedeki nesne sayısı arttıkça daha yüksek çıkarım gecikmesi yaşayabilir. Bu yaklaşım, nesne algılama modelinin doğru bir şekilde eğitilmesi ve sınırlayıcı kutuların doğru bir şekilde konumlandırılması için yüksek kaliteli görüntüler gerektirir.
  • Aşağıdan Yukarıya Yaklaşımlar: Tersine, bu strateji tüm görüntüdeki tüm potansiyel kilit noktaları aynı anda algılar (örneğin, kalabalıkta her "sol diz"i bulur) ve ardından ilişkilendirme algoritmaları kullanarak bunları ayrı iskeletler halinde gruplandırır. Bu yöntem genellikle kalabalık sahnelerde gerçek zamanlı çıkarım için tercih edilir, çünkü hesaplama maliyeti kaç kişi olursa olsun nispeten sabit kalır.

YOLO26 gibi son teknoloji modeller, bu ihtiyaçları dengeleyen gelişmiş uçtan uca mimariler kullanır ve kenar AI cihazları ve mobil platformlarda kullanıma uygun yüksek hızlı poz tahmini sağlar.

İlgili Bilgisayar Görme Terimlerini Ayırt Etme

Pose tahminini diğer görsel tanıma görevlerinden ayırmak, bilgisayar görme iş akışlarındaki benzersiz değerini anlamak için yararlıdır: :

  • Nesne Algılama: Nesnenin ne olduğunu ve nerede olduğunu belirlemeye odaklanır ve dikdörtgen bir kutu çıkarır. Nesneyi iç yapısını anlamadan katı bir nesne olarak ele alır.
  • Örnek Segmentasyonu: Nesnenin kesin şeklini özetleyen piksel-mükemmel bir maske oluşturur. Segmentasyon sınırları sağlarken, kinematik analiz için gerekli olan eklemleri veya iskelet bağlantılarını açıkça tanımlamaz .
  • Duruş Tahmini: Özellikle iç yapıyı hedefler, önceden belirlenmiş referans noktaları (örneğin, kalça ile diz) arasındaki bağlantıları eşleştirerek duruş ve hareketi analiz eder.

Gerçek Dünya Uygulamaları

İnsan ve nesne hareketlerini dijitalleştirme yeteneği, çeşitli endüstrilerde dönüştürücü uygulamalara yol açmıştır. Bu uygulamalar genellikle, büyük anotlanmış kilit nokta veri kümelerini yönetmek için Ultralytics gibi araçlar kullanılarak eğitilmiştir.

Sağlık ve Rehabilitasyon

Tıp alanında, sağlık hizmetlerinde yapay zeka, hasta rehabilitasyonunu uzaktan izlemek için poz tahminini kullanır. Eklem açılarını ve hareket aralığını takip ederek, otomatik sistemler hastaların evde fizik tedavi egzersizlerini doğru bir şekilde yapmalarını sağlayabilir. Bu, yeniden yaralanma riskini azaltır ve klinisyenlerin pahalı laboratuvar ekipmanlarına ihtiyaç duymadan iyileşme sürecini ölçmelerini sağlar.

Spor Analitiği

Koçlar ve sporcular, performansı optimize etmek için spor analitiğinden yararlanıyor. Poz tahmin modelleri, geleneksel hareket yakalamada kullanılan müdahaleci işaretleyici giysilere gerek kalmadan golfçünün vuruş düzlemini, koşucunun adım uzunluğunu veya atıcıların biyomekaniğini analiz edebiliyor. Bu, tekniği geliştirmek ve aşırı kullanımdan kaynaklanan sakatlıkları önlemek için anında, veriye dayalı geri bildirim sağlıyor.

Perakende ve Davranış Analizi

Ticari ortamlarda, perakende sistemlerinde yapay zeka, yüksek raflardaki ürünlere uzanmak veya belirli koridorlarda uzun süre kalmak gibi müşteri davranışlarını anlamak için poz algılama özelliğini kullanır. Bu veriler, fiziksel eylemleri satın alma kararlarıyla ilişkilendirerek mağaza düzenini optimize etmeye ve envanter yönetimini iyileştirmeye yardımcı olur.

Kod Örneği: YOLO26 ile Poz Tahmini

Modern teknolojilerle poz tahminini uygulamak oldukça basittir. Python çerçeveleri. Aşağıdaki örnek, ultralytics önceden eğitilmiş bir modeli yüklemek için paket YOLO26 model (halefi YOLO11) ve bir görüntüdeki detect kilit noktalarını detect .

from ultralytics import YOLO

# Load the YOLO26 pose model (nano version for speed)
model = YOLO("yolo26n-pose.pt")

# Perform inference on an image source
# The model identifies bounding boxes and specific keypoints (joints)
results = model("https://ultralytics.com/images/bus.jpg")

# Print the xy coordinates of detected keypoints
print(results[0].keypoints.xy)

# Visualize the skeletal results directly
results[0].show()

Ultralytics topluluğuna katılın

Yapay zekanın geleceğine katılın. Küresel yenilikçilerle bağlantı kurun, işbirliği yapın ve birlikte büyüyün

Şimdi katılın