Yolo Vision Shenzhen
Shenzhen
Şimdi katılın
Sözlük

Poz Tahmini

Poz tahminini keşfedin: anahtar nokta modellerinin (yukarıdan aşağıya ve aşağıdan yukarıya) nasıl çalıştığı, sağlıktan spora gerçek dünyadaki kullanımları, ayrıca temel faydalar ve zorluklar.

Poz tahmini, nesneleri algılamanın ötesine geçerek nesnelerin belirli geometrisini ve yönelimini tanımlayan özel bir bilgisayar görme görevidir. Yapısal işaret noktalarının ( anahtar noktalarolarak bilinir) koordinatlarını belirleyerek, bu teknoloji bir nesnenin iskelet temsilini oluşturur. İnsanlarda bu anahtar noktalar genellikle omuzlar, dirsekler, kalçalar ve dizler gibi büyük eklemlere karşılık gelir. Bu özellik, makine öğrenimi modellerinin vücut dilini, aktiviteyi ve duruşu yorumlamasına olanak tanıyarak, basit piksel algılama ile karmaşık fiziksel davranışları anlama arasındaki boşluğu doldurur.

Temel Mekanizmalar ve Yaklaşımlar

Modern poz tahmini, büyük ölçüde derin öğrenme mimarilerine, özellikle Convolutional Neural Networks (CNNs) ve giderek artan bir şekilde Transformers'a dayanmaktadır. Bu süreç genel olarak iki temel metodolojiye ayrılır:

  • Yukarıdan Aşağıya Yaklaşım: Bu yöntem ilk olarak bir bireyi bulmak için nesne algılama modeli bir sınırlayıcı kutu içindeki örnekler (örneğin insanlar). Bir kez kırpıldığında, sistem o tek kişi için kilit noktaları tahmin eder. Bu genellikle daha doğrudur ancak hesaplama açısından kişi sayısı arttıkça pahalı hale gelir.
  • Aşağıdan Yukarıya Yaklaşım: Alternatif olarak, model tüm görüntüdeki tüm potansiyel kilit noktaları tespit eder (örneğin, her sol dirsek) ve daha sonra bunları farklı iskeletler oluşturmak üzere ilişkilendirir. Bu genellikle aşağıdakiler için tercih edilir kalabalık sahnelerde gerçek zamanlı çıkarım işlem süresi denek sayısına daha az bağlıdır.

Yüksek performanslı uygulamalar için, en yeni YOLO26 modelleri bu kavramları entegre ederek kenar cihazları için uygun hızlı poz tahminini sağlar.

İlgili Kavramları Ayırt Etme

Poz tahminini benzer görme görevlerinden ayırmak çok önemlidir:

  • Nesne Algılamaya Karşı: Bir yandan nesne algılama bir nesnenin nerede olduğunu tanımlar ve ne olduğu (sınıf etiketi), nesneyi katı bir kutu olarak ele alır. Poz tahmini, nesnenin iç yapı ve bu kutu içinde eklemlenme.
  • Örnek Segmentasyonuna Karşı: Örnek segmentasyonu bir Bir nesnenin şeklinin piksel mükemmelliğinde maskesi. Bu, sınırın ana hatlarını çizmekle birlikte, eklemleri veya hareket dinamiklerini analiz etmek için gerekli olan iskelet bağlantısı veya kinematik.

Gerçek Dünya Uygulamaları

Poz tahmininin faydası, hareket analizinin kritik olduğu çeşitli sektörlere yayılmaktadır.

Sağlık ve Rehabilitasyon

Sağlık hizmetlerinde yapay zeka alanında, poz tahmini hasta hareketlerini otomatik olarak takip ederek fizik tedaviye yardımcı olur. Sistemler eklemlerin açısını ölçebilir Rehabilitasyon egzersizleri sırasında hastaların uygun formu korumasını sağlayarak yeniden yaralanma riskini azaltır. Bu sayede uzaktan izleme ve tele-sağlık gelişmeleri için, kaliteli bakımı daha erişilebilir kılmak.

Spor Analitiği ve Biyomekanik

Antrenörler ve sporcular spor anali̇zi̇ performansı incelemek için. Çıkararak videodan biyomekanik veriler görüntü, yapay zeka bir golfçünün vuruş düzlemini veya bir koşucunun yürüyüş verimliliğini müdahaleci işaretleyiciye ihtiyaç duymadan analiz edebilir geleneksel hareket yakalamada kullanılan giysiler.

Kod Örneği: YOLO26 ile Poz Tahmini

Aşağıdakiler Python Bu snippet, önceden eğitilmiş bir YOLO26 modelini nasıl yükleyeceğinizi ve bir görüntü üzerinde poz tahminini nasıl gerçekleştireceğinizi gösterir. Bunun için ultralytics paketi ile görselleştirir ve iskelet çıkışı.

from ultralytics import YOLO

# Load the official YOLO26 nano pose model
model = YOLO("yolo26n-pose.pt")

# Run inference on an image source to detect keypoints
results = model("path/to/image.jpg")

# Visualize the detected keypoints and skeleton
results[0].show()

Zorluklar ve Veriler

Sağlam poz modellerinin eğitimi için büyük açıklamalı veri kümeleri gerekir. COCO Pose veri kümesi gibi standart ölçütler binlerce etiketli insan figürü. Bununla birlikte, oklüzyon gibi zorluklar devam etmektedir (vücut parçaları gizlenir) ve kendi kendini engel leme (bir kişi kendi uzuvlarını engellediğinde). Bunların ele alınması şunları gerektirir gelişmiş veri artırma teknikleri ve çeşitli çeşitli açıları ve aydınlatmayı kapsayan eğitim verileri koşullar.

Ayrıca, bu modelleri uç AI cihazlarında kullanmak hızdan ödün vermeden yüksek doğruluğu korumak için model niceleme gibi dikkatli optimizasyonlar gerektirir. Kullanıcılar, eğitimi ve dağıtımı basitleştiren Ultralytics kullanarak bu iş akışını kolaylaştırabilirler.

Ultralytics topluluğuna katılın

Yapay zekanın geleceğine katılın. Küresel yenilikçilerle bağlantı kurun, işbirliği yapın ve birlikte büyüyün

Şimdi katılın