Bilgisayarla görmedeki kilit noktaları keşfedin: Fitness, hareket tanıma ve hızlı, doğru takip için Ultralytics YOLO11 ile poz tahmini.
Bilgisayarla görmede anahtar noktalar, bir görüntüde ayırt edici ve tekrarlanabilir olan belirli ilgi noktalarıdır. Bu noktalar, bir nesneyi veya sahneyi temsil eden kompakt, yapısal işaretler olarak hizmet ederek makinelerin görsel içeriği daha ayrıntılı bir şekilde anlamasını ve analiz etmesini sağlar. Algoritmalar her pikseli işlemek yerine, hareketi izlemek, nesneleri tanımak ve 3D sahneleri yeniden oluşturmak gibi karmaşık görevleri yerine getirmek için köşeler, kenarlar veya bir insan vücudunun eklemleri gibi bu kilit noktalara odaklanır. Bu bilgilendirici noktalara odaklanarak, bilgisayarla görme modelleri yüksek verimlilik ve doğruluk elde edebilir.
Anahtar noktaların birincil uygulaması, bir nesnenin veya kişinin konumunu ve yönünü belirlemeye odaklanan bir bilgisayarla görme görevi olan poz tahminidir. İnsan pozu tahmininde, anahtar noktalar omuzlar, dirsekler, dizler ve bilekler gibi ana vücut eklemlerine karşılık gelir. Bir görüntü veya videodaki bu noktaları tespit ederek, bir model insan vücudunun iskelet temsilini oluşturabilir. Bu "dijital iskelet", bir yapay zeka sisteminin kişinin görünüşünü, kıyafetlerini veya çevresindeki ortamı anlamasına gerek kalmadan duruşunu, jestlerini ve hareketlerini analiz etmesini sağlar.
Ultralytics YOLO11 gibi gelişmiş derin öğrenme modelleri, bu kilit noktaların konumlarını gerçek zamanlı olarak doğru bir şekilde tahmin etmek için COCO gibi büyük, açıklamalı veri kümeleri üzerinde eğitilir. OpenPose gibi ilk sistemler, aynı anda birden fazla kişi için tüm vücut, el ve yüz kilit noktalarını tespit etme yeteneğini göstererek yolu açtı. Modern mimariler, çok çeşitli uygulamalar için daha hızlı ve daha kesin sonuçlar sunmak üzere bu temeller üzerine inşa edilmiştir.
Anahtar nokta tespitini bilgisayarla görmedeki diğer ilgili görevlerden ayırmak önemlidir:
Kilit noktaların tespit ve takip edilebilmesi, çeşitli sektörlerde önemli ilerlemelerin kaydedilmesini sağlamıştır. İşte öne çıkan iki örnek:
Diğer uygulamalar arasında duygu analizi ve AR filtreleri için yüz işaretlerinin tespiti, vahşi yaşamın korunmasında davranışsal çalışmalar için hayvan pozu tahmini ve makinelerin çevrelerinde gezinmelerine ve çevreleriyle etkileşime girmelerine yardımcı olmak için robotik yer almaktadır.