Yolo Vision Shenzhen
Shenzhen
Şimdi katılın

Poz tahmini nedir ve nerelerde kullanılabilir?

Abirami Vina

5 dakikalık okuma

7 Mayıs 2025

Poz tahmininin nasıl çalıştığını, gerçek dünyadaki uygulamalarını ve Ultralytics YOLO11 gibi modellerin makinelerin vücut hareketini ve duruşunu yorumlamasını nasıl sağladığını öğrenin.

Birinin kambur durduğunu veya omuzları geride dik durduğunu gördüğünüzde, duruşunun kötü mü yoksa kendine güvenli mi olduğu hemen anlaşılır. Kimsenin bunu size açıklamanıza gerek yoktur. Çünkü zamanla vücut dilini yorumlamayı doğal olarak öğrendik. 

Deneyim ve gözlem yoluyla beyinlerimiz, insanlar da dahil olmak üzere çeşitli nesnelerin duruşunu tanımada çok iyi hale geldi. Yapay zeka (AI) ve makinelerin dünyadan görsel bilgileri yorumlamasını sağlayan bilgisayar görüşündeki son gelişmeler sayesinde, makineler de artık bu yeteneği öğrenmeye ve kopyalamaya başlıyor.

Poz tahmini, makinelerin resimlere veya videolara bakarak bir kişinin veya nesnenin konumunu ve yönünü anlamasına yardımcı olan bir bilgisayar görüşü görevidir. Bunu, birinin veya bir şeyin nasıl hareket ettiğini anlamak için eklemler ve uzuvlar gibi vücuttaki kilit noktaları belirleyerek yapar. 

Bu teknoloji fitness, sağlık ve animasyon gibi alanlarda yaygın olarak kullanılmaktadır. Örneğin işyeri ortamlarında, çalışanların duruşunu izlemek ve güvenlik ve sağlıklı yaşam girişimlerini desteklemek için kullanılabilir. Bilgisayarla görme modelleri gibi Ultralytics YOLO11 insan pozlarını gerçek zamanlı olarak tahmin ederek bunu mümkün kılıyor.

Şekil 1. Çalışanların duruşunu izlemek için YOLO11 kullanımına bir örnek.

Bu makalede, poz tahminine ve nasıl çalıştığına, ayrıca fark yarattığı gerçek dünya kullanım alanlarına daha yakından bakacağız. Hadi başlayalım!

Poz tahmininin evrimi

Poz tahmini üzerine araştırmalar 1960'ların sonlarında ve 70'lerde başladı. Yıllar içinde, bu bilgisayar görüşü görevine yönelik yaklaşımlar, temel matematik ve geometriden yapay zeka tarafından yönlendirilen daha gelişmiş yöntemlere kaymıştır.

Başlangıçta, teknikler sabit kamera açılarına ve bilinen referans noktalarına bağlıydı. Daha sonra, 3D modeller ve özellik eşleştirmesi içerecek şekilde geliştirilmiştir. Günümüzde, YOLO11 gibi derin öğrenme modelleri vücut pozisyonlarını görüntülerden veya videolardan gerçek zamanlı olarak detect ederek poz tahminini her zamankinden daha hızlı ve daha doğru hale getirebiliyor.

Teknoloji geliştikçe araştırmacılar, başta insanlar ve hayvanlar olmak üzere çeşitli nesnelerin duruşlarını izleyebilmenin ve track edebilmenin potansiyel uygulamalarını gördüler. Poz tahmini özellikle önemlidir çünkü yapay zeka araçlarının duruş ve hareketi daha önce mümkün olmayan şekillerde anlamasını ve ölçmesini sağlar. 

Örneğin, bilgisayarların eller serbest etkileşim için hareketleri tanımasına, sporcuların performansını artırmak için hareketlerini analiz etmesine, video oyunlarında gerçekçi animasyonlara güç vermesine ve hatta hastaların iyileşme sürecini izleyerek sağlık hizmetlerini desteklemesine olanak tanır.

Diğer bilgisayar görüşü görevlerinden farkı nedir?

Poz tahmini, nesne tespiti ve örnek segmentasyonu gibi diğer bilgisayar görüşü görevlerinden farklıdır. Bu görevler öncelikle bir görüntüdeki nesneleri tanımlamaya ve konumlandırmaya odaklanır. 

Örneğin, nesne tespiti, insanların, araçların veya hayvanların varlığını ve konumunu belirtmek için bunların etrafına sınırlayıcı kutular çizer. Örnek segmentasyonu, her nesnenin kesin şeklini piksel düzeyinde ana hatlarıyla belirleyerek bunu bir adım öteye taşır.

Ancak, bu yöntemlerin her ikisi de temel olarak nesnenin ne olduğu ve nerede olduğu ile ilgilenir; nesnenin nasıl konumlandırıldığı veya ne yapıyor olabileceği hakkında herhangi bir bilgi sağlamazlar. İşte poz kestirimi burada devreye giriyor. 

Dirsekler, dizler veya hatta bir kuyruk gibi vücuttaki kilit noktaları belirleyerek, poz kestirimi duruşu ve hareketi yorumlayabilir. Bu, eylemlerin, jestlerin ve vücut dinamiklerinin, 3D uzaydaki hareket de dahil olmak üzere daha derinlemesine anlaşılmasını sağlar.

Poz kestiriminin nasıl çalıştığını anlama

Poz kestirim modelleri genellikle iki ana yaklaşımı izler: aşağıdan yukarıya ve yukarıdan aşağıya. Aşağıdan yukarıya yaklaşımında, model önce dirsekler, dizler veya omuzlar gibi bireysel kilit noktaları tespit eder ve ardından hangi kişiye veya nesneye ait olduklarını anlamak için bunları gruplandırır. Buna karşılık, yukarıdan aşağıya yaklaşımı önce her nesneyi (örneğin, görüntüdeki bir kişiyi) tespit ederek başlar ve ardından o belirli nesnenin kilit noktalarını bulur.

Şekil 2. Aşağıdan yukarıya ve yukarıdan aşağıya poz kestirim yöntemleri.

YOLO11 gibi bazı yeni modeller her iki yaklaşımın avantajlarını harmanlıyor. Manuel gruplama adımını atlayarak aşağıdan yukarıya yönteminin verimliliğini korurken, aynı zamanda insanları tespit ederek ve pozlarını tek seferde tahmin ederek yukarıdan aşağıya sistemlerin hassasiyetinden yararlanıyor - tek ve kolaylaştırılmış bir süreçte.

Poz tahmini için özel eğitim YOLO11

Poz kestirim modellerinin nasıl çalıştığını incelerken, şu soruyu merak ediyor olabilirsiniz: Bu modeller farklı nesnelerin pozunu tahmin etmeyi nasıl öğreniyor? İşte özel eğitim fikri burada devreye giriyor.

Özel eğitim, bir modele kendi verilerinizi kullanarak belirli kilit noktaları tanımayı öğretmek anlamına gelir. Sıfırdan bir model oluşturmak büyük miktarda etiketli görüntü ve önemli bir zaman gerektirdiğinden, birçok kişi transfer öğrenimini tercih etmektedir. Bu, COCO veri kümesi üzerinde önceden eğitilmiş olan YOLO11 poz tahmin modeli gibi büyük bir veri kümesi üzerinde zaten eğitilmiş olan bir modelle başlamayı ve ardından belirli bir görev veya kullanım durumu için kendi verilerinizle ince ayar yapmayı içerir.

Diyelim ki yoga pozları üzerinde çalışıyorsunuz - her pozun o aktiviteye özgü kilit noktalarla etiketlendiği görüntüleri kullanarak YOLO11 'e ince ayar yapabilirsiniz. Bunu yapmak için, modelin öğrenebileceği açıklamalı görüntülerden oluşan özel bir veri kümesine ihtiyacınız olacaktır. 

Eğitim sırasında, doğruluğu artırmak için yığın boyutu (aynı anda işlenen görüntü sayısı), öğrenme oranı (modelin öğrenmesini ne kadar hızlı güncellediği) ve epoklar (modelin veri kümesinde kaç kez döngü yaptığı) gibi ayarları yapabilirsiniz. Bu, özel ihtiyaçlarınıza göre uyarlanmış poz kestirim modelleri oluşturmayı çok daha kolay hale getirir.

Poz kestiriminin gerçek dünya uygulamaları

Poz kestiriminin ne olduğunu ve nasıl çalıştığını ele aldığımıza göre, şimdi de gerçek dünyadaki kullanım alanlarından bazılarına daha yakından bakalım.

Fizyoterapide poz kestirimi kullanımı 

Duruş tahmini, sağlık sektöründe, özellikle de fizik tedavide giderek güvenilir bir araç haline geliyor. Yapay zeka ve bilgisayar görüşü kullanan bu sistemler, duruş ve hareketleri gerçek zamanlı olarak track ve bir fizyoterapistin sunacağına benzer şekilde geri bildirim sağlayabilir. 

Örneğin, diz ameliyatından çıkan bir hasta, rehabilitasyon egzersizlerini doğru yaptığından emin olmak için bir duruş tahmin sistemi kullanabilir. Sistem yanlış hareketleri tespit edebilir ve iyileştirme önerileri sunarak hastanın track ve yaralanmalardan kaçınmasına yardımcı olabilir.

Şekil 3. Fizyoterapi için YOLO11 kullanımına bir örnek.

Rehabilitasyonun ötesinde, poz kestirimi fitness uygulamalarına da giriyor. Örneğin, evde egzersiz yapan biri, egzersizler sırasında formunu kontrol etmek için uygulamayı kullanabilir. Uygulama, bir squat'ın açısını ayarlamak veya deadlift sırasında sırtınızın düz olduğundan emin olmak gibi gerçek zamanlı geri bildirim verebilir. Bu, kullanıcıların bir eğitmene ihtiyaç duymadan formlarını iyileştirmelerine ve yaralanmaları önlemelerine yardımcı olur.

Poz kestirimi ile sağlanan eğlence için hareket yakalama

Poz kestirimi, eğlencede hareket yakalamanın çalışma şeklini değiştirerek daha basit ve erişilebilir hale getirdi. Geçmişte, hareket yakalama, bir kişinin vücuduna işaretleyiciler yerleştirmeyi ve bunları özel kameralarla izlemeyi gerektiriyordu, bu da zor ve maliyetli olabiliyordu. 

Artık yapay zeka ve bilgisayarla görme alanındaki ilerlemeler sayesinde, vücut hareketlerini işaretleyicilere ihtiyaç duymadan track için normal kameralar ve algoritmalar kullanabiliyoruz, bu da süreci gerçek zamanlı olarak bile daha verimli ve doğru hale getiriyor.

Bunun harika bir örneği Disney'in AR (Artırılmış Gerçeklik) Poser'ı. Bu eğlenceli araç, telefonunuzla bir fotoğraf çekmenize ve artırılmış gerçeklikte dijital bir karakterin pozunuzu kopyalamasına olanak tanır. Resimdeki pozunuzu analiz ederek ve 3D bir karakterle eşleştirerek eğlenceli, kişiselleştirilmiş bir AR selfie oluşturur. 

Şekil 4. Bir AR karakteri, poz kestirimi kullanarak bir kişinin pozunu taklit ediyor.

Hayvan poz kestirimi tarafından yönlendirilen sosyal davranış araştırması

Hayvan davranışlarını incelemek, bilim insanlarının hayvanların nasıl iletişim kurduğunu, eş bulduğunu, yavrularına nasıl baktığını ve gruplar halinde nasıl yaşadığını anlamalarına yardımcı olur. Bu bilgi, yaban hayatını korumak ve doğal dünyayı daha derinlemesine anlamak için hayati öneme sahiptir.

Poz tahmini, hayvanlara sensör veya etiket takmadan, görüntüleri ve videoları kullanarak hayvan hareketlerini ve duruşunu izleyerek bu süreci basitleştirir. Bu sistemler, hayvanların duruşlarını otomatik olarak izleyebilir ve tımar, oyun oynama veya kavga etme gibi davranışları hakkında bilgi sağlayabilir. 

Bunun ilginç bir örneği, bilim insanlarının maymun davranışlarını incelemek için poz tahminini kullanmasıdır. Aslında araştırmacılar, altı maymun türünden 71.000'den fazla etiketli görüntü içeren OpenApePose gibi veri kümelerini derlemişlerdir. 

Şekil 5. Maymun poz tahmini.

Poz tahmininin artıları ve eksileri

İşte poz tahmininin çeşitli sektörlere getirebileceği temel faydalardan bazıları:

  • Ölçeklenebilirlik: Poz tahmini sistemleri, akıllı telefonlardan gelişmiş kamera kurulumlarına kadar çok çeşitli cihazlarda konuşlandırılabilir, bu da onları farklı kullanım durumları ve ortamlar için son derece ölçeklenebilir ve erişilebilir kılar.

  • Uygun maliyetli: Poz tahmini normal kameralara dayandığından ve pahalı sensörler veya etiketler gerektirmediğinden, hem araştırma hem de ticari uygulamalarda hareketi izlemek için daha uygun maliyetli bir çözüm olabilir.

  • Sürekli izleme: Poz tahmini sistemleri, rehabilitasyondaki hasta ilerlemesi veya vahşi doğadaki hayvan davranışlarını izleme gibi zaman içindeki değişikliklerin izlenmesine olanak tanıyan sürekli, gerçek zamanlı izleme sağlayabilir.

Poz tahmininin çeşitli alanlardaki avantajları açık olsa da, dikkate alınması gereken bazı zorluklar da vardır. İşte akılda tutulması gereken birkaç temel sınırlama:

  • Sınırlı genelleme: İnsan veri setleri üzerinde eğitilmiş birçok model, belirli veri setleri üzerinde yeniden eğitilmeden hayvanlara veya alışılmadık vücut yapılarına iyi genellenemez.

  • Çevresel sınırlamalar: Performans, yetersiz aydınlatma, hızlı hareket bulanıklığı veya dağınık arka planlar altında düşebilir.
  • Yüksek tıkanıklık hassasiyeti: Özellikle kalabalık sahnelerde veya çok kişili izlemede, vücut parçaları tıkandığında veya çerçeve dışında kaldığında doğruluk düşebilir.

Önemli çıkarımlar

Poz tahmini, ilk günlerinden bu yana uzun bir yol kat etti ve işaretleyiciler kullanan sistemlerden YOLO11 gibi derin öğrenme modelleri tarafından yönlendirilen etkili araçlara dönüştü. İster fizik tedaviyi iyileştirsin, ister etkileşimli AR deneyimlerine güç versin ya da vahşi yaşam araştırmalarına yardımcı olsun, poz tahmini makinelerin hareket ve duruşu anlama şeklini değiştiriyor. Teknoloji ilerlemeye devam ettikçe, sınırlamalarını ele almak, daha da pratik kullanımların kilidini açmanın ve makinelerin bizim ve diğer canlıların nasıl hareket ettiğini daha iyi anlamasını sağlamanın anahtarı olacaktır.

Yapay zeka hakkında meraklı mısınız? GitHub depomuzu keşfedin, topluluğumuzla bağlantı kurun ve bilgisayarla görü projenize başlamak için lisanslama seçeneklerimize göz atın. Çözüm sayfalarımızda perakende sektöründe yapay zeka ve lojistik sektöründe bilgisayarla görü gibi yenilikler hakkında daha fazla bilgi edinin.

Gelin, yapay zekanın geleceğini
birlikte inşa edelim!

Makine öğreniminin geleceği ile yolculuğunuza başlayın

Ücretsiz başlayın