OpenPose nedir? Poz tahmininin temelleri

Günümüzde, görüntüler ve kameralar her yerde; telefonlarımıza, evlerimize ve hatta kamusal alanlara yerleştirilmiş durumda. Bunlara sadece anları yakalamak için değil, aynı zamanda etrafımızdaki dünyayı anlamamıza ve etkileşim kurmamıza yardımcı olmaları için de güveniyoruz.

Perde arkasında, yapay zekanın (AI) bir alt alanı olan bilgisayar görüşü, makinelerin görsel verileri yorumlamasını sağlayarak bunu mümkün kılar. Sistemlerin nesneleri detect , yüzleri tanımasını ve hareketleri track etmesini sağlayarak her gün kullandığımız birçok teknolojide önemli bir rol oynar.

Yapay zekadaki son gelişmeler sayesinde, bilgisayar görüşü modelleri artık daha karmaşık verileri ve içgörüleri analiz edebilir ve çıkarabilir. Bunun bir örneği, insan hareketini anlamaya odaklanan bir bilgisayar görüşü görevi olan poz tahmini'dir.

Görüntülerde veya videolarda omuzlar, dirsekler ve dizler gibi vücuttaki kilit noktaları belirleyerek çalışır. Bu, insanların nasıl hareket ettiğini analiz etmeyi mümkün kılar ve fitness takibi, animasyon, sağlık hizmetleri ve daha fazlası gibi uygulamaları etkinleştirir.

Poz tahmini için geliştirilen birçok araç arasında OpenPose önemli bir atılım olarak öne çıkıyor. Carnegie Mellon Üniversitesi'ndeki Algısal Hesaplama Laboratuvarı'ndaki araştırmacılar tarafından oluşturulan bu sistem, yalnızca bir kamera kullanarak (kişi başına 135'e kadar anahtar nokta ile) gerçek zamanlı olarak birden fazla kişi için eller, ayaklar ve yüz anahtar noktaları dahil olmak üzere tüm vücut pozlarını tespit edebilen ilk açık kaynaklı sistemlerden biriydi.

Bu makalede, OpenPose'u, nasıl çalıştığını ve bilgisayarlı görüde bir kilometre taşı olarak önemini inceleyeceğiz.

Şekil 1. OpenPose kullanılarak çok kişili poz tahmini.

‍

Poz kestirimi tarihine bir bakış

Yapay zeka yaygın olarak benimsenmeden önce, videolarda insan hareketini izlemek özel ekipman kullanmayı içeriyordu. Film ve animasyon gibi endüstrilerde, aktörler genellikle kameraların hareketlerini kontrollü bir stüdyo ortamında yakalayabilmesi için yansıtıcı işaretlere sahip giysiler giyerlerdi.

Bu işaretleyici tabanlı hareket yakalama teknikleri doğru olsa da pahalıydı ve belirli kurulumlarla sınırlıydı. Bilgisayar görüşü geliştikçe, araştırmacılar işaretleyici kullanmadan vücut hareketini track yollarını aradılar. Görüntülerdeki insan şekillerini bulmak için kenarları, konturları ve şablonları kullandılar.

Bu erken sistemler basit ve anlaşılır durumlarda çalıştı, ancak gerçek dünya senaryolarında zorlandı. İnsanlar beklenmedik şekillerde hareket ettiğinde veya bir karede birden fazla kişi göründüğünde genellikle kötü sonuçlar verdiler.

2010'ların sonlarında, derin öğrenme poz tahmini için büyük bir değişim getirdi. Görü yapay zeka modelleri, insan pozlarının büyük veri kümelerinde eğitilebilirdi. Modeller, kenarlara ve şablonlara güvenmek yerine, binlerce etiketli görüntüyü inceleyerek vücut eklemlerini ve yapısını tanımayı öğrendi. Bu, poz tahminini daha doğru, esnek ve daha geniş bir ortam yelpazesinde etkili hale getirdi.

Şekil 2. 2017'den 2023'e insan poz tahmini modellerinin evrimi.

‍

OpenPose: Modern poz kestiriminin başladığı yer

OpenPose ilk olarak 2017'de yayınlandı ve tek bir görüntüde aynı anda birden fazla kişinin pozunu tahmin edebiliyor. Eski sistemlerin aksine OpenPose, özel kıyafetler veya işaretleyiciler gerektirmez. Standart kameralarla çalışır ve görüntüleri ve videoları gerçek zamanlı olarak işleyebilir. Bu özellikler, poz kestirimini geliştiriciler ve araştırmacılar için daha erişilebilir hale getirdi.

OpenPose'un bilgisayar görüşü için attığı temel, diğerlerinin çeşitli diğer uygulamalar için daha yeni mimariler oluşturmasına yardımcı oldu. Bugün, Ultralytics YOLO8 gibi Vision AI modelleri ve Ultralytics YOLO11 Poz tahmini görevlerini destekleyen bu sistemler daha hızlı sonuçlar ve daha düşük gecikme süresi sunar.

Şekil 3. Poz tahmini için YOLO11 kullanımı.

‍

Ancak, poz tahmini konusundaki gelişmeleri merak ediyorsanız, OpenPose harika bir başlangıç noktasıdır. Birçok yeni sistemin hala güvendiği temel fikirleri tanıttı.

OpenPose'un temel yetenekleri

OpenPose'un neden önemli olduğunu daha iyi anladığımıza göre, aslında neler yapabileceğine daha yakından bakalım.

OpenPose'un yeteneklerinin merkezinde anahtar nokta tespiti denen bir şey vardır. Kilit noktalar, insan vücudunda burun ucu, omuzların merkezi, dirsekler, bilekler, kalçalar, dizler ve ayak bilekleri gibi belirli yer işaretleridir. OpenPose, parmaklar ve yüz özellikleri gibi ayrıntılı alanlar da dahil olmak üzere kişi başına bu noktalardan 135 adede kadarını detect edebilir.

Bu noktalar birleştirildiğinde, insan vücudunun basitleştirilmiş bir temsilini oluştururlar - bunu dijital bir iskelet olarak düşünebilirsiniz. Bu iskelet taslağı sadece bir kişinin nerede olduğunu değil, aynı zamanda nasıl durduğunu da gösterir: oturuyor mu, ayakta mı, el sallıyor mu, gülümsüyor mu veya yürüyor mu. Bilgisayarlar, tıpkı içgüdüsel olarak birinin vücut dilini anladığımız gibi, bu iskeletleri kullanarak insan hareketini görsel olarak yorumlayabilir.

İskelet takibi özellikle kullanışlıdır, çünkü arka plan gürültüsünü ve dikkat dağıtıcı unsurları ortadan kaldırarak sistemin tamamen insan duruşu ve hareketine odaklanmasını sağlar. OpenPose, her pikseli analiz etmek yerine, bir kişinin nasıl hareket ettiğini veya etkileşimde bulunduğunu anlatan anlamlı noktalara odaklanır.

OpenPose, bu yapılandırılmış bilgiyi günlük görüntülerden veya videolardan çıkararak, jestlere yanıt veren, fiziksel aktiviteyi izleyen, duygusal ipuçlarını değerlendiren veya hatta dijital karakterleri canlandıran uygulamalar oluşturmayı mümkün kılar.

OpenPose nasıl çalışır?

İşte OpenPose'un görsel girdiden insan vücudundaki kilit noktaları nasıl tespit edip bağladığına dair bir genel bakış:

Bir görüntüyle başlar: OpenPose, bir fotoğraf, video veya canlı kamera akışından tek bir görüntü alır.
‍
Önemli vücut kısımlarını tespit eder: Sistem, burun, dirsekler, bilekler, dizler ve ayak bilekleri gibi vücuttaki kilit noktaları arar. Sistem bir vücut parçasının bulunduğundan emin olduğu her yerde işaretlenirler.
‍
Hangi parçaların bir araya gittiğini çözer: Ardından, OpenPose anahtar noktalarının nasıl bağlandığını kontrol eder. Hangi eklemlerin aynı kişiye ait olduğuna karar vermek için matematiksel hesaplamalar kullanır - örneğin, bir bileği sağ dirsek ve omuzla eşleştirmek gibi.
‍
Her kişi için bir iskelet çizer: OpenPose, anahtar noktaları gruplandırdıktan sonra, her kişinin pozunu gösteren bir "çöp adam" şeklinde birleştirir. Bu, aynı karede birden fazla kişi göründüğünde bile işe yarar.
‍
Poz verilerini döndürür: Son olarak, algılanan tüm anahtar noktalarının kesin konumlarını sağlar. Bunlar, hareketi izlemek, hareketleri tanımak veya etkileşimli araçlar oluşturmak için kullanılabilir - hepsi gerçek zamanlı olarak.

Şekil 4. OpenPose kullanılarak insan anahtar nokta tespiti ve takibi.

‍

OpenPose kullanarak sektörlerdeki poz tahmini uygulamaları

OpenPose, poz kestirimini çeşitli gerçek dünya kullanım durumları için pratik hale getiren ilk gelişmiş araçlardan biriydi. Günümüzde gerçek zamanlı bilgisayarlı görü çözümlerinde yaygın olarak kullanılmasa da, spor, eğlence, eğitim ve güvenlik gibi alanlardaki erken çalışmalara şekil vermede önemli bir rol oynadı.

Bu alanlarda yol açmasına nasıl yardımcı olduğuna daha yakından bakalım.

Fitness ve spor için OpenPose ile poz tahmini

Beyzbol izlediğinizde, neler olup bittiğini anlamak kolaydır - bir atışı, bir vuruşu veya çalınan bir kaleyi anında tanıyabilirsiniz. İnsanlar olarak, vücut hareketlerini sezgisel olarak okur ve çok çaba harcamadan anlamlandırırız. Ancak makineler için bu eylemleri tanımak çok daha karmaşıktır. Vücudun her bir parçasının uzayda nasıl hareket ettiğine dair kesin bilgilere ihtiyaçları vardır.

OpenPose, bilgisayarlı görü alanında önemli bir adımdı. Çeşitli ortamlarda atletik formun analiz edilmesi için pratik bir araçtı.

Birçok araştırma projesi, oyuncuların nasıl hareket ettiğine bağlı olarak belirli beyzbol hareketlerini sınıflandırarak, vuruşlar ve atlayışlar gibi hareketleri analiz etmek için OpenPose'u kullandı. Standart video ile açık ortamlarda çalıştığı için, araştırmacıların bu tür sistemlerin gerçek dünya eğitim veya koçluk senaryolarında nasıl işleyebileceğini test etmelerine olanak sağladı.

Bu erken çalışmalar, günümüzde gelişmiş spor teknolojisinde kullanılan performans izleme araçlarının temelini atmaya yardımcı oldu.

Şekil 5. OpenPose kullanılarak beyzbol aksiyon sınıflandırma hattına bir bakış.

‍

Güvenlik ve emniyet sistemlerinde OpenPose kullanmak

Benzer şekilde, araştırmacılar ayrıca video tabanlı poz takibinin güvenlik izlemesini nasıl destekleyebileceğini araştırmak için OpenPose'u kullandılar. Kamusal alanlarda düşmeler, beklenmedik hareketler veya hareket kalıpları gibi davranışları tespit etmede test edildi.

Standart kameralarla çalıştığı için OpenPose, hastaneler ve ulaşım merkezleri gibi ortamlarda erken dönem denemeleri daha erişilebilir hale getirdi. Bu çalışmalar, artık gözetim, düşme algılama ve acil durum müdahale sistemlerinde kullanılan daha yeni modellerin geliştirilmesine yardımcı oldu.

Şekil 6. OpenPose ile sağlanan düşme tespiti.

‍

OpenPose'un artıları ve eksileri

İşte OpenPose'un sunduğu bazı avantajlara kısa bir bakış:

Araştırma ve prototipleme için kullanışlıdır: Özellikle insan-bilgisayar etkileşimi, biyomekanik ve davranışsal analiz gibi alanlarda akademik araştırmalarda yaygın olarak kullanılmıştır.
‍
Çapraz platform desteği: Hem merkezi işlem birimleri (CPU'lar) hem de grafik işlem birimleri (GPU'lar) için destekle Windows, Linux ve macOS'ta çalıştırılabilir.
‍
Çevrimdışı işleme yeteneği: İnternet erişimi olmayan ortamlarda çalışabilir, bu da onu sağlık veya eğitim gibi gizliliğe duyarlı ayarlar için ideal hale getirir.

OpenPose önemli bir adım olmasına rağmen, akılda tutulması gereken teknik sınırlamaları da vardır. İşte OpenPose ile ilişkili temel zorluklardan bazıları:

Yüksek işlem gereksinimleri: OpenPose'u gerçek zamanlı olarak çalıştırmak için güçlü bir GPU ve önemli bilgi işlem kaynakları gerekir.
‍
Sensitive to environment (Ortama duyarlı):Performans, düşük ışıkta, kalabalık alanlarda veya kamera açıları ideal olmadığında düşebilir.
‍
Daha yeni modellere kıyasla ağır: Daha yeni poz tahmini modelleriyle karşılaştırıldığında, OpenPose nispeten büyük ve daha yavaştır. Akıllı telefonlar, tabletler veya gömülü sistemler gibi kaynakları kısıtlı cihazlarda dağıtım için uygun değildir.

Önemli çıkarımlar

OpenPose, poz kestiriminin daha erişilebilir hale gelmesinde önemli bir rol oynadı. Vücut hareketlerini izlemenin, özel kıyafetlere veya ekipmanlara ihtiyaç duymadan, basit bir kamera ile yapılabileceğini gösterdi.

Sağlık, eğitim, eğlence ve araştırma gibi birçok pratik uygulamanın temelini atmıştır. Daha yeni modeller artık daha yüksek hızlar ve daha hafif performans sunsa da, OpenPose, poz kestiriminin nasıl geliştiğini anlamak için önemli bir referans noktası olmaya devam ediyor.

Yapay zeka hakkında daha fazla bilgi edinmek için topluluğumuza katılın ve GitHub depomuzu ziyaret edin. Kendi bilgisayarlı görü çözümlerinizi oluşturmak istiyorsanız, lisanslama seçeneklerimizi keşfedin. Ayrıca, sağlık hizmetlerinde bilgisayarlı görü ve lojistikte yapay zeka alanlarının nasıl bir etki yarattığını da inceleyin!

OpenPose nedir? Poz kestiriminde bir kilometre taşını keşfetmek

Poz kestirimi tarihine bir bakış

OpenPose: Modern poz kestiriminin başladığı yer

OpenPose'un temel yetenekleri

OpenPose nasıl çalışır?

OpenPose kullanarak sektörlerdeki poz tahmini uygulamaları

Fitness ve spor için OpenPose ile poz tahmini

Güvenlik ve emniyet sistemlerinde OpenPose kullanmak

OpenPose'un artıları ve eksileri

Önemli çıkarımlar

Bu kategoride daha fazla okuyun

Monoküler derinlik tahmini nedir? Genel bakış

Görüntü işleme nedir? Kısa bir giriş

Şablon eşleştirme nedir? Hızlı kılavuz

Gelin, yapay zekanın geleceğini
birlikte inşa edelim!

OpenPose nedir? Poz kestiriminde bir kilometre taşını keşfetmek

Poz kestirimi tarihine bir bakış

OpenPose: Modern poz kestiriminin başladığı yer

OpenPose'un temel yetenekleri

OpenPose nasıl çalışır?

OpenPose kullanarak sektörlerdeki poz tahmini uygulamaları

Fitness ve spor için OpenPose ile poz tahmini

Güvenlik ve emniyet sistemlerinde OpenPose kullanmak

OpenPose'un artıları ve eksileri

Önemli çıkarımlar

Bu kategoride daha fazla okuyun

Monoküler derinlik tahmini nedir? Genel bakış

Görüntü işleme nedir? Kısa bir giriş

Şablon eşleştirme nedir? Hızlı kılavuz

Gelin, yapay zekanın geleceğini birlikte inşa edelim!

Gelin, yapay zekanın geleceğini
birlikte inşa edelim!