Yolo Vision Shenzhen
Shenzhen
Şimdi katılın

Ultralytics YOLO11 ile el anahtar noktaları tahminini geliştirme

Abirami Vina

6 dakika okuma süresi

5 Mart 2025

Ultralytics YOLO11'in gerçek zamanlı hareket tanıma gibi uygulamalarda poz tahmini desteği ile yapay zeka odaklı el anahtar noktaları tahminini keşfedin.

Son zamanlarda, Super Bowl'daki işaret dili tercümanları çok dikkat çekti. Onları televizyonda en sevdiğiniz sanatçının şarkısını söylerken izlediğinizde, işaret dili biliyorsanız onları anlayabilirsiniz çünkü beyniniz onların el hareketlerini işler. Peki ya aynı şeyi bir bilgisayar yapabilseydi? Yapay zeka odaklı el izleme çözümleri sayesinde, makinelerin el hareketlerini etkileyici bir doğrulukla track ve yorumlaması mümkün.

Bu çözümlerin merkezinde, makinelerin görsel bilgileri işlemesini ve anlamasını sağlayan yapay zekanın bir alt alanı olan bilgisayarla görme yer alıyor. Vision AI, görüntüleri ve videoları analiz ederek nesneleri detect etmelerine, hareketleri track ve karmaşık hareketleri dikkate değer bir doğrulukla tanımalarına yardımcı olur.

Örneğin, bilgisayarla görme modelleri Ultralytics YOLO11 poz tahmini kullanarak gerçek zamanlı olarak el anahtar noktalarını detect etmek ve analiz etmek için eğitilebilir. Böylece bu modeller jest tanıma, işaret dili çevirisi ve AR/VR etkileşimleri gibi uygulamalar için kullanılabilir. 

Bu makalede, YOLO11 'in yapay zeka tabanlı el takibini nasıl sağladığını, eğitim için kullanılan veri kümelerini ve el pozu tahmini için bir modelin nasıl özel olarak eğitileceğini inceleyeceğiz. Ayrıca gerçek dünya uygulamalarına da bakacağız. Hadi başlayalım!

Yapay Zeka tabanlı el anahtar noktaları tespitini anlama

Yapay zeka, bilek, parmak uçları ve parmak eklemleri gibi kilit noktaları tanımlayarak görsel verilerdeki el hareketlerini tanımak ve track için kullanılabilir. Poz tahmini olarak bilinen bir yaklaşım, bilgisayarların kilit noktaları haritalayarak ve zaman içinde nasıl değiştiklerini analiz ederek insan hareketini anlamalarına yardımcı olur. Bu, yapay zeka sistemlerinin vücut duruşunu, jestleri ve hareket modellerini yüksek doğrulukla yorumlamasına olanak tanır.

Bilgisayarla görme modelleri, el üzerindeki kilit noktaları belirlemek ve hareketlerini track için görüntüleri veya videoları analiz ederek bunu mümkün kılar. Bu noktalar haritalandıktan sonra yapay zeka, anahtar noktalar arasındaki uzamsal ilişkileri ve bunların zaman içinde nasıl değiştiğini analiz ederek hareketleri tanıyabilir. 

Örneğin, başparmak ve işaret parmağı arasındaki mesafe azaldığında, yapay zeka bunu bir tutma hareketi olarak yorumlayabilir. Benzer şekilde, kilit noktaların diziler halinde nasıl hareket ettiğini izlemek, karmaşık el hareketlerini tanımlamaya ve hatta gelecekteki hareketleri tahmin etmeye yardımcı olur.

__wf_reserved_inherit
Şekil 1. Bilgisayarlı görü kullanarak bir eldeki kilit noktaları tanımaya bir örnek.

İlginç bir şekilde, el takibi için poz tahmini, akıllı cihazların eller serbest kontrolünden, gelişmiş robotik hassasiyete ve sağlık uygulamalarında yardıma kadar heyecan verici olasılıklar sunmuştur. Yapay zeka ve bilgisayarlı görü gelişmeye devam ettikçe, el takibi teknolojiyi günlük hayatta daha etkileşimli, erişilebilir ve sezgisel hale getirmede daha büyük bir rol oynayacaktır.

Poz tahmini için YOLO11 'i keşfetme

Yapay zeka tabanlı el takibi için bir çözümün nasıl oluşturulacağına geçmeden önce, poz tahminine ve YOLO11 'in bu bilgisayarla görme görevini nasıl desteklediğine daha yakından bakalım. Nesnelerin tamamını tanımlayan standart nesne algılamanın aksine, poz tahmini, hareketi ve duruşu analiz etmek için eklemler, uzuvlar veya kenarlar gibi temel işaretleri tespit etmeye odaklanır. 

Özellikle, Ultralytics YOLO11 gerçek zamanlı poz tahmini için tasarlanmıştır. Hem yukarıdan aşağıya hem de aşağıdan yukarıya yöntemlerinden yararlanarak, insanları verimli bir şekilde algılar ve anahtar noktaları tek adımda tahmin ederek hız ve doğruluk açısından önceki modellerden daha iyi performans gösterir.

YOLO11 , COCO veri kümesi üzerinde önceden eğitilmiş olarak gelir ve baş, omuzlar, dirsekler, bilekler, kalçalar, dizler ve ayak bilekleri dahil olmak üzere insan vücudundaki önemli noktaları tanıyabilir. 

__wf_reserved_inherit
Şekil 2. İnsan pozu tahmini için YOLO11 kullanımı.

İnsan pozu tahmininin ötesinde, YOLO11 hem canlı hem de cansız çeşitli nesneler üzerindeki anahtar noktaları detect etmek için özel olarak eğitilebilir. Bu esneklik, YOLO11 'i çok çeşitli uygulamalar için mükemmel bir seçenek haline getirir.

El Anahtar Noktaları veri kümesine genel bakış

Özel bir model eğitmenin ilk adımı, veri toplamak ve bunları etiketlemek veya projenin ihtiyaçlarına uygun mevcut bir veri kümesi bulmaktır. Örneğin, El Anahtar Noktaları veri kümesi, el takibi ve poz tahmini için Vision AI modellerini eğitmek için iyi bir başlangıç noktasıdır. 26.768 etiketli görüntü ile manuel etiketleme ihtiyacını ortadan kaldırır. 

Ultralytics YOLO11 gibi modelleri eğiterek el hareketlerinin nasıl detect edileceğini ve track hızlı bir şekilde öğrenmek için kullanılabilir. Veri kümesi, bilek, parmaklar ve eklemleri kapsayan el başına 21 anahtar nokta içerir. Ayrıca, veri kümesinin açıklamaları, gerçek zamanlı medya işleme için yapay zeka destekli çözümler geliştirmeye yönelik bir araç olan Google MediaPipe ile oluşturuldu ve hassas ve güvenilir anahtar nokta tespiti sağlandı. 

__wf_reserved_inherit
Şekil 3. El Anahtar Noktaları veri setinde bulunan 21 anahtar nokta.

Bunun gibi yapılandırılmış bir veri kümesi kullanmak zamandan tasarruf sağlar ve geliştiricilerin veri toplama ve etiketleme yerine modellerini eğitmeye ve ince ayar yapmaya odaklanmalarını sağlar. Aslında, veri kümesi zaten eğitim (18.776 resim) ve doğrulama (7.992 resim) alt kümelerine ayrılmıştır ve bu da model performansını değerlendirmeyi kolaylaştırır. 

El pozu tahmini için YOLO11 nasıl eğitilir

YOLO11 'i el pozu tahmini için eğitmek, özellikle modelin kurulumunu ve eğitimini kolaylaştıran Ultralytics Python paketi ile basit bir işlemdir. Hand Keypoints veri kümesi eğitim hattında zaten desteklendiğinden, ekstra biçimlendirme olmadan hemen kullanılabilir, zamandan ve emekten tasarruf sağlar.

İşte eğitim sürecinin nasıl işlediği:

  • Ortamı ayarlayın: İlk adım Ultralytics Python paketini yüklemektir.
  • Hand Keypoints veri setini yükleyin: YOLO11 bu veri setini yerel olarak destekler, böylece otomatik olarak indirilebilir ve hazırlanabilir.
  • Önceden eğitilmiş bir model kullanın: Doğruluğu artırmaya yardımcı olan ve eğitim sürecini hızlandıran önceden eğitilmiş bir YOLO11 poz tahmin modeli ile başlayabilirsiniz.
  • Modeli eğitin: Model, birden fazla eğitim döngüsünden geçerek el anahtar noktalarını detect etmeyi ve track öğrenir.
  • Performansı izleyin: Ultralytics paketi ayrıca doğruluk ve kayıp gibi temel ölçümleri track için yerleşik araçlar sağlayarak modelin zaman içinde gelişmesini sağlamaya yardımcı olur.
  • Kaydet ve dağıt: Model eğitildikten sonra, dışa aktarılabilir ve gerçek zamanlı el izleme uygulamaları için kullanılabilir.

Özel olarak eğitilmiş modelinizi değerlendirme

Özel bir model oluşturma adımlarını incelerken, performansı izlemenin çok önemli olduğunu fark edeceksiniz. Eğitim sırasında ilerlemeyi izlemenin yanı sıra, el anahtar noktalarını doğru bir şekilde tespit ettiğinden ve izlediğinden emin olmak için modeli daha sonra değerlendirmek çok önemlidir. 

Doğruluk, kayıp değerleri ve ortalama ortalama hassasiyetmAP) gibi temel performans ölçümleri, modelin ne kadar iyi performans gösterdiğini değerlendirmeye yardımcı olur. Ultralytics Python paketi, sonuçları görselleştirmek ve tahminleri gerçek ek açıklamalarla karşılaştırmak için yerleşik araçlar sağlayarak iyileştirme alanlarını tespit etmeyi kolaylaştırır.

Modelin performansını daha iyi anlamak için, eğitim günlüklerinde otomatik olarak oluşturulan kayıp eğrileri, kesinlik-geri çağırma grafikleri ve karmaşıklık matrisleri gibi değerlendirme grafiklerini kontrol edebilirsiniz. 

Bu grafikler, aşırı öğrenme (modelin eğitim verilerini ezberlemesi ancak yeni verilerle zorlanması) veya yetersiz öğrenme (modelin doğru bir şekilde performans göstermek için yeterince iyi desen öğrenememesi) gibi sorunları belirlemeye ve doğruluğu artırmak için ayarlamalara rehberlik etmeye yardımcı olur. Ayrıca, modelin gerçek dünya senaryolarında ne kadar iyi çalıştığını görmek için yeni resimler veya videolar üzerinde test edilmesi önemlidir.

Yapay zeka destekli el izleme çözümlerinin uygulamaları

Daha sonra, Ultralytics YOLO11 ile el anahtar noktaları tahmininin en etkili uygulamalarından bazılarını inceleyelim.

YOLO11 ile gerçek zamanlı hareket tanıma

Diyelim ki sadece elinizi sallayarak TV'nizin sesini ayarlayabiliyorsunuz veya basit bir kaydırma hareketiyle akıllı bir ev sisteminde gezinebiliyorsunuz. YOLO11 tarafından desteklenen gerçek zamanlı hareket tanıma özelliği, el hareketlerini gerçek zamanlı olarak doğru bir şekilde algılayarak bu temassız etkileşimleri mümkün kılar. 

Bu, elinizdeki önemli noktaları track ve hareketleri komutlar olarak yorumlamak için yapay zeka kameraları kullanarak çalışır. Derinlik algılayan kameralar, kızılötesi sensörler ve hatta normal web kameraları el hareketlerini yakalarken, YOLO11 farklı hareketleri tanımak için verileri işleyebilir. Örneğin, böyle bir sistem bir şarkıyı değiştirmek için kaydırma hareketi, yakınlaştırmak için çimdikleme hareketi ya da ses seviyesini ayarlamak için dairesel hareket arasındaki farkı anlayabilir.

İşaret dili tanıma için yapay zeka tabanlı el anahtar noktaları tespiti

El takibine yönelik yapay zeka çözümleri, sağır bir kişi ile işaret dili bilmeyen biri arasında sorunsuz iletişimi destekleyebilir. Örneğin, kameralar ve YOLO11 ile entegre edilmiş akıllı cihazlar işaret dilini anında metne veya konuşmaya çevirmek için kullanılabilir. 

YOLO11 gibi gelişmeler sayesinde işaret dili çeviri araçları daha doğru ve erişilebilir hale geliyor. Bu durum yardımcı teknoloji, canlı çeviri hizmetleri ve eğitim platformları gibi uygulamaları etkiliyor. Yapay zeka, iletişim boşluklarını kapatmaya ve iş yerlerinde, okullarda ve kamusal alanlarda kapsayıcılığı teşvik etmeye yardımcı olabilir.

El takibi için bilgisayarla görü: AR ve VR deneyimlerini geliştirme

Hiç bir kontrol cihazı kullanmadan nesneleri tutabildiğiniz bir sanal gerçeklik (VR) oyunu oynadınız mı? Bilgisayar görüşüyle desteklenen el takibi, kullanıcıların artırılmış gerçeklik (AR) ve VR ortamlarında doğal olarak etkileşim kurmasını sağlayarak bunu mümkün kılar. 

__wf_reserved_inherit
Şekil 4. El takibi, AR ve VR uygulamalarının önemli bir parçasıdır.

Ultralytics YOLO11 gibi modellerin kullanıldığı el kilit noktaları tahmini ile yapay zeka, hareketleri gerçek zamanlı olarak izleyerek çimdikleme, yakalama ve kaydırma gibi hareketleri mümkün kılar. Bu da oyun, sanal eğitim ve uzaktan işbirliğini geliştirerek etkileşimleri daha sezgisel hale getiriyor. El izleme teknolojisi geliştikçe, AR ve VR daha da sürükleyici ve gerçekçi hissettirecek. 

Önemli çıkarımlar

Ultralytics YOLO11 ile el kilit noktaları tahmini, yapay zeka odaklı el izleme çözümlerini daha erişilebilir ve güvenilir hale getiriyor. Gerçek zamanlı hareket tanımadan işaret dili yorumlamaya ve AR/VR uygulamalarına kadar, bilgisayar görüşü insan-bilgisayar etkileşiminde yeni olanaklar sunuyor.

Ayrıca, kolaylaştırılmış özel eğitim ve ince ayar süreçleri, geliştiricilerin çeşitli gerçek dünya kullanımları için verimli modeller oluşturmasına yardımcı oluyor. Bilgisayarlı görü teknolojisi geliştikçe, sağlık hizmetleri, robotik, oyun ve güvenlik gibi alanlarda daha da fazla yenilik bekleyebiliriz.

Topluluğumuzla etkileşim kurun ve GitHub depomuzda yapay zeka gelişmelerini keşfedin. Çözüm sayfalarımız aracılığıyla üretimde yapay zekanın ve sağlık hizmetlerinde bilgisayarlı görünün etkisini keşfedin. Lisans planlarımızı inceleyin ve yapay zeka yolculuğunuza bugün başlayın!

Gelin, yapay zekanın geleceğini
birlikte inşa edelim!

Makine öğreniminin geleceği ile yolculuğunuza başlayın

Ücretsiz başlayın