Yolo Vision Shenzhen
Shenzhen
Şimdi katılın

Ultralytics ile diğer Ultralytics YOLO poz tahmini karşılaştırması

Ultralytics , daha iyi insan dışı kilit nokta desteği, daha hızlı yakınsama, geliştirilmiş örtülme yönetimi ve verimli gerçek zamanlı dağıtım ile poz tahminini nasıl iyileştirdiğini keşfedin.

Ultralytics ile bilgisayar görme projelerinizi ölçeklendirin

İletişime geçin

Birinin duruşuna baktığınızda, kambur durup durmadığını, öne eğilip eğilmediğini veya dik durup durmadığını kolayca fark edebilirsiniz. İnsanlar vücudun farklı bölümlerinin birbiriyle nasıl ilişkili olduğunu hızlıca anlayabilirler. 

Bu, günlük yaşamda hareketleri ve vücut dilini yorumlama şeklimizin ayrılmaz bir parçasıdır. Ancak makineler için bu tür görsel anlayış otomatik olarak gerçekleşmez. Bir sisteme hareketleri ve yapıları tanıma becerisi kazandırmak için, görüntüleri anlamlı bir şekilde yorumlayabilmesini sağlayan gelişmiş derin öğrenme ve bilgisayar görme teknikleri gerekir.

Özellikle, poz tahmini, bir bilgisayar görme modelinin benzer bir anlayış oluşturmasını mümkün kılan bir görsel yapay zeka tekniğidir. Model, bir görüntüdeki nesneyi basitçe algılamak yerine, önemli yapısal işaretleri temsil eden kilit noktaları tahmin eder. 

Bu kilit noktalar vücut eklemleri, hayvan uzuvları, makine bileşenleri veya hatta saha köşeleri gibi sabit noktalar olabilir. Bu noktaları belirleyip takip ederek, sistem pozisyon, hizalama ve hareketi yapılandırılmış ve ölçülebilir bir şekilde anlayabilir.

Poz tahmini daha gerçekçi senaryolara uygulandıkça, modeller insan dışı kilit noktaları, karmaşık sahneleri ve özel veri kümelerini daha etkili bir şekilde işlemek zorundadır. Örneğin, Ultralytics gibi son teknoloji modeller, poz tahmini gibi bilgisayar görme görevlerini destekler ve esneklik ve genel performansı artırmak için tasarlanmış mimari ve eğitim iyileştirmeleriyle önceki YOLO modellerini geliştirir.

Şekil 1. YOLO ile mümkün kılınan poz tahminine bir örnek YOLO Kaynak)

Bu makalede, YOLO26-pose'u önceki Ultralytics YOLO modellerine kıyaslayarak, karmaşık sahnelerde esnekliği, yakınsama hızını ve performansı nasıl iyileştirdiğini inceleyeceğiz. Hadi başlayalım!

Poz tahmini nedir?

Karşılaştırmaya geçmeden önce Ultralytics YOLO pose modellerini karşılaştırmaya başlamadan önce, bilgisayar görme bağlamında pose tahmininin gerçekte ne anlama geldiğine daha yakından bakalım.

Poz tahmini, bir görüntü veya video karesinde track anahtar noktaları detect track için kullanılan bir tekniktir. Bu anahtar noktalar, insan vücudundaki eklemler, hayvanların uzuvları, bir makinenin bileşenleri veya bir sahnedeki sabit referans noktaları gibi önemli yapısal işaretleri temsil edebilir. 

Şekil 2. İnsan duruş tahmini kullanarak işçilerin duruşunu tahmin etme (Kaynak)

Bu noktaların koordinatlarını belirleyerek, bir model nesnenin konumunu ve zaman içinde nasıl hareket ettiğini anlayabilir. Görüntünün tamamına tek bir etiket atayan görüntü sınıflandırma veya nesnelerin etrafına sınırlayıcı kutular çizmeye odaklanan nesne algılama modellerinden farklı olarak, poz tahmini yapı ve hareket hakkında daha ayrıntılı uzamsal bilgiler sağlar.

YOLO26-pose'a genel bakış

YOLO26-pose, YOLO26n-pose gibi hafif seçenekler ve YOLO26m-pose, YOLO26l-pose ve YOLO26x-pose gibi daha büyük modeller dahil olmak üzere birçok model çeşidi veya model boyutunda mevcuttur. Bu, ekiplerin donanım ve performans ihtiyaçlarına göre hız ve doğruluk arasında doğru dengeyi seçmelerini sağlar.

Ultralytics , COCO gibi büyük, genel veri setleri üzerinde eğitilmiş önceden eğitilmiş poz modelleri, özellikle insan poz tahmini için COCO(COCO ) açıklamaları sağlar, böylece sıfırdan başlamanıza gerek kalmaz. Çoğu durumda, ekipler bu modelleri kendi veri setleri üzerinde ince ayar yaparak belirli kilit noktalara, düzenlere veya ortamlara uyarlar. 

Bu genellikle, yapılandırılmış bir formatta anahtar nokta koordinatlarını ve sınıf etiketlerini tanımlayan özel açıklama dosyalarının hazırlanmasını içerir. Bu açıklamalar, anahtar noktaları her görüntüdeki belirli piksel koordinatlarına eşler ve modelin eğitim sırasında kesin uzamsal ilişkileri öğrenmesini sağlar.

Önceden eğitilmiş modellerin kullanılması, eğitimi hızlandırır, veri gereksinimlerini azaltır ve projelerin daha verimli bir şekilde üretime geçmesine yardımcı olur. 

İnsan duruş tahminin gerçek dünyadaki uygulamaları

Poz tahmininin önemli bir rol oynadığı bazı gerçek dünya kullanım örneklerine bir göz atalım:

  • Sağlık ve rehabilitasyon: Klinisyenler, fizik tedavi sırasında duruşu değerlendirmek, iyileşme sürecini izlemek ve hareket kalıplarını analiz etmek için poz modellerini kullanabilirler.
  • Otonom sistemler: Dronlar ve akıllı kameralar, poz bilgilerini kullanarak dinamik sahnelerde nesnelerin yönelimini ve hareketini daha iyi anlayabilirler.
  • İşyeri güvenliği: Kuruluşlar, potansiyel güvenlik risklerini belirlemeye yardımcı olmak için vücut pozisyonunu ve tekrarlayan hareketleri izleyebilir.
  • Fitness ve kişisel antrenman: Fitness uygulamaları, track şeklini track , tekrar sayısını hesaplamak ve fitness dersleri sırasında korunan duruş ve hareketler hakkında gerçek zamanlı geri bildirim sağlamak için poz tahminini kullanır.
Şekil 3. Poz tahmini, atletik hareketler sırasında vücudun track noktalarının track yardımcı olabilir. (Kaynak)

Ultralytics poz tahminini destekleme özelliğini keşfetme

Ultralytics , eğitim ve dağıtımı daha pratik hale getirmek için tasarlanmış güncellemelerle önceki Ultralytics YOLO temel alır. 

Önceki sürümler gibi, birleşik bir çerçevenin parçası olarak poz tahminini destekler. Temel fark, YOLO26'nın daha geniş bir yelpazede gerçek dünya kullanım senaryolarında daha esnek ve istikrarlı olacak şekilde tasarlanmış olmasıdır.

Şekil 4. YOLO26'nın karşılaştırmalı değerlendirmesi (Kaynak)

Daha önceki Ultralytics YOLO modelleri, büyük ölçüde insan poz veri kümelerinden etkilenmişti, bu da eski yöntemlerin bir kısmının insan eklem yapıları etrafında optimize edildiği anlamına geliyordu. YOLO26, insanlara özgü bu varsayımları ortadan kaldırıyor. 

Sonuç olarak, tenis kortunun köşelerini veya diğer özel yapısal işaretleri algılamak gibi insan dışı kilit noktaları için daha uygundur. Bu önemli bir husustur, çünkü kullanıma hazır, önceden eğitilmiş YOLO26-pose modelleri COCO gibi veri kümeleri üzerinde eğitilir ve veri kümesi açıklamalarında tanımlanan insan kilit noktalarını tahmin eder. 

Ancak, ekipler makine bileşenleri, spor sahası işaretleri veya altyapı noktaları gibi detect türde yer işaretlerini detect istediklerinde, modelin genellikle bu belirli kilit noktaların işaretlendiği özel bir veri seti üzerinde ince ayar yapılması gerekir.

YOLO26, insan eklem yapıları hakkındaki varsayımlara bağlı olmadığı için, ince ayar sırasında daha etkili bir şekilde uyum sağlayabilir. Bu esneklik, modelin özel anahtar nokta düzenlerini daha güvenilir bir şekilde öğrenmesini sağlar, bu da benzersiz anahtar nokta yapılandırmalarına sahip veri kümelerinde doğrulama yaparken değerlendirme ölçütlerinin iyileştirilmesine yol açar.

YOLO26-pose, bir nesnenin parçaları kısmen gizli olduğunda veya çok küçük ölçekte göründüğünde anahtar nokta konumlandırmasını iyileştirmek için de tasarlanmıştır. Uzak nesnelerin bulunduğu gerçek dünya sahnelerinde, drone çekimlerinde veya küçük nesnelerin bulunduğu senaryolarda, bu, önceki poz modellerine kıyasla daha doğru anahtar nokta tahminlerine yol açabilir.

Bir diğer önemli güncelleme ise eğitim sırasında kullanılan kayıp formülasyonunun iyileştirilmesidir. Kayıp fonksiyonu, modelin öğrenme sürecinde hatalarını nasıl düzelteceğini belirler. 

YOLO26-pose söz konusu olduğunda, bu süreç daha etkilidir ve modelin daha hızlı öğrenmesine ve daha az epoch'ta yüksek doğruluk elde etmesine yardımcı olur. Burada epoch, eğitim veri setinin bir kez tam olarak geçilmesi anlamına gelir.

Genel olarak, YOLO26-pose, aynı tanıdık iş akışını korurken, insan dışı kilit nokta desteği ve eğitim yakınsaması konusunda daha belirgin iyileştirmelerle önceki Ultralytics YOLO modellerini temel almaktadır.

YOLO26-pose ile Ultralytics YOLOv5 karşılaştırma

Ultralytics YOLO en eski sürümü, Ultralytics YOLOv5, öncelikle nesne algılama için geliştirilmiştir. YOLOv5 örnek segmentasyonunu destekleyecek şekilde genişletilmiş olsa da, resmi Ultralytics içinde yerel, özel bir poz tahmin başlığı içermemektedir. 

Anahtar nokta algılamaya ihtiyaç duyan ekipler genellikle ayrı uygulamalara veya özel modifikasyonlara güveniyordu. Ultralytics , anahtar noktaları tahmin etmek için özel olarak tasarlanmış bir mimari başlık ile poz tahminini yerleşik bir görev olarak içerir. 

Bu, YOLO26-pose modellerinin algılama ve segmentasyon ile aynı birleşik iş akışı içinde eğitilebileceği, doğrulanabileceği ve dağıtılabileceği anlamına gelir. Yapısal anahtar nokta algılamaya odaklanan projeler için YOLO26, YOLOv5 hazır olarak YOLOv5 yerel poz desteği ve göreve özel bir mimari sağlar.

Temel farklar: YOLO26-pose ile Ultralytics YOLOv8

Ultralytics YOLOv8 birleştirilmiş Ultralytics içinde yerel poz tahminini tanıtarak, algılama ve segmentasyonla aynı iş akışını kullanarak kilit nokta modellerini eğitmeyi ve dağıtmayı kolaylaştırdı. Bu, maksimum olmayan bastırma (NMS) ile geleneksel bir son işlem boru hattına dayanır ve sınırlayıcı kutu regresyonu ve eğitimi için önceki kayıp formülasyonlarını kullanır.

YOLO26, poz tahminini doğrudan etkileyen mimari ve eğitim güncellemeleriyle bu temeli daha da geliştirir. En önemli farklardan biri uçtan uca tasarımdır. YOLO26, çıkarım NMS harici NMS ihtiyacını ortadan kaldırarak, özellikle CPU'larda ve uç cihazlarda dağıtımı basitleştirir ve gecikme tutarlılığını artırır.

Bir diğer önemli iyileştirme ise eğitim metodolojisinde yapılmıştır. YOLO26, güncellenmiş kayıp stratejileriyle birlikte MuSGD optimizasyon aracını da sunmaktadır. Poz görevleri için, anahtar nokta belirsizliğinin modellenmesini iyileştiren Artık Log-Olasılık Tahmini'ni entegre etmektedir. Bu değişiklikler bir araya geldiğinde, özellikle karmaşık veya kısmen engellenmiş sahnelerde daha hızlı yakınsama ve daha istikrarlı anahtar nokta tahminleri elde edilebilir.

Kısacası, YOLOv8 güçlü ve çok yönlü bir temel oluşturdu. YOLO26-pose, gelişmiş eğitim verimliliği, daha iyi örtülme yönetimi ve gerçek dünyadaki insan dışı poz uygulamaları için daha fazla esneklik ile bu temeli daha da iyileştiriyor.

YOLO26-Pose ile Ultralytics YOLO11: Neler iyileştirildi?

Ultralytics YOLO11Ultralytics YOLOv8 temelYOLOv8 backbone özellik çıkarma katmanlarını iyileştirir. FLOP'ları azaltır, parametre verimliliğini artırır ve güçlü gerçek zamanlı performansı mAP daha yüksek mAP sağlar. Poz görevleri için bu, daha hafif bir mimari ile daha iyi anahtar nokta doğruluğu anlamına gelir.

YOLO26-pose, daha temel bir mimari değişiklikle bu ilerlemeyi sürdürüyor. Basitçe söylemek gerekirse, YOLO11 , YOLOv8 verimliliğini ve doğruluğunu YOLO11 ve YOLO26, daha hızlı yakınsama, daha kararlı çıkarım ve karmaşık senaryolarda iyileştirilmiş poz doğruluğu amaçlayan mimari ve eğitim güncellemeleriyle bu temeli daha da geliştiriyor.

Poz tahmini için neden YOLO26 modelini kullanmaya başlamalısınız?

Ultralytics YOLO farklılıklarını incelerken, YOLO26-pose'a geçip geçmemeyi düşünebilirsiniz.

Kısaca cevaplamak gerekirse, bu kolay bir yükseltmedir. Halihazırda Ultralytics YOLOv8 veya Ultralytics YOLO11 kullanıyorsanız, YOLO26-pose'a geçmek genellikle model sürümünü değiştirmek anlamına gelir, boru hattınızı yeniden oluşturmak anlamına gelmez.

Aynı Ultralytics kullanmaya devam ederken, insan dışı kilit noktalar için daha iyi destek, eğitim sırasında daha hızlı yakınsama ve örtülü noktaların daha iyi işlenmesinden yararlanabilirsiniz. Çoğu yeni ve mevcut poz projesinde, YOLO26-pose'a geçmek, bu iyileştirmeleri minimum sürtünmeyle elde etmenin en kolay yoludur.

Bunun yanı sıra, YOLO26-pose, PyTorch üzerine inşa edilmiş PyTorch eğitim, doğrulama ve dağıtımı kolaylaştıran Ultralytics Python içinde tam olarak desteklenmektedir. Modeller ONNX, TensorRT, OpenVINO, CoreML ve TFLite gibi formatlara aktarılabilir, böylece genel iş akışınızı değiştirmeden GPU'lar, CPU'lar ve uç cihazlara dağıtımı kolaylaştırır.

Önemli çıkarımlar

Ultralytics , özellikle insan dışı kilit noktalar veya karmaşık sahnelerle çalışırken poz tahminini daha esnek ve güvenilir hale getirir. Daha hızlı eğitilir, örtülmeyi daha iyi yönetir ve farklı veri kümelerinde daha tutarlı sonuçlar sunar. Halihazırda Ultralytics YOLO modellerini kullanan ekipler için YOLO26, mevcut iş akışlarını değiştirmeden belirgin iyileştirmeler sunar.

Yapay zeka hakkında daha fazla bilgi edinmek ister misiniz? Topluluğumuza ve GitHub depomuza göz atın. Robotikte yapay zeka ve tarımda bilgisayarlı görü hakkındaki çözüm sayfalarımızı inceleyin. Lisanslama seçeneklerimizi keşfedin ve bilgisayarlı görü ile bugün geliştirmeye başlayın!

Gelin, yapay zekanın geleceğini
birlikte inşa edelim!

Makine öğreniminin geleceği ile yolculuğunuza başlayın

Ücretsiz başlayın