Yolo Vision Shenzhen
Shenzhen
Şimdi katılın

Yapay zeka insan eylemlerini detect edebilir mi? Aktivite tanımayı keşfetmek

Fitness uygulamalarından hasta izlemeye kadar, bilgisayarla görmenin şu soruyu nasıl ele aldığını keşfedin: Yapay zeka gerçek dünya ortamlarında insan eylemlerini detect edebilir mi?

Günlük yaşam, hakkında düşünmek için nadiren durduğumuz küçük hareketlerle doludur. Bir odada yürümek, bir masada oturmak veya bir arkadaşa el sallamak bize zahmetsiz gelebilir, ancak bunları yapay zeka ile tespit etmek çok daha karmaşıktır. İnsanlara doğal gelen şey, bir makine onu anlamaya çalıştığında çok daha karmaşık bir şeye dönüşür.

Bu yetenek insan aktivitesi tanıma (HAR) olarak bilinir ve bilgisayarların insan davranışlarındaki kalıpları detect etmesini ve yorumlamasını sağlar. Bir fitness uygulaması HAR'ın iş başında olduğu harika bir örnektir. Adımları ve egzersiz rutinlerini takip ederek, yapay zekanın günlük aktiviteleri nasıl izleyebileceğini gösterir. 

İnsan eylemi tanımanın potansiyelini gören birçok endüstri bu teknolojiyi benimsemeye başladı. Aslında, insan eylem tanıma pazarının 2033 yılına kadar 12,56 milyar doların üzerine çıkması bekleniyor.

Bu ilerlemenin önemli bir kısmı, makinelerin görüntüler ve videolar gibi görsel verileri analiz etmesini sağlayan bir yapay zeka dalı olan bilgisayarlı görü tarafından yönlendiriliyor. Bilgisayarlı görü ve görüntü tanıma ile HAR, bir araştırma konseptinden, son teknoloji yapay zeka uygulamalarının pratik ve heyecan verici bir parçası haline geldi. 

Bu makalede, HAR'ın ne olduğunu, insan eylemlerini tanımak için kullanılan farklı yöntemleri ve bilgisayarla görmenin soruyu yanıtlamaya nasıl yardımcı olduğunu inceleyeceğiz: Yapay zeka gerçek dünya uygulamalarında insan eylemlerini detect edebilir mi? Hadi başlayalım!

İnsan eylemi tanıma (human action recognition) nedir?

İnsan eylemi tanıma, bilgisayar sistemlerinin vücut hareketlerini analiz ederek insan aktivitelerini veya eylemlerini anlamasını mümkün kılar. Sadece bir görüntüde bir kişiyi tespit etmekten farklı olarak, HAR kişinin ne yaptığını belirlemeye yardımcı olabilir. Örneğin, yürüme ve koşma arasında ayrım yapmak, bir el sallamayı tanımak veya birinin düştüğünü fark etmek.

HAR'ın temeli, hareket ve duruş kalıplarında yatmaktadır. Bir insanın kollarının veya bacaklarının konumlandırılma şeklinde hafif bir değişiklik, çeşitli eylemleri işaret edebilir. HAR sistemleri, bu ince ayrıntıları yakalayıp yorumlayarak, vücut hareketlerinden anlamlı bilgiler elde edebilir.

Bunu başarmak için, insan eylemi tanıma, vücut hareketlerini analiz etmek ve insan eylemlerini daha yüksek doğrulukla yorumlamak için birlikte çalışan makine öğrenimi, derin öğrenme modelleri, bilgisayarlı görü ve görüntü işleme gibi birden fazla teknolojiyi birleştirir. 

Şekil 1. İnsan faaliyetlerinin tanınması bilgisayar bilimlerinin farklı dallarını içerir (Kaynak: cell.com)

​​Önceki HAR sistemleri çok daha sınırlıydı. Kontrollü ortamlarda yalnızca birkaç basit, tekrarlayan eylemi gerçekleştirebiliyorlardı ve genellikle gerçek dünya durumlarında zorlanıyorlardı. 

Günümüzde, yapay zeka ve büyük miktarlardaki video verileri sayesinde, İHA hem doğruluk hem de sağlamlık açısından önemli ölçüde ilerleme kaydetmiştir. Modern sistemler, çok daha yüksek doğrulukla geniş bir aktivite yelpazesini tanıyabilir, bu da teknolojiyi sağlık hizmetleri, güvenlik ve etkileşimli cihazlar gibi alanlar için pratik hale getirir.

İnsan eylemlerini tespit etme yöntemleri

Artık insan eylemlerini tanımanın ne olduğunu daha iyi anladığımıza göre, makinelerin insan eylemlerini detect farklı yollara bir göz atalım. 

İşte yaygın yöntemlerden bazıları:

  • Sensor-based methods (Sensör tabanlı yöntemler): İvmeölçerler, giyilebilir cihazlar ve akıllı telefonlar gibi akıllı cihazlar, sinyalleri doğrudan insan vücudundan yakalayabilir. Yürüme, koşma ve hatta hareketsiz durma gibi hareket kalıplarını gösterebilirler. Bir akıllı saatteki adım sayacı, bu yöntemin harika bir örneğidir.
  • Görme tabanlı yöntemler: Bilgisayar görüşü ile eşleştirilmiş kameralar, vücudun nasıl göründüğünü ve hareket ettiğini kare kare track için görüntüleri ve videoları analiz eder. Bu, daha karmaşık faaliyetlerin tanınmasını sağlar. Hareket kontrollü TV'ler veya oyun sistemleri bu yönteme dayanır.
  • Çok modlu yöntemler: Bir kaynağın diğerinin neyi algıladığını doğrulayabildiği için, sensörlerin ve kameraların birleşimi daha güvenilir bir sistem oluşturur. Örneğin, giyilebilir bir cihaz hareketi kaydedebilirken, bir kamera duruşu doğrulayabilir; bu kurulum genellikle yaşlı bakımı için düşme tespitinde kullanılır.

İnsan aktivitesi tanımada veri kümelerinin rolü

Herhangi bir HAR modeli veya sistemi için veri kümeleri başlangıç noktasıdır. Bir HAR veri kümesi, yürüme, oturma veya el sallama gibi eylemleri yakalayan video klipleri, görüntüler veya sensör verileri gibi örneklerden oluşan bir koleksiyondur. Bu örnekler, insan hareketindeki kalıpları tanımak için yapay zeka modellerini eğitmek için kullanılır ve bu da gerçek hayattaki uygulamalarda uygulanabilir. 

Eğitim verilerinin kalitesi, bir modelin ne kadar iyi performans gösterdiğini doğrudan etkiler. Temiz ve tutarlı veriler, sistemin eylemleri doğru bir şekilde tanımasını kolaylaştırır. 

Bu nedenle veri kümeleri genellikle eğitimden önce önceden işlenir. Yaygın bir adım, değerleri tutarlı bir şekilde ölçeklendirerek hataları azaltan ve aşırı öğrenmeyi (bir modelin eğitim verilerinde iyi performans göstermesi ancak yeni verilerle mücadele etmesi) önleyen normalleştirmedir.

Modellerin eğitim dışındaki performansını ölçmek için araştırmacılar, adil test ve karşılaştırmaya olanak tanıyan değerlendirme metriklerine ve kıyaslama veri kümelerine güvenirler. UCF101, HMDB51 ve Kinetics gibi popüler koleksiyonlar, insan eylemi tespiti için binlerce etiketli video klip içerir. Sensör tarafında ise akıllı telefonlardan ve giyilebilir cihazlardan toplanan veri kümeleri, farklı ortamlarda tanıma modellerini daha sağlam hale getiren değerli hareket sinyalleri sağlar.

Şekil 2. Bir insan aktivitesi tanıma veri kümesine bir bakış. (Kaynak)

Bilgisayarlı görü, insan aktivitesi tanımayı nasıl destekler?

İnsan eylemlerini detect etmenin farklı yolları arasında bilgisayarla görme, hızla en popüler ve en çok araştırılan yöntemlerden biri haline gelmiştir. En önemli avantajı, zengin ayrıntıları doğrudan görüntülerden ve videolardan çekebilmesidir. Piksellere kare kare bakarak ve hareket modellerini analiz ederek, insanların ekstra cihazlar takmasına gerek kalmadan faaliyetleri gerçek zamanlı olarak tanıyabilir.

Derin öğrenmedeki son gelişmeler, özellikle görüntüleri analiz etmek için tasarlanmış evrişimli sinir ağları (CNN'ler), bilgisayarlı görüyü daha hızlı, daha doğru ve daha güvenilir hale getirdi. 

Örneğin, yaygın olarak kullanılan son teknoloji bilgisayarla görme modelleri Ultralytics YOLO11 bu gelişmeler üzerine inşa edilmiştir. YOLO11 nesne algılama, örnek segmentasyonu, video kareleri boyunca insanları izleme ve insan pozlarını tahmin etme gibi görevleri destekleyerek insan aktivitesi tanıma için harika bir araç haline geliyor.

Ultralytics YOLO11'e genel bir bakış

Ultralytics YOLO11 , hem hız hem de hassasiyet için tasarlanmış bir Vision AI modelidir. Nesne algılama, nesne izleme ve poz tahmini gibi temel bilgisayarla görme görevlerini destekler. Bu yetenekler özellikle insan aktivitesi tanıma için kullanışlıdır.

Nesne algılama, bir sahnedeki insanları tanımlar ve konumlandırır, izleme, eylem dizilerini tanımak için video kareleri boyunca hareketlerini takip eder ve poz tahmini, benzer aktiviteleri ayırt etmek veya düşme gibi ani değişiklikleri detect etmek için insan vücudunun temel eklemlerini haritalandırır. 

Örneğin, modelden elde edilen içgörüler, sessizce oturan, ardından ayağa kalkan ve son olarak kollarını tezahürat yapmak için kaldıran biri arasındaki farkı anlamak için kullanılabilir. Bu basit günlük eylemler ilk bakışta benzer görünebilir, ancak bir dizide analiz edildiğinde çok farklı anlamlar taşır.

Şekil 3. Poz tahmini için Ultralytics YOLO11 kullanımı.(Kaynak)

Bilgisayarlı görü ve HAR'ın gerçek dünya uygulamaları

Şimdi de bilgisayarla görme destekli insan aktivite tanımının günlük hayatımızı etkileyen gerçek dünya kullanım durumlarında nasıl uygulandığına daha yakından bakalım.

Sağlık hizmetleri ve esenlik

Sağlık hizmetlerinde, hareketteki küçük değişiklikler bir kişinin durumu hakkında faydalı bilgiler sağlayabilir. Örneğin, yaşlı bir hastanın tökezlemesi veya rehabilitasyon sırasında bir uzvun açısı riskleri veya ilerlemeyi ortaya çıkarabilir. Bu işaretleri geleneksel yöntemlerle, örneğin kontrollerle kaçırmak genellikle kolaydır. 

YOLO11 , hastaları gerçek zamanlı olarak izlemek için poz tahmini ve görüntü analizi kullanarak yardımcı olabilir. Düşmeleri detect etmek, iyileşme egzersizlerini track ve yürüme veya esneme gibi günlük aktiviteleri gözlemlemek için kullanılabilir. Sensörlere veya giyilebilir cihazlara ihtiyaç duymadan görsel analiz yoluyla çalıştığı için, hasta bakımını destekleyen doğru bilgileri toplamanın basit bir yolunu sunar.

Şekil 4. YOLO11'in poz tahmini desteğini kullanarak vücut hareketlerini takip etme.(Kaynak)

Güvenlik ve gözetim

Güvenlik sistemleri, başıboş dolaşan, kısıtlı bir alanda koşan veya ani saldırganlık gösteren biri gibi olağandışı insan faaliyetlerini hızlı bir şekilde tespit etmeye dayanır. Güvenlik görevlilerinin her şeyi manuel olarak izleyemediği yoğun ortamlarda bu işaretler genellikle gözden kaçar. İşte bu noktada bilgisayarla görme ve YOLO11 devreye giriyor. 

YOLO11 , şüpheli hareketleri detect edebilen ve anında uyarılar gönderebilen gerçek zamanlı video gözetimine güç vererek güvenlik izlemeyi kolaylaştırır. Kamusal alanlarda kalabalık güvenliğini destekler ve özel alanlarda izinsiz giriş tespitini güçlendirir. 

Bu yaklaşımla, güvenlik görevlileri bilgisayar görüşü sistemleriyle birlikte çalışarak, şüpheli faaliyetlere daha hızlı ve zamanında yanıt verilmesini sağlayan bir insan-bilgisayar etkileşimi ve ortaklığı oluşturabilir.

HAR için bilgisayar görüşü kullanmanın artıları ve eksileri

İnsan aktivitesi tanıma için bilgisayar görüşü kullanmanın bazı avantajları şunlardır:

  • Ölçeklenebilirlik: Kurulduktan sonra, aynı tanıma sistemi aynı anda birden fazla kişiyi otomatik olarak izleyebilir ve bu da onu sağlık tesislerinde, fabrikalarda ve kamusal alanlarda otomasyon için kullanışlı hale getirir.
  • Gerçek zamanlı işleme: Görüntü işleme yapay zeka çözümleri, video akışlarını gerçekleşirken analiz etmek için kullanılabilir ve daha hızlı yanıtlar sağlar.
  • Non-invaziv izleme: Giyilebilir cihazlar veya sensörlerin aksine, insanların cihaz taşımasını gerektirmez, bu da doğal ve zahmetsiz davranış analizine olanak tanır. 

HAR için bilgisayarla görme kullanmanın birçok faydası olmasına rağmen, dikkate alınması gereken sınırlamalar da vardır. İşte akılda tutulması gereken bazı faktörler:  

  • Gizlilik endişeleri: Video tabanlı izleme, özellikle evler veya işyerleri gibi hassas ortamlarda veri koruma ve onay konularında sorunlar yaratabilir.
  • Olası önyargı: Eğitim veri kümelerinde çeşitlilik yoksa, algoritmalar belirli insan grupları için eylemleri yanlış yorumlayabilir ve bu da adil olmayan veya yanlış sonuçlara yol açabilir.
  • Çevresel hassasiyet: Zayıf aydınlatma, arka plan karmaşası veya insanların kısmen gizlenmesi nedeniyle doğruluk düşebilir, bu da sistemlerin dikkatlice tasarlanması gerektiği anlamına gelir.

Önemli çıkarımlar

Yapay zeka ve bilgisayarlı görü, makinelerin insan eylemlerini daha doğru ve gerçek zamanlı olarak tanımasını mümkün kılıyor. Video karelerini ve hareket kalıplarını analiz ederek, bu sistemler hem günlük hareketleri hem de ani değişiklikleri belirleyebilir. Teknoloji gelişmeye devam ettikçe, insan aktivitesi tanıma araştırma laboratuvarlarının ötesine geçiyor ve sağlık hizmetleri, güvenlik ve günlük uygulamalar için pratik bir araç haline geliyor.

GitHub depomuzu ziyaret ederek ve topluluğumuza katılarak yapay zeka hakkında daha fazla bilgi edinin. Robotikte yapay zeka ve üretimde bilgisayarlı görü hakkında bilgi edinmek için çözüm sayfalarımıza göz atın. Görüntü İşleme ile başlamak için lisanslama seçeneklerimizi keşfedin.

Gelin, yapay zekanın geleceğini
birlikte inşa edelim!

Makine öğreniminin geleceği ile yolculuğunuza başlayın

Ücretsiz başlayın