YOLO26 ile tanış: yeni nesil görsel AI.
Ultralytics
Yapay Zeka Görüşü

Yapay zeka insan eylemlerini algılayabilir mi? Aktivite tanımayı keşfetmek

Fitness uygulamalarından hasta takibine kadar, bilgisayarlı görü'nün şu soruya nasıl yanıt verdiğini keşfet: yapay zeka gerçek dünya ortamlarında insan eylemlerini algılayabilir mi?

ABAbirami Vina
6 min read
Aktivite tanıma yoluyla insan eylemlerini algılayan yapay zeka

Günlük yaşam, üzerinde düşünmek için nadiren durduğumuz küçük hareketlerle doludur. Bir odada yürümek, masada oturmak veya bir arkadaşa el sallamak bize zahmetsiz gelebilir, ancak bunları yapay zeka ile algılamak çok daha karmaşıktır. İnsanlar için doğal olan şeyler, bir makine tarafından anlaşılmaya çalışıldığında çok daha karmaşık bir hale gelir.

Bu yetenek, insan eylemi tanıma (HAR) olarak bilinir ve bilgisayarların insan davranışlarındaki modelleri algılamasını ve yorumlamasını sağlar. Bir fitness uygulaması, HAR'ın iş başındaki harika bir örneğidir. Adımları ve antrenman rutinlerini takip ederek, yapay zekanın günlük aktiviteleri nasıl izleyebileceğini gösterir.

HAR'ın potansiyelini gören birçok endüstri bu teknolojiyi benimsemeye başladı. Hatta insan eylem tanıma pazarının 2033 yılına kadar 12,56 milyar doların üzerine çıkması bekleniyor.

Bu ilerlemenin önemli bir kısmı, makinelerin görüntüler ve videolar gibi görsel verileri analiz etmesini sağlayan bir yapay zeka dalı olan bilgisayarlı görü ile desteklenmektedir. Bilgisayarlı görü ve görüntü tanıma ile HAR, bir araştırma kavramından ileri düzey yapay zeka uygulamalarının pratik ve heyecan verici bir parçasına dönüştü.

Bu makalede HAR'ın ne olduğunu, insan eylemlerini tanımak için kullanılan farklı yöntemleri ve bilgisayarlı görünün şu soruya nasıl yanıt verdiğini keşfedeceğiz: Yapay zeka gerçek dünya uygulamalarında insan eylemlerini algılayabilir mi? Hadi başlayalım!

Link to this sectionİnsan eylemi tanıma nedir?#

İnsan eylemi tanıma, bilgisayar sistemlerinin vücut hareketlerini analiz ederek insan aktivitelerini veya eylemlerini anlamasını mümkün kılar. Bir görüntüdeki kişiyi algılamaktan farklı olarak, HAR kişinin ne yaptığını tanımlamaya yardımcı olabilir. Örneğin, yürümek ile koşmak arasında ayrım yapmak, el sallamayı tanımak veya birinin düştüğünü fark etmek gibi.

HAR'ın temeli, hareket ve duruş modellerinde yatar. Bir insanın kollarının veya bacaklarının konumlanma biçimindeki küçük bir değişiklik, çeşitli eylemlere işaret edebilir. Bu incelikli detayları yakalayıp yorumlayarak, HAR sistemleri vücut hareketlerinden anlamlı bilgiler elde edebilir.

Bunu başarmak için insan eylemi tanıma; makine öğrenimi, derin öğrenme modelleri, bilgisayarlı görü ve vücut hareketlerini analiz edip insan eylemlerini daha yüksek doğrulukla yorumlamak için birlikte çalışan görüntü işleme gibi birden fazla teknolojiyi birleştirir.

İnsan aktivite tanıma, bilgisayar biliminin farklı dallarını kapsar

Şekil 1. İnsan aktivitesi tanıma, bilgisayar biliminin farklı dallarını içerir (Kaynak: cell.com)

Daha önceki HAR sistemleri çok daha sınırlıydı. Sadece kontrollü ortamlarda birkaç basit, tekrarlayan eylemi yönetebiliyorlardı ve genellikle gerçek dünya durumlarında zorlanıyorlardı.

Bugün, yapay zeka ve büyük miktardaki video verileri sayesinde HAR, hem doğruluk hem de dayanıklılık açısından önemli ölçüde ilerledi. Modern sistemler, çok çeşitli aktiviteleri çok daha yüksek doğrulukla tanıyabiliyor, bu da teknolojiyi sağlık, güvenlik ve etkileşimli cihazlar gibi alanlar için pratik hale getiriyor.

Link to this sectionİnsan eylemlerini algılamanın farklı yöntemleri#

Artık insan eylemi tanımanın ne olduğuna dair daha iyi bir anlayışa sahip olduğumuza göre, makinelerin insan eylemlerini algılayabileceği farklı yollara bir göz atalım.

İşte yaygın yöntemlerden bazıları:

  • Sensör tabanlı yöntemler: İvmeölçerler, giyilebilir cihazlar ve akıllı telefonlar gibi akıllı cihazlar, sinyalleri doğrudan insan vücudundan alabilir. Yürümek, koşmak ve hatta hareketsiz durmak gibi hareket modellerini gösterebilirler. Bir akıllı saatteki adım sayar, bu yöntemin harika bir örneğidir.
  • Görü tabanlı yöntemler: Bilgisayarlı görü ile eşleştirilmiş kameralar, vücudun nasıl göründüğünü ve kare kare nasıl hareket ettiğini takip etmek için görüntüleri ve videoları analiz eder. Bu, daha karmaşık aktivitelerin tanınmasını sağlar. Hareket kontrollü televizyonlar veya oyun sistemleri bu yönteme dayanır.
  • Çok modlu yöntemler: Bir kaynağın diğerinin algıladığını doğrulayabildiği için daha güvenilir bir sistem oluşturan sensör ve kamera kombinasyonudur. Örneğin, bir giyilebilir cihaz hareketi kaydederken bir kamera duruşu doğrulayabilir; bu düzenek genellikle yaşlı bakımında düşme algılamada kullanılır.

Link to this sectionİnsan aktivitesi tanımada veri setlerinin rolü#

Herhangi bir HAR modeli veya sistemi için veri setleri başlangıç noktasıdır. Bir HAR veri seti; yürümek, oturmak veya el sallamak gibi eylemleri yakalayan video klipleri, görüntüler veya sensör verileri gibi örneklerin bir koleksiyonudur. Bu örnekler, yapay zeka modellerini insan hareketindeki modelleri tanımaları için eğitmek amacıyla kullanılır ve daha sonra gerçek hayat uygulamalarında uygulanabilir.

Eğitim verilerinin kalitesi, bir modelin ne kadar iyi performans gösterdiğini doğrudan etkiler. Temiz ve tutarlı veriler, sistemin eylemleri doğru bir şekilde tanımasını kolaylaştırır.

Bu nedenle veri setleri genellikle eğitimden önce ön işlemden geçirilir. Yaygın bir adım, hataları azaltmak ve aşırı uyumu (modelin eğitim verilerinde iyi performans gösterip yeni verilerle zorlanması) önlemek için değerleri tutarlı bir şekilde ölçeklendiren normalleştirmedir.

Modellerin eğitim ötesinde nasıl performans gösterdiğini ölçmek için araştırmacılar, adil test ve karşılaştırmaya olanak tanıyan değerlendirme metriklerine ve kıyaslama veri setlerine güvenirler. UCF101, HMDB51 ve Kinetics gibi popüler koleksiyonlar, insan eylemi algılama için binlerce etiketli video klibi içerir. Sensör tarafında ise akıllı telefonlardan ve giyilebilir cihazlardan toplanan veri setleri, tanıma modellerini farklı ortamlarda daha dayanıklı hale getiren değerli hareket sinyalleri sağlar.

Bir insan aktivite tanıma veri setine kısa bir bakış

Şekil 2. Bir insan aktivitesi tanıma veri setine kısa bir bakış. (Kaynak)

Link to this sectionBilgisayarlı görü, insan aktivitesi tanımayı nasıl destekler#

İnsan eylemlerini algılamanın farklı yolları arasında, bilgisayarlı görü hızla en popüler ve üzerinde en çok araştırma yapılan yöntemlerden biri haline geldi. Temel avantajı, görüntülerden ve videolardan zengin detayları doğrudan çıkarabilmesidir. Piksellere kare kare bakarak ve hareket modellerini analiz ederek, insanların fazladan cihaz taşımasına gerek kalmadan aktiviteleri gerçek zamanlı olarak tanıyabilir.

Derin öğrenmedeki son gelişmeler, özellikle görüntüleri analiz etmek için tasarlanan evrişimli sinir ağları (CNN'ler), bilgisayarlı görüyü daha hızlı, daha doğru ve daha güvenilir hale getirdi.

Örneğin, yaygın olarak kullanılan son teknoloji bilgisayarlı görü modelleri olan Ultralytics YOLO11 bu ilerlemeler üzerine inşa edilmiştir. YOLO11; nesne algılama, örnek segmentasyonu, insanları video karelerinde takip etme ve insan duruşlarını tahmin etme gibi görevleri destekler, bu da onu insan aktivitesi tanıma için harika bir araç haline getirir.

Link to this sectionUltralytics YOLO11'e genel bakış#

Ultralytics YOLO11, hem hız hem de hassasiyet için tasarlanmış bir görü yapay zeka modelidir. Nesne algılama, nesne takibi ve duruş tahmini gibi temel bilgisayarlı görü görevlerini destekler. Bu yetenekler, özellikle insan aktivitesi tanıma için kullanışlıdır.

Nesne algılama, bir sahnedeki insanları tanımlar ve konumlandırır; takip, eylem dizilerini tanımak için hareketlerini video kareleri boyunca izler; duruş tahmini ise benzer aktiviteler arasında ayrım yapmak veya bir düşme gibi ani değişiklikleri algılamak için temel insan vücudu eklemlerini eşler.

Örneğin, modelden elde edilen içgörüler; birinin sessizce otururken ayağa kalkması ve ardından neşeyle kollarını kaldırması arasındaki farkı söylemek için kullanılabilir. Bu basit günlük eylemler ilk bakışta benzer görünebilir, ancak bir dizi halinde analiz edildiğinde çok farklı anlamlar taşır.

Poz tahmini için Ultralytics YOLO11 kullanma

Şekil 3. Duruş tahmini için Ultralytics YOLO11 kullanma. (Kaynak)

Link to this sectionBilgisayarlı görü ve HAR'ın gerçek dünya uygulamaları#

Şimdi, bilgisayarlı görü tarafından desteklenen insan aktivitesi tanımanın günlük hayatımızı etkileyen gerçek dünya kullanım senaryolarında nasıl uygulandığına daha yakından bakalım.

Link to this sectionSağlık ve esenlik#

Sağlık alanında, hareketlerdeki küçük değişiklikler bir kişinin durumu hakkında yararlı içgörüler sağlayabilir. Örneğin, yaşlı bir hastanın tökezlemesi veya rehabilitasyon sırasında bir uzvun açısı, riskleri veya ilerlemeyi ortaya çıkarabilir. Bu belirtiler, kontroller gibi geleneksel yollarla genellikle gözden kaçabilir.

YOLO11, hastaları gerçek zamanlı olarak izlemek için duruş tahmini ve görüntü analizini kullanarak yardımcı olabilir. Düşmeleri algılamak, iyileşme egzersizlerini takip etmek ve yürümek veya esnemek gibi günlük aktiviteleri gözlemlemek için kullanılabilir. Sensörlere veya giyilebilir cihazlara ihtiyaç duymadan görsel analiz yoluyla çalıştığı için, hasta bakımını destekleyen doğru bilgileri toplamanın basit bir yolunu sunar.

YOLO11 poz tahmini kullanarak vücut hareketlerini izleme

Şekil 4. YOLO11'in duruş tahmini desteğini kullanarak vücut hareketlerini izleme. (Kaynak)

Link to this sectionGüvenlik ve gözetim#

Güvenlik sistemleri, birinin izinsiz dolaşması, kısıtlı bir alanda koşması veya ani saldırganlık göstermesi gibi olağandışı insan aktivitelerini hızlı bir şekilde algılamaya dayanır. Bu işaretler, güvenlik görevlilerinin her şeyi manuel olarak izleyemediği yoğun ortamlarda genellikle gözden kaçar. Bilgisayarlı görü ve YOLO11'in devreye girdiği yer burasıdır.

YOLO11, şüpheli hareketleri algılayabilen ve anında uyarı gönderebilen gerçek zamanlı video gözetimi sağlayarak güvenlik izlemeyi kolaylaştırır. Kamusal alanlarda kalabalık güvenliğini destekler ve özel alanlarda izinsiz giriş algılamayı güçlendirir.

Bu yaklaşımla güvenlik görevlileri, bilgisayarlı görü sistemleriyle yan yana çalışarak, şüpheli aktivitelere daha hızlı ve zamanında yanıt verilmesini sağlayan bir insan-bilgisayar etkileşimi ve ortaklığı oluşturabilir.

Link to this sectionİnsan eylemi tanıma için bilgisayarlı görü kullanmanın artıları ve eksileri#

İnsan eylemi tanıma için bilgisayarlı görü kullanmanın avantajlarından bazıları şunlardır:

  • Ölçeklenebilirlik: Bir kez kurulduğunda, aynı tanıma sistemi aynı anda birden fazla kişiyi otomatik olarak izleyebilir; bu da onu sağlık tesislerinde, fabrikalarda ve kamusal alanlarda otomasyon için kullanışlı hale getirir.
  • Gerçek zamanlı işleme: Görü yapay zeka çözümleri, video akışlarını gerçekleştikleri anda analiz etmek için kullanılabilir ve daha hızlı yanıtlar sağlar.
  • İnvaziv olmayan takip: Giyilebilir cihazların veya sensörlerin aksine, insanların cihaz taşımasını gerektirmez; bu da doğal ve zahmetsiz davranış analizine olanak tanır.

İnsan eylemi tanıma için bilgisayarlı görü kullanmanın birçok faydası olsa da, dikkate alınması gereken sınırlamalar da vardır. İşte akılda tutulması gereken bazı faktörler:

  • Gizlilik endişeleri: Video tabanlı izleme, özellikle evler veya iş yerleri gibi hassas ortamlarda veri koruması ve onay konusunda sorunlar yaratabilir.
  • Potansiyel önyargı: Eğitim veri setleri çeşitlilikten yoksunsa, algoritmalar belirli insan grupları için eylemleri yanlış yorumlayabilir ve bu da haksız veya hatalı sonuçlara yol açabilir.
  • Çevresel hassasiyet: Kötü aydınlatma, arka plan karmaşası veya insanların kısmen gizlenmesi nedeniyle doğruluk düşebilir, bu da sistemlerin dikkatli bir şekilde tasarlanması gerektiği anlamına gelir.

Link to this sectionÖne çıkanlar#

Yapay zeka ve bilgisayarlı görü, makinelerin insan eylemlerini daha doğru ve gerçek zamanlı olarak tanımasını mümkün kılıyor. Video karelerini ve hareket modellerini analiz ederek, bu sistemler hem günlük jestleri hem de ani değişiklikleri tanımlayabilir. Teknoloji gelişmeye devam ettikçe, insan aktivitesi tanıma araştırma laboratuvarlarının ötesine geçerek sağlık, güvenlik ve günlük uygulamalar için pratik bir araca dönüşüyor.

GitHub depomuzu ziyaret ederek ve topluluğumuza katılarak yapay zeka hakkında daha fazla bilgi edinin. Robotikte yapay zeka ve üretimde bilgisayarlı görü hakkında bilgi edinmek için çözüm sayfalarımıza göz atın. Görü yapay zekasına başlamak için lisans seçeneklerimizi keşfedin.

Explore solutions

Real-time AI that works with your team

Robotikte AI

Daha akıllı makineleri Ultralytics YOLO modelleriyle destekle. Robotikteki Vision AI; otonom navigasyonu, algılamayı, nesne takibini ve gerçek zamanlı kontrolü yönlendirir.
Daha fazla bilgi edin
Real-time AI that works with your team

Lojistikte Yapay Zeka

Ultralytics YOLO modelleri ile lojistiği kolaylaştır. Görü Yapay Zekası; paket inceleme, ayıklama, araç takibi ve gerçek zamanlı depo güvenliği izlemeyi mümkün kılar.
Daha fazla bilgi edin
Real-time AI that works with your team

Perakendede AI

Perakendeyi Ultralytics YOLO modelleri ile yeniden hayal et. Görü Yapay Zekası; envanter takibi, raf izleme, sıra yönetimi ve daha akıllı müşteri içgörüleri sağlar.
Daha fazla bilgi edin
Real-time AI that works with your team

Sağlıkta Yapay Zeka

Ultralytics YOLO modelleriyle sağlık çözümleri oluştur. Sağlıkta görüntü tabanlı yapay zeka; daha hızlı tıbbi görüntülemeyi, daha akıllı teşhisleri ve hasta izlemeyi güçlendirir.
Daha fazla bilgi edin
Real-time AI that works with your team

Üretimde Yapay Zeka

Ultralytics YOLO modelleri ile üretimi optimize et. Görü Yapay Zekası; kalite kontrol, kusur tespiti, KKD uyumu ve montaj hattı otomasyonunu yönlendirir.
Daha fazla bilgi edin
Real-time AI that works with your operation

Otomotivde yapay zeka

Ultralytics YOLO modelleriyle otomotivde bilgisayarlı görü uygula. Görüntü tabanlı yapay zeka; yol güvenliğini, sürücü yardımını ve araç otomasyonunu daha akıllı yollar için geliştirir.
Daha fazla bilgi edin
Real-time AI tailored to your operation

Tarımda yapay zeka

Ultralytics YOLO modelleriyle akıllı tarıma görüntü tabanlı yapay zeka getir. Daha yüksek ve akıllı verimler için mahsul takibini, hayvancılık izlemeyi ve hassas tarımı güçlendir.
Daha fazla bilgi edin
Real-time AI that works with your team

Robotikte AI

Daha akıllı makineleri Ultralytics YOLO modelleriyle destekle. Robotikteki Vision AI; otonom navigasyonu, algılamayı, nesne takibini ve gerçek zamanlı kontrolü yönlendirir.
Daha fazla bilgi edin
Real-time AI that works with your team

Lojistikte Yapay Zeka

Ultralytics YOLO modelleri ile lojistiği kolaylaştır. Görü Yapay Zekası; paket inceleme, ayıklama, araç takibi ve gerçek zamanlı depo güvenliği izlemeyi mümkün kılar.
Daha fazla bilgi edin
Real-time AI that works with your team

Perakendede AI

Perakendeyi Ultralytics YOLO modelleri ile yeniden hayal et. Görü Yapay Zekası; envanter takibi, raf izleme, sıra yönetimi ve daha akıllı müşteri içgörüleri sağlar.
Daha fazla bilgi edin
Real-time AI that works with your team

Sağlıkta Yapay Zeka

Ultralytics YOLO modelleriyle sağlık çözümleri oluştur. Sağlıkta görüntü tabanlı yapay zeka; daha hızlı tıbbi görüntülemeyi, daha akıllı teşhisleri ve hasta izlemeyi güçlendirir.
Daha fazla bilgi edin
Real-time AI that works with your team

Üretimde Yapay Zeka

Ultralytics YOLO modelleri ile üretimi optimize et. Görü Yapay Zekası; kalite kontrol, kusur tespiti, KKD uyumu ve montaj hattı otomasyonunu yönlendirir.
Daha fazla bilgi edin
Real-time AI that works with your operation

Otomotivde yapay zeka

Ultralytics YOLO modelleriyle otomotivde bilgisayarlı görü uygula. Görüntü tabanlı yapay zeka; yol güvenliğini, sürücü yardımını ve araç otomasyonunu daha akıllı yollar için geliştirir.
Daha fazla bilgi edin
Real-time AI tailored to your operation

Tarımda yapay zeka

Ultralytics YOLO modelleriyle akıllı tarıma görüntü tabanlı yapay zeka getir. Daha yüksek ve akıllı verimler için mahsul takibini, hayvancılık izlemeyi ve hassas tarımı güçlendir.
Daha fazla bilgi edin
Real-time AI that works with your team

Robotikte AI

Daha akıllı makineleri Ultralytics YOLO modelleriyle destekle. Robotikteki Vision AI; otonom navigasyonu, algılamayı, nesne takibini ve gerçek zamanlı kontrolü yönlendirir.
Daha fazla bilgi edin
Real-time AI that works with your team

Lojistikte Yapay Zeka

Ultralytics YOLO modelleri ile lojistiği kolaylaştır. Görü Yapay Zekası; paket inceleme, ayıklama, araç takibi ve gerçek zamanlı depo güvenliği izlemeyi mümkün kılar.
Daha fazla bilgi edin
Real-time AI that works with your team

Perakendede AI

Perakendeyi Ultralytics YOLO modelleri ile yeniden hayal et. Görü Yapay Zekası; envanter takibi, raf izleme, sıra yönetimi ve daha akıllı müşteri içgörüleri sağlar.
Daha fazla bilgi edin
Real-time AI that works with your team

Sağlıkta Yapay Zeka

Ultralytics YOLO modelleriyle sağlık çözümleri oluştur. Sağlıkta görüntü tabanlı yapay zeka; daha hızlı tıbbi görüntülemeyi, daha akıllı teşhisleri ve hasta izlemeyi güçlendirir.
Daha fazla bilgi edin
Real-time AI that works with your team

Üretimde Yapay Zeka

Ultralytics YOLO modelleri ile üretimi optimize et. Görü Yapay Zekası; kalite kontrol, kusur tespiti, KKD uyumu ve montaj hattı otomasyonunu yönlendirir.
Daha fazla bilgi edin
Real-time AI that works with your operation

Otomotivde yapay zeka

Ultralytics YOLO modelleriyle otomotivde bilgisayarlı görü uygula. Görüntü tabanlı yapay zeka; yol güvenliğini, sürücü yardımını ve araç otomasyonunu daha akıllı yollar için geliştirir.
Daha fazla bilgi edin
Real-time AI tailored to your operation

Tarımda yapay zeka

Ultralytics YOLO modelleriyle akıllı tarıma görüntü tabanlı yapay zeka getir. Daha yüksek ve akıllı verimler için mahsul takibini, hayvancılık izlemeyi ve hassas tarımı güçlendir.
Daha fazla bilgi edin

Yapay zekanın geleceğini birlikte inşa edelim!

Yolculuğuna makine öğreniminin geleceğiyle başla