Yolo Vision Shenzhen
Shenzhen
Şimdi katılın
Sözlük

Eylem Tanıma

Eylem Tanıma (İnsan Aktivitesi Tanıma): video, poz tahmini ve derin öğrenmenin sağlık, güvenlik ve spor için insan eylemlerini nasıl detect keşfedin.

Sıklıkla İnsan Etkinliği Tanıma (HAR) olarak adlandırılan Eylem Tanıma, bilgisayar görme (CV) alanının, video verileri içindeki belirli hareketleri veya davranışları tanımlama ve sınıflandırmaya odaklanan özel bir dalıdır. Standart görüntü tanıma, detect statik kareleri analiz ederken, eylem tanıma, dinamik olayları yorumlamak için dördüncü boyut olan zamanı da dahil eder. Kare dizilerini işleyerek, gelişmiş Yapay Zeka (AI) sistemleri, yürüme, el sallama, düşme veya belirli bir spor tekniğini uygulama gibi karmaşık davranışları ayırt edebilir. Bu yetenek, insan niyetini anlayabilen ve gerçek dünya ortamlarında güvenli bir şekilde etkileşim kurabilen akıllı sistemler oluşturmak için gereklidir.

Temel Mekanizmalar ve Teknikler

Eylemleri doğru bir şekilde tanımlamak için, Derin Öğrenme (DL) modelleri iki temel özellik türünü ayıklamalı ve sentezlemelidir: uzamsal ve zamansal. Uzamsal özellikler, genellikle Convolutional Neural Networks (CNNs) kullanarak, bir kişinin veya nesnenin varlığı gibi sahnenin görsel görünümünü yakalar. Zamansal özellikler, bu unsurların zaman içinde nasıl değiştiğini tanımlayarak, "oturma" eylemini "ayağa kalkma" eyleminden ayırmak için gerekli bağlamı sağlar.

Modern yaklaşımlar, yüksek doğruluk elde etmek için genellikle çok aşamalı bir süreç kullanır:

  • Poz Tahmini: Bu teknik, insan vücudunun iskelet yapısını haritalandırarak dirsekler, dizler ve omuzlar gibi belirli anahtar noktaları izler. Bu noktalar arasındaki geometrik ilişki, arka plan karmaşasından veya aydınlatma koşullarından bağımsız olarak eylemleri sınıflandırmak için sağlam bir sinyal sağlar. .
  • Zamansal Modelleme: Veri dizileri, zaman serisi analizi için tasarlanmış mimariler kullanılarak işlenir. Örneğin, Tekrarlayan Sinir Ağları (RNN) veya Uzun Kısa Süreli Bellek (LSTM) ağları. Son zamanlarda, Video Dönüştürücüler, video akışlarında uzun menzilli bağımlılıkları modellemek için standart hale gelmiştir.
  • Hareket Özellikleri: Algoritmalar genellikle optik akışı kullanarak kareler arasındaki piksel hareketinin track ve hızını açıkça track ve modelin, yalnızca uzamsal analizle gözden kaçabilecek ince hareket kalıplarını ayırt etmesine yardımcı olur. .

Gerçek Dünya Uygulamaları

İnsan hareketlerinin yorumlanmasını otomatikleştirme yeteneği, çeşitli sektörlerde önemli ölçüde benimsenmesini sağlamıştır. İşletmeler fiziksel iş akışlarını dijitalleştirmek ve güvenliği artırmak için çaba gösterirken, küresel insan aktivitesi tanımapazarı büyümeye devam etmektedir.

Sağlık Hizmetleri ve Hasta Güvenliği

Sağlık hizmetlerinde yapay zeka alanında, eylem tanıma, otomatik hasta izleme için çok önemlidir. Sistemler, hastanelerde veya yardımlı yaşam tesislerinde detect üzere eğitilebilir ve hemşirelik personeline anında uyarılar gönderebilir. Ayrıca, bilgisayar görüşü, uzaktan fiziksel rehabilitasyonu kolaylaştırır. Hastanın egzersiz şeklini gerçek zamanlı olarak analiz ederek, iyileşmeye yardımcı olmak ve yaralanmaları önlemek için hareketleri doğru şekilde gerçekleştirmelerini sağlar.

Spor Analitiği

Koçlar ve yayıncılar, spor alanında yapay zekayı kullanarak sporcuların performansını analiz ediyor. Hareket tanıma algoritmaları, maç görüntülerindeki olayları (örneğin basketbol şutu, tenis servisi veya futbol pası) otomatik olarak etiketleyerek ayrıntılı istatistiksel analizlere olanak tanıyor. Bu veriler, tekniğin iyileştirilmesine ve belirli oyuncu hareket modellerine dayalı stratejilerin geliştirilmesine yardımcı oluyor.

İlgili Kavramları Ayırt Etme

Eylem Tanıma'yı bilgisayarlı görü alanındaki benzer terimlerden ayırmak, bu terimlere en uygun terimi seçmek için önemlidir. iş için doğru araç.

  • Eylem Tanıma vs. Video Anlama: Eylem tanıma, belirli fiziksel aktiviteleri tanımlamaya odaklanırken (örneğin, "bir kapıyı açmak"), video anlayışı, tüm bağlamı, anlatıyı ve nedenselliği kavramayı amaçlayan daha geniş bir alandır. Bir video içindeki ilişkiler (örneğin, "kişi köpeği dışarı çıkarmak için kapıyı açıyor").
  • Eylem Tanıma ve Nesne Takibi: Nesne takibi, nesnelerin veya kişilerin kimliklerini kareler arasında korumakla ilgilidir (benzersiz bir kimlik atamak). Eylem tanıma ise takip edilen nesnenin davranışını analiz eder. Çoğu zaman, takip, çok kişili sahnelerde eylemleri tanımak için gerekli bir adımdır.

Eylem Analizinin Uygulanması

Birçok eylem tanıma sürecinde temel bir adım, iskelet verilerini çıkarmaktır. Aşağıdaki Python örneği , ultralytics kütüphane ile YOLO26 aşağı akış eylem sınıflandırması için temel veri katmanı görevi gören poz anahtar noktalarını çıkarmak.

from ultralytics import YOLO

# Load the latest YOLO26 pose estimation model
model = YOLO("yolo26n-pose.pt")

# Run inference on an image or video to track human skeletal movement
# The model detects persons and their joint locations
results = model("https://ultralytics.com/images/bus.jpg")

for result in results:
    # Keypoints (x, y, visibility) used for downstream action analysis
    if result.keypoints is not None:
        print(f"Keypoints shape: {result.keypoints.data.shape}")

Zorluklar ve Gelecek Yönelimler

Bu sistemlerin kullanılması, büyük miktarda etiketli eğitim verisine duyulan ihtiyaç ve video işleme hesaplama maliyeti gibi zorluklar ortaya çıkarmaktadır. Kinetics-400 gibi karşılaştırmalı veri setleri, model performansını değerlendirmek için standarttır.

Donanım geliştikçe, Edge AI'ya doğru bir geçiş yaşanıyor ve modellerin doğrudan kameralar veya mobil cihazlarda çalıştırılmasına olanak tanınıyor. Bu, video verilerinin buluta gönderilmesine gerek kalmadığı için daha düşük gecikme süresi ve daha iyi gizlilik ile gerçek zamanlı çıkarım yapılmasını sağlıyor. Gelecekteki gelişmeler, bu karmaşık tanıma görevlerini destekleyen temel algılama ve poz tahmin motorlarının hızını ve doğruluğunu daha da optimize etmeyi amaçlıyor.

Ultralytics topluluğuna katılın

Yapay zekanın geleceğine katılın. Küresel yenilikçilerle bağlantı kurun, işbirliği yapın ve birlikte büyüyün

Şimdi katılın