Yolo Vision Shenzhen
Shenzhen
Şimdi katılın
Sözlük

Eylem Tanıma

Eylem Tanıma (İnsan Aktivitesi Tanıma): video, poz tahmini ve derin öğrenmenin sağlık, güvenlik ve spor için insan eylemlerini nasıl detect keşfedin.

Genellikle İnsan Faaliyeti Tanıma (HAR) olarak adlandırılan Eylem Tanıma, İnsan Faaliyeti Tanımanın özel bir alt kümesidir. Bilgisayarlı Görme (CV) tanımlamaya ve Video verilerindeki belirli hareketlerin veya davranışların sınıflandırılması. Standarttan farklı olarak statik kareleri analiz eden görüntü tanıma Nesneleri detect etmek için eylem tanıma, dinamik olayları anlamak için zaman boyutunu içerir. İşlem yaparak görüntü dizileri, Yapay Zeka (AI) sistemleri şunları yapabilir Yürüme, koşma, el sallama veya düşme gibi eylemler arasında ayrım yapabilir. Bu yetenek, aşağıdakileri oluşturmak için gereklidir gerçek dünya ortamlarındaki insan davranışlarını yorumlayabilen, pikselleri görmekle Niyeti anlamak.

Temel Etki Mekanizmaları Tanıma

Eylemleri doğru bir şekilde tanımlamak için, Derin Öğrenme (DL) modelleri iki tür çıkarım yapmalıdır özellikler: mekansal ve zamansal. Mekansal özellikler, bir sahnenin görsel görünümünü tanımlar, örneğin bir kişi veya nesne, genellikle Evrişimsel Sinir Ağları (CNN'ler). Zamansal özellikler, bu uzamsal unsurların zaman içinde nasıl değiştiğini tanımlar.

Modern yaklaşımlar genellikle aşağıdakileri içeren bir boru hattı kullanır:

  • Nesne Algılama: Sistem çerçeve içindeki bireylerin yerini etkili bir şekilde belirler. Gibi son teknoloji modeller YOLO11 hızları nedeniyle burada sıkça kullanılırlar ve doğruluk.
  • Poz Tahmini: Bu teknik ile eşleştirmeler insan vücudunun iskelet yapısı, izleme dirsekler, dizler ve omuzlar gibi kilit noktalar. Bu Bir dizi kare boyunca bu noktalar arasındaki geometrik ilişki, sınıflandırma için sağlam bir sinyal sağlar eylemler.
  • Zamansal Analiz: Veri dizileri, zaman serileri için tasarlanmış mimariler kullanılarak işlenir veriler, örneğin Tekrarlayan Sinir Ağları (RNN'ler) veya Uzun Kısa Süreli Bellek (LSTM) ağlar. Daha yakın zamanlarda, Video Transformers video akışlarındaki uzun menzilli bağımlılıkları modelleme yetenekleri nedeniyle popülerlik kazanmıştır.

Aşağıdaki Python örneği, aşağıdakilerin nasıl kullanılacağını göstermektedir ultralytics poz anahtar noktalarını çıkarmak için kütüphane Birçok eylem tanıma sistemi için temel veri katmanı olarak hizmet veren bir videodan.

from ultralytics import YOLO

# Load an official YOLO11 pose estimation model
model = YOLO("yolo11n-pose.pt")

# Run inference on a video to track human skeletal movement
# 'stream=True' returns a generator for efficient memory usage
results = model("path/to/video.mp4", stream=True)

for result in results:
    # Keypoints can be analyzed over time to determine actions
    keypoints = result.keypoints.xyn  # Normalized x, y coordinates
    print(keypoints)

Alaka ve Gerçek Dünya Uygulamaları

İnsan hareketlerinin yorumlanmasının otomatikleştirilebilmesi, çeşitli sektörlerde önemli ölçüde benimsenmesini sağlamıştır. Küresel insan faaliyetlerinin tanınması için pazar sektörler fiziksel iş akışlarını dijitalleştirmeye çalıştıkça genişlemeye devam ediyor.

Sağlık Hizmetleri ve Hasta Güvenliği

Sağlık hizmetlerinde yapay zeka alanında eylem tanıma, otomatik hasta izleme için kritik öneme sahiptir. Sistemler hastanelerde düşmeleri detect etmek için eğitilebilir veya destekli yaşam tesisleri, personele anında uyarıları tetikler. Ayrıca, bilgisayarlı görü şunları kolaylaştırır analiz ederek uzaktan fiziksel rehabilitasyon Hastanın egzersiz formunu gerçek zamanlı olarak inceleyerek iyileşmeye yardımcı olmak ve yaralanmaları önlemek için hareketleri doğru şekilde yapmalarını sağlar.

Spor Analitiği

Antrenörler ve yayıncılar Sporda yapay zeka Sporcu performansını ayrıştırmak. Hareket tanıma algoritmaları, oyun görüntülerindeki olayları otomatik olarak etiketleyebilir - örneğin basketbol şutu, tenis servisi veya futbol pası gibi detaylı istatistiksel analizlere olanak sağlar. Bu veriler şu konularda yardımcı olur tekniği rafine etmek ve aşağıdakilere dayalı stratejiler geliştirmek oyuncu hareket kalıpları.

Akıllı Gözetim

Güvenlik sistemleri basit hareket algılamanın ötesine geçmiştir. Gelişmiş güvenlik izleme kavga, aylaklık veya hırsızlık gibi şüpheli davranışları tespit etmek için eylem tanımayı kullanırken iyi huylu hareketleri göz ardı eder. Bu, yanlış alarmları azaltır ve güvenlik personelinin verimliliğini artırır.

İlgili Kavramları Ayırt Etme

Eylem Tanıma'yı bilgisayarlı görü alanındaki benzer terimlerden ayırmak, bu terimlere en uygun terimi seçmek için önemlidir. iş için doğru araç.

  • Eylem Tanıma vs. Video Anlama: Eylem tanıma, belirli fiziksel aktiviteleri tanımlamaya odaklanırken (örneğin, "bir kapıyı açmak"), video anlayışı, tüm bağlamı, anlatıyı ve nedenselliği kavramayı amaçlayan daha geniş bir alandır. Bir video içindeki ilişkiler (örneğin, "kişi köpeği dışarı çıkarmak için kapıyı açıyor").
  • Eylem Tanıma vs. Nesne Takibi: Nesne izleme, bir nesnenin veya kişinin kimliğini çerçeveler arasında korumakla ilgilidir. Eylem tanıma takip edilen öznenin davranışını analiz eder. Çoğu zaman, izleme, aşağıdakileri tanımak için bir ön koşul adımıdır çok kişili sahnelerdeki eylemler.
  • Eylem Tanıma vs. Poz Tahmini: Poz tahmini, vücut eklemlerinin ham koordinat verilerini çıkarır. Eylem tanıma bu verileri (veya görsel özellikleri) girdi olarak kullanarak "bisiklete binme" veya "zıplama" gibi anlamsal bir etiket çıktılar.

Zorluklar ve Gelecek Yönelimler

Bu sistemlerin konuşlandırılması, büyük miktarlarda etiketlenmiş malzemeye ihtiyaç duyulması gibi zorluklar içermektedir. eğitim verileri ve hesaplama maliyeti video işleme. Kinetics-400 gibi kıyaslama veri kümeleri ve UCF101 modelleri eğitmek ve değerlendirmek için standarttır.

Donanım geliştikçe, Edge AI'ya doğru bir kayma var, modellerin doğrudan kameralar veya mobil cihazlar üzerinde çalışmasına olanak tanır. Bu sayede daha düşük gecikme süresi ile gerçek zamanlı çıkarım ve Video verilerinin buluta gönderilmesi gerekmediği için daha iyi gizlilik. Gelecekteki gelişmeler, yaklaşmakta olan YOLO26'nın hızı ve doğruluğunu daha da optimize etmeyi amaçlamaktadır. Bu karmaşık tanıma görevlerine güç veren temel algılama ve poz tahmin motorları.

Ultralytics topluluğuna katılın

Yapay zekanın geleceğine katılın. Küresel yenilikçilerle bağlantı kurun, işbirliği yapın ve birlikte büyüyün

Şimdi katılın