Eylem Tanıma (İnsan Aktivitesi Tanıma): video, poz tahmini ve derin öğrenmenin sağlık, güvenlik ve spor için insan eylemlerini nasıl detect keşfedin.
Genellikle İnsan Faaliyeti Tanıma (HAR) olarak adlandırılan Eylem Tanıma, İnsan Faaliyeti Tanımanın özel bir alt kümesidir. Bilgisayarlı Görme (CV) tanımlamaya ve Video verilerindeki belirli hareketlerin veya davranışların sınıflandırılması. Standarttan farklı olarak statik kareleri analiz eden görüntü tanıma Nesneleri detect etmek için eylem tanıma, dinamik olayları anlamak için zaman boyutunu içerir. İşlem yaparak görüntü dizileri, Yapay Zeka (AI) sistemleri şunları yapabilir Yürüme, koşma, el sallama veya düşme gibi eylemler arasında ayrım yapabilir. Bu yetenek, aşağıdakileri oluşturmak için gereklidir gerçek dünya ortamlarındaki insan davranışlarını yorumlayabilen, pikselleri görmekle Niyeti anlamak.
Eylemleri doğru bir şekilde tanımlamak için, Derin Öğrenme (DL) modelleri iki tür çıkarım yapmalıdır özellikler: mekansal ve zamansal. Mekansal özellikler, bir sahnenin görsel görünümünü tanımlar, örneğin bir kişi veya nesne, genellikle Evrişimsel Sinir Ağları (CNN'ler). Zamansal özellikler, bu uzamsal unsurların zaman içinde nasıl değiştiğini tanımlar.
Modern yaklaşımlar genellikle aşağıdakileri içeren bir boru hattı kullanır:
Aşağıdaki Python örneği, aşağıdakilerin nasıl kullanılacağını göstermektedir ultralytics poz anahtar noktalarını çıkarmak için kütüphane
Birçok eylem tanıma sistemi için temel veri katmanı olarak hizmet veren bir videodan.
from ultralytics import YOLO
# Load an official YOLO11 pose estimation model
model = YOLO("yolo11n-pose.pt")
# Run inference on a video to track human skeletal movement
# 'stream=True' returns a generator for efficient memory usage
results = model("path/to/video.mp4", stream=True)
for result in results:
# Keypoints can be analyzed over time to determine actions
keypoints = result.keypoints.xyn # Normalized x, y coordinates
print(keypoints)
İnsan hareketlerinin yorumlanmasının otomatikleştirilebilmesi, çeşitli sektörlerde önemli ölçüde benimsenmesini sağlamıştır. Küresel insan faaliyetlerinin tanınması için pazar sektörler fiziksel iş akışlarını dijitalleştirmeye çalıştıkça genişlemeye devam ediyor.
Sağlık hizmetlerinde yapay zeka alanında eylem tanıma, otomatik hasta izleme için kritik öneme sahiptir. Sistemler hastanelerde düşmeleri detect etmek için eğitilebilir veya destekli yaşam tesisleri, personele anında uyarıları tetikler. Ayrıca, bilgisayarlı görü şunları kolaylaştırır analiz ederek uzaktan fiziksel rehabilitasyon Hastanın egzersiz formunu gerçek zamanlı olarak inceleyerek iyileşmeye yardımcı olmak ve yaralanmaları önlemek için hareketleri doğru şekilde yapmalarını sağlar.
Antrenörler ve yayıncılar Sporda yapay zeka Sporcu performansını ayrıştırmak. Hareket tanıma algoritmaları, oyun görüntülerindeki olayları otomatik olarak etiketleyebilir - örneğin basketbol şutu, tenis servisi veya futbol pası gibi detaylı istatistiksel analizlere olanak sağlar. Bu veriler şu konularda yardımcı olur tekniği rafine etmek ve aşağıdakilere dayalı stratejiler geliştirmek oyuncu hareket kalıpları.
Güvenlik sistemleri basit hareket algılamanın ötesine geçmiştir. Gelişmiş güvenlik izleme kavga, aylaklık veya hırsızlık gibi şüpheli davranışları tespit etmek için eylem tanımayı kullanırken iyi huylu hareketleri göz ardı eder. Bu, yanlış alarmları azaltır ve güvenlik personelinin verimliliğini artırır.
Eylem Tanıma'yı bilgisayarlı görü alanındaki benzer terimlerden ayırmak, bu terimlere en uygun terimi seçmek için önemlidir. iş için doğru araç.
Bu sistemlerin konuşlandırılması, büyük miktarlarda etiketlenmiş malzemeye ihtiyaç duyulması gibi zorluklar içermektedir. eğitim verileri ve hesaplama maliyeti video işleme. Kinetics-400 gibi kıyaslama veri kümeleri ve UCF101 modelleri eğitmek ve değerlendirmek için standarttır.
Donanım geliştikçe, Edge AI'ya doğru bir kayma var, modellerin doğrudan kameralar veya mobil cihazlar üzerinde çalışmasına olanak tanır. Bu sayede daha düşük gecikme süresi ile gerçek zamanlı çıkarım ve Video verilerinin buluta gönderilmesi gerekmediği için daha iyi gizlilik. Gelecekteki gelişmeler, yaklaşmakta olan YOLO26'nın hızı ve doğruluğunu daha da optimize etmeyi amaçlamaktadır. Bu karmaşık tanıma görevlerine güç veren temel algılama ve poz tahmin motorları.
.webp)

