Yolo Vision Shenzhen
Shenzhen
Şimdi katılın

Bilgisayar görüşü, hareket izlemeyi daha güvenilir hale getirir.

AI ve bilgisayar görüşünün spor, robotik, mobil uygulamalar ve diğer gerçek dünya iş akışlarında hareket izlemeyi nasıl daha akıllı, daha hızlı ve daha güvenilir hale getirdiğini öğrenin.

Bir tiyatro oyununu izlerken, en sevdiğiniz aktör sahnede hareket ettiğinde, gözleriniz çok az bilinçli çaba sarf ederek onu takip edebilir. İnsanlar için bu tür hareket takibi doğal bir şeydir. Beyniniz, bir an gördüklerinizi bir sonraki an gördüklerinizle otomatik olarak birleştirir, boşlukları doldurur ve sahne değiştikçe süreklilik hissini korur.

Makineler söz konusu olduğunda, aynı görev çok daha karmaşıktır. Bir kamera, bir videoyu tek tek karelerden oluşan bir dizi olarak yakalar ve sistem, aynı nesneyi adım adım tekrar tekrar tanımlayarak nesnenin nereye hareket ettiğini tahmin etmeli ve nesnenin hala takip edilecek nesne olup olmadığına karar vermelidir. 

Bu zorluk, hareket izlemenin temelini oluşturur. Hareket izleme, bir nesneyi zaman içinde bir video üzerinden takip etmeyi içerir ve spor analizi, robotik ve mobil uygulamalar gibi alanlarda önemli bir rol oynar. 

Geleneksel hareket ve kamera izleme genellikle manuel ayarlara, track ve anahtar karelere bağlıdır. Basit sahnelerde işe yarayabilir, ancak hareket hızlı veya kısmen engellendiğinde hızla yavaşlar ve güvenilmez hale gelir.

Şekil 1. Hareket izleme sistemine bir bakış (Kaynak)

Bilgisayar görüşündeki son gelişmeler bunu çok daha kolay hale getiriyor. Bilgisayar görüşü, makinelerin görüntüleri ve videoları anlamasına yardımcı olan ve hareket takibini daha doğru hale getirerek manuel çalışmaya olan bağımlılığı azaltan bir yapay zeka dalıdır. Her karede nesneleri algılayarak ve zaman içinde kimliklerini tutarlı tutarak, bu sistemler gerçek dünya koşullarında track daha güvenilir bir şekilde track .

Bu makalede, bilgisayar görüşünün hareket izlemeyi nasıl daha verimli hale getirebileceğini inceleyeceğiz. Hadi başlayalım!

Geleneksel hareket yakalama ve izleme yöntemleri ve bunların sınırlamaları

Geleneksel hareket izleme, özellikle video düzenleme ve VFX iş akışlarında, görüntüdeki hareketli öğelere grafikler, efektler veya kaplamalar eklemek amacıyla genellikle dikkatli bir manuel kurulum gerektirir. 

Birçok iş akışı, çekimin belirli kısımlarına track yerleştirerek başlar ve ardından yazılım, hareket yolunu haritalamak için bunları kareler boyunca takip eder. Bu, After Effects gibi araçlarda yaygın bir uygulamadır ve benzer iş akışları, editörlerin zaman içinde track maskeyi veya bölgeyi track maske izleme gibi özellikler aracılığıyla Premiere Pro'da da görülür.

Match moving (hareket eşleştirme) bir başka yaygın yöntemdir. Dijital öğeleri gerçek kamera hareketiyle hizalamaya yardımcı olur, böylece efektler veya grafikler canlı çekimde yerinde kalır. Bu yaklaşımlar daha basit sahneler için iyi sonuç verebilir, ancak çekim kalabalıklaştığında veya nesneler hızlı hareket ettiğinde genellikle zorluk çıkarır.

Işık değiştiğinde veya nesneler kısmen engellendiğinde izleme de bozulabilir, bu da track sapma veya ani sıçramalara neden olabilir. Bu durum iş akışını yavaşlatır ve editörlerin çekimin bazı bölümlerini yeniden yapmasını gerektirir. Nesneler hızlı bir şekilde yön değiştirdiğinde, eski hareket izleyiciler buna ayak uydurmakta zorlanabilir, bu da sonuçların tutarsız ve güvenilmez olmasına neden olur. 

Bilgisayar görüşü hareket izlemeyi nasıl dönüştürüyor?

En son teknoloji bilgisayar görme sistemleri, AI modellerini kullanarak videodaki hareketli nesneleri takip eder. Sürekli manuel ayarlamalara veya hassas kare kare izlemeye güvenmek yerine, model nesnenin nasıl göründüğünü ve nasıl hareket ettiğini öğrenir. Bu, sahneler yoğunlaştığında, ışık değiştiğinde veya nesneler kısa süreliğine kaybolduğunda bile hareket izlemenin sabit kalmasına yardımcı olur.

Örneğin, bilgisayar görme modelleri gibi Ultralytics YOLO11 ve yakında çıkacak olan Ultralytics gibi bilgisayar görme modelleri, her karede nesneleri algılayarak nesne izlemeyi destekler. Basit bir ifadeyle, algılanan her nesne için sınırlayıcı kutular ve güven puanları üreterek karede ne olduğunu ve nerede olduğunu belirlerler.

Şekil 2. Bir bölgeYOLO11 Ultralytics YOLO11 kullanarak araçları takip etme (Kaynak)

İlginç bir şekilde, YOLO zaman içinde track kendi başlarına track etmezler. Bunun yerine, takip işlemi Ultralytics Python aracılığıyla gerçekleştirilir. Bu Python , YOLO ByteTrack ve BoT-SORT gibi çoklu nesne takip algoritmalarıyla birleştirir. Bu yapılandırmada, YOLO nesneleri kare kare YOLO ve takipçi, nesnelerin hareketleri sırasında tutarlı bir kimlik sağlamak için bu algılamaları kareler arasında birbirine bağlar.

AI destekli hareket izlemenin gerçek dünyadaki uygulamaları

Şimdi, AI destekli hareket izleme teknolojisinin etkili olduğu birkaç gerçek dünya uygulamasını daha yakından inceleyelim.

Spor analitiği ve hassas oyuncu takibi

Bir futbol maçında oyuncular sürekli hızlanıyor, duruyor ve yön değiştiriyor, bu da sahadaki hareketleri doğru bir şekilde ölçmeyi zorlaştırıyor. Manuel takip, özellikle oyuncular üst üste geldiğinde, bir araya toplandığında veya kalabalık alanlarda hareket ettiğinde bu anlarda genellikle başarısız oluyor. 

AI destekli hareket izleme, her oyuncuyu eylem boyunca takip ederek ve hareket yollarını net ve tutarlı tutarak yardımcı olur. Örneğin, yakın zamanda yapılan bir çalışmada, araştırmacılar YOLO11 kullanarak birden fazla kamera açısı üzerinden detect ve topu detect . YOLO11 her karede her oyuncuyu YOLO11 , bir izleme sistemi bu tespitleri zaman içinde birbirine bağlayarak oyuncuların hareketleri sırasında kimliklerinin tutarlı kalmasını sağladı.

Şekil 3. Birden fazla futbolcuyu algılama ve izleme (Kaynak)

Artırılmış gerçeklik ve sanal gerçeklikte hareket izleme

Artırılmış gerçeklik (AR), uygulamaların dijital nesneleri gerçek dünyaya yerleştirmesini mümkün kılan teknolojidir. Örneğin, bir ürünün üzerindeki etiket, zemindeki bir karakter veya hareket ederken ayağınızın üzerinde görünen bir katman gibi. Bu deneyimlerin inandırıcı olması için, siz etrafta dolaşırken, telefonunuzu eğirken veya nesneyi hareket ettirirken sanal içerik doğru yerde sabit kalmalıdır.

Bilgisayar görüşü burada önemli bir rol oynar, çünkü mobil cihazın neye baktığını ve kameranın sahnede nasıl hareket ettiğini anlamasına yardımcı olur. Başka bir deyişle, bir nesnenin uzayda nerede olduğunu ve nasıl yönlendirildiğini tahmin ederek, ardından kullanıcı hareket ettikçe bu konumu güncelleyerek 3D izlemeyi mümkün kılar.

Şekil 4. Bir AR uygulamasında 3D izleme örneği (Kaynak)

Sanal gerçeklik (VR) benzer izleme fikirlerine dayanır, ancak hedefi farklıdır. Dijital içeriği gerçek dünyaya bağlamak yerine, VR başınızı ve ellerinizi izlemeye odaklanır, böylece hareket ettiğinizde sanal dünya doğal bir şekilde tepki verir.

Hareketli ekipmanların takibi ve süreç otomasyonu

Endüstriyel ortamlarda, ekipman ve ürünler genellikle bir iş akışının birçok aşamasından geçer. Her aşama, doğru zamanlama ve koordinasyona bağlıdır. Ürünler farklı hızlarda hareket ettiğinden, birbirleriyle çakıştığından veya konumlarını hızla değiştirdiğinden, manuel takip geride kalabilir.

AI destekli hareket izleme, üretim sistemlerine hat boyunca hareket eden her nesneyi daha net bir şekilde görme imkanı sunarak yardımcı olur. İlginç bir çalışmada, birbirine bağlı kameralardan oluşan bir ağ, tüm üretim döngüsü boyunca ürünleri izledi ve gerçek sürecin sanal bir kopyası olan dijital ikizi gerçek zamanlı olarak güncelledi. 

Sistem her bir ürünü tanımladı, hareketini takip etti ve dijital modeli sahada olanlarla uyumlu tuttu. Bu yaklaşım, operatörlere her aşamada güvenilir bir görünüm sunarak izlemeyi iyileştirdi ve daha güvenli çalışmayı destekledi. Ayrıca, tutarlı izleme verileri mevcut olduğunda hareket izlemenin nasıl daha esnek ve ölçeklenebilir otomasyon sağladığını da gösterdi.

AI destekli hareket izlemenin artıları ve eksileri

AI destekli hareket izlemeyi kullanmanın birkaç avantajı şunlardır:

  • Tıkanıklık sonrası iyileştirilmiş kurtarma: Görme AI sistemleri, nesneler üst üste geldiğinde veya kısa süreliğine kaybolduğunda genellikle izleri koruyabilir veya geri kazanabilir.
  • Ölçeklenebilirlik: AI izleyiciler, bir kez kurulduktan sonra , her çekim için tekrar tekrar ayar yapmaya gerek kalmadan uzun video klipleri ve birden fazla kamera görüntüsünü işleyebilir.
  • Daha zengin hareket verileri: İzleme çıktıları, analizler için yollar, sayımlar, bekleme süresi ve temel hız tahminlerini ölçmek için kullanılabilir.

AI destekli izleme birçok durumda iyi sonuç verir, ancak her kurulumda tak ve çalıştır özelliği yoktur. Dikkate alınması gereken bazı sınırlamalar şunlardır:

  • Sürekli bakım: Kamera açıları, ortamlar veya iş yükleri değiştikçe performans zamanla değişebilir, bu nedenle genellikle periyodik güncellemeler gerekir.
  • Entegrasyon karmaşıklığı: İzleyicileri mevcut video düzenleyicilere, analiz araçlarına veya otomasyon sistemlerine bağlamak için adaptörler, kalibrasyon ve ek testler gerekebilir.
  • Aşırı koşullarda sınır durumlar: Düşük ışık, hareket bulanıklığı, yoğun örtülme ve çok küçük nesneler hala izleme hatalarına neden olabilir.

Önemli çıkarımlar

AI destekli hareket izleme özellikleri, hareketlerin hızlı, sahnelerin kalabalık ve manuel düzeltmelerin ölçeklenemediği gerçek dünya videoları için hızla daha pratik bir seçenek haline geliyor. Bilgisayar görüşü hızla gelişiyor ve bu da izleme sistemlerinin zorlu koşullarda daha kolay uygulanmasını ve daha güvenilir olmasını sağlıyor. Sonuç olarak, hareket izleme robotik, mobil uygulamalar, analitik ve içerik oluşturma alanlarında daha kullanışlı hale geliyor.

Topluluğumuza katılın ve GitHub depomuzda Vision AI'daki en son gelişmeleri keşfedin. Üretimde yapay zeka ve sağlık hizmetlerinde bilgisayarla görme gibi uygulamaların nasıl ilerleme sağladığını öğrenmek için çözüm sayfalarımızı ziyaret edin ve bir sonraki yapay zeka çözümünüzü güçlendirmek için lisanslama seçeneklerimize göz atın.

Gelin, yapay zekanın geleceğini
birlikte inşa edelim!

Makine öğreniminin geleceği ile yolculuğunuza başlayın

Ücretsiz başlayın