Yolo Vision Shenzhen
Shenzhen
Şimdi katılın
Sözlük

Nesne Takibi

Bilgisayar görüşünde nesne izleme nasıl çalışır öğrenin. Ultralytics kullanarak benzersiz kimlik numaralarıyla nesneleri tanımlamak ve izlemek için gerçek zamanlı analiz yapmayı keşfedin.

Nesne izleme, bilgisayar görüşünde (CV) bir videodaki belirli nesneleri tanımlama ve bir dizi karede hareketlerini izlemeyi içeren dinamik bir süreçtir. Her bir anlık görüntüyü ayrı ayrı ele alan statik görüntü analizinden farklı olarak, izleme zaman boyutunu da devreye sokar. Bu, yapay zeka (AI) sistemlerinin algılanan her bir öğeye (örneğin araba, kişi veya hayvan) benzersiz bir kimlik numarası (ID) atamasını ve nesne hareket ederken, yön değiştirirken veya geçici olarak gizlendiğinde bu kimliği korumayı sağlar. Bu yetenek, makinelerin davranışları analiz etmesini, yörüngeleri hesaplamasını ve ham görüntülerden eyleme geçirilebilir içgörüler elde etmesini sağlayan gelişmiş video anlayışının temel taşıdır.

Nesne Takibi Nasıl Çalışır

Modern izleme sistemleri genellikle "algılama yoluyla izleme" paradigmasını kullanır. Bu iş akışı, güçlü algılama modellerini, zaman içindeki algılamaları ilişkilendirmek için özel algoritmalarla birleştirir. Süreç genellikle üç ana aşamadan oluşur:

  1. Algılama: Her karede, son teknoloji YOLO26 gibi bir nesne algılama modeli, ilgi çekici nesneleri bulmak için görüntüyü tarar. Model, her nesnenin uzamsal boyutunu tanımlayan sınırlayıcı kutular çıkarır.
  2. Hareket Tahmini: Kalman Filtresi gibi algoritmalar, bir nesnenin mevcut hızı ve yörüngesine dayalı olarak gelecekteki konumunu tahmin eder. Bu tahmin, bir sonraki kare için arama alanını azaltarak sistemi daha verimli hale getirir.
  3. Veri İlişkilendirme: Sistem, Macar algoritması gibi optimizasyon yöntemlerini kullanarak yeni algılamaları mevcut izlerle eşleştirir. Bu adım genellikle, kesişim birleşimi (IoU) gibi metriklere dayanarak tahmin edilen kutunun yeni algılama ile ne kadar örtüştüğünü ölçer. Gelişmiş izleyiciler, benzer görünen nesneleri yeniden tanımlamak için görsel özellik çıkarma yöntemini de kullanabilir. Bu, nesnelerin aynı nesneye ait olup olmadığını belirlemek için kullanılır.

Nesne İzleme ve Nesne Algılama

Bu terimler birbiriyle yakından ilişkili olsa da, makine öğrenimi (ML) sürecinde farklı işlevlere sahiptir.

  • Nesne Algılama, "Bu görüntüde ne var ve nerede?" sorusuna cevap verir. Durum bilgisi yoktur, yani önceki karelerin hafızası yoktur. Bir araba videoda geçerse, algılayıcı 1. karede bir "araba" ve 2. karede bir "araba" görür, ancak bunların aynı araç olduğunu bilmez.
  • Nesne Takibi, " Bu belirli nesne nereye gidiyor?" sorusuna cevap verir. Durum bilgisi içerir. 1. karedeki "araba"yı 2. karedeki "araba"ya bağlayarak, sistemin "Araba Kimliği #42"nin soldan sağa doğru hareket ettiğini kaydetmesini sağlar. Bu, öngörüsel modelleme ve sayma gibi görevler için çok önemlidir.

Gerçek Dünya Uygulamaları

Nesne kimliğini koruma yeteneği, çeşitli endüstrilerde karmaşık gerçek zamanlı çıkarım uygulamalarını mümkün kılar.

  • Akıllı Ulaşım Sistemleri: İzleme, otonom araçların güvenli bir şekilde seyretmesi için hayati önem taşır. Yayaları ve diğer araçları izleyerek, arabalar olası çarpışmaları tahmin edebilir. Ayrıca, trafik mühendisleri bu sistemleri hız tahmini için kullanarak güvenlik düzenlemelerini uygular ve trafik akışını optimize eder.
  • Perakende Analitiği: Fiziksel mağazalar, müşteri davranışını anlamak için perakendede yapay zeka kullanır. Takip, mağaza yöneticilerinin nesne sayımı yaparak mağaza trafiğini ölçmelerini, ısı haritaları kullanarak vitrinlerin önünde geçirilen süreyi analiz etmelerini ve bekleme sürelerini azaltmak için kuyruk yönetimini optimize etmelerini sağlar.
  • Spor Analizi: Profesyonel sporlarda, koçlar izlemeyi poz tahminiyle birleştirerek oyuncuların biyomekaniğini ve takım düzenlerini analiz ederler. Bu veriler, çıplak gözle görülemeyen kalıpları ortaya çıkararak rekabet avantajı sağlar.

Python ile İzleme Uygulaması

Ultralytics , yüksek performanslı izlemeyi kolayca uygulamaya koymanızı Ultralytics . track kütüphanedeki mod otomatik olarak algılama, hareket tahmini ve kimlik atamayı gerçekleştirir. Aşağıdaki örnek, Ultralytics Platformu bir videodaki track için uyumlu YOLO26 modeli. video.

from ultralytics import YOLO

# Load the official YOLO26n model (nano version for speed)
model = YOLO("yolo26n.pt")

# Track objects in a video file or webcam (source=0)
# 'show=True' displays the video with bounding boxes and unique IDs
results = model.track(source="https://ultralytics.com/images/bus.jpg", show=True)

# Access the unique tracking IDs from the results
if results[0].boxes.id is not None:
    print(f"Detected Track IDs: {results[0].boxes.id.cpu().numpy()}")

İlgili Kavramlar

İzleme ekosistemini tam olarak anlamak için, sadece bir kutu yerine nesnenin piksel düzeyinde kesin konturlarını izleyen örnek segmentasyonunu incelemek faydalıdır. Ayrıca, Çoklu Nesne İzleme (MOT) zorlukları genellikle, algoritmaların kalabalık sahneleri ve örtülmeleri ne kadar iyi işlediğini değerlendirmek için MOTChallenge gibi yaygın olarak kullanılan karşılaştırma ölçütlerini içerir. Üretim ortamlarında dağıtım için, geliştiriciler genellikle NVIDIA veya OpenCV gibi araçları kullanarak bu modelleri verimli iş akışlarına entegre ederler.

Ultralytics topluluğuna katılın

Yapay zekanın geleceğine katılın. Küresel yenilikçilerle bağlantı kurun, işbirliği yapın ve birlikte büyüyün

Şimdi katılın