Yolo Vision Shenzhen
Shenzhen
Şimdi katılın
Sözlük

Çoklu Nesne Takibi (MOT)

Çoklu Nesne Takibini (MOT) keşfedin: YOLO11, Kalman Filtreleri, görünüm eşleştirme ve modern veri ilişkilendirme ile video karelerindeki nesneleri track ve yeniden tanımlayın.

Çoklu Nesne Takibi (MOT), aşağıdaki alanlarda çok önemli bir görevdir çoklu algılamayı içeren bilgisayar görüşü Bir video akışı içindeki farklı varlıklar ve bunların ardışık kareler boyunca benzersiz kimliklerini korumaları. Bir yandan standart nesne tespiti neyin ne olduğunu tanımlar Tek bir statik görüntüde mevcut olan MOT, zamansal bir boyut getirerek belirli bir görüntünün nerede olduğu sorusuna cevap verir. nesneler zaman içinde hareket eder. MOT, tespit edilen her örneğe kalıcı bir kimlik numarası (ID) atayarak yörüngeleri analiz etmek, etkileşimleri anlamak ve benzersiz öğeleri saymak için sistemler, onu modern video anlama uygulamaları.

Takip Sistemlerinin Mekaniği

En son teknoloji MOT sistemleri, aşağıdakiler tarafından desteklenenler de dahil olmak üzere YOLO11"tespit ederek izleme" yöntemiyle çalışırlar. paradigma. Bu iş akışı, süreci videonun her karesi için tekrarlanan farklı aşamalara ayırarak yüksek doğruluk ve süreklilik.

  1. Algılama: Sistem ilk olarak ilgilenilen nesneleri bulmak için yüksek performanslı bir model kullanır, sınırlayıcı kutular oluşturma ve güven puanları.
  2. Hareket Tahmini: Tespitleri çerçeveler arasında ilişkilendirmek için, aşağıdaki gibi algoritmalar Kalman Filtresi bir nesnenin gelecekteki konumunu tahmin eder. nesnenin geçmişteki hızına ve konumuna bağlı olarak. Bu bir için arama alanını daraltan durum tahmini Bir sonraki kare.
  3. Veri İlişkilendirme: Sistem yeni tespitleri mevcut izlerle eşleştirir. Optimizasyon teknikleri Macar algoritması gibi bu sorunu çözer eşleştirme maliyetini en aza indirerek atama problemi, genellikle Birlik üzerinde kesişme (IoU) arasında tahmin edilen track ve yeni tespit.
  4. Yeniden Kimlik Belirleme (ReID): Nesnelerin yollarının kesiştiği veya geçici olarak gizlendiği senaryolarda - bir oklüzyon-ileri olarak bilinen fenomen izleyiciler nesneyi tanımak için görsel katıştırmaları kullanır yeniden göründüğünde, kimlik değiştirmeyi önler.

MOT ve İlgili Bilgisayarla Görme Terimleri

Belirli bir kullanım durumuna uygun teknolojiyi seçmek için MOT'yi benzer kavramlardan ayırt etmek önemlidir.

  • Nesne Algılamaya karşı: Algılama her kareyi bağımsız bir olay olarak ele alır. Eğer bir araç görünürse Ardışık iki karede, bir dedektör iki ayrı "araba" örneği görür. Tam tersine, nesne izleme bu örnekleri birbirine bağlar, Onları zaman içinde hareket eden aynı araç olarak tanımak.
  • Tek Nesne Takibine (SOT) karşı: SOT, hedef tarafından başlatılan belirli bir hedefi takip etmeye odaklanır. kullanıcı, genellikle diğer tüm faaliyetleri göz ardı eder. MOT daha karmaşıktır, çünkü bir aracı otonom olarak detect etmesi, track ve yönetmesi gerekir. sahneye giren ve çıkan nesnelerin sayısının bilinmemesi ve dalgalanması, sağlam bellek yönetimi mantığı.

Gerçek Dünya Uygulamaları

Birden fazla nesneyi aynı anda track yeteneği, ham videoyu dönüştürerek çeşitli sektörlerde inovasyonu teşvik eder verileri eyleme dönüştürülebilir tahmine dayalı modelleme içgörüleri.

  • Akıllı Ulaşım: Bu alanda Otomotivde yapay zeka, MOT için kritik öneme sahiptir otonom sürüş ve trafik izleme. Sistemlerin aşağıdakileri gerçekleştirmesini sağlar a mesafesini hesaplayarak hız tahmini Araçların zaman içindeki hareketleri ve yayaların yörüngelerini izleyerek olası çarpışmaları tahmin etmeye yardımcı olur. bisikletçiler.
  • Perakende Analitiği: Tuğla ve harç mağazaları kaldıraç Müşteri davranışlarını anlamak için perakendede yapay zeka. Tarafından hassas nesne sayımı için MOT uygulamak, perakendeciler yaya trafiğini ölçebilir, belirli reyonlardaki bekleme sürelerini analiz edebilir ve alışverişi iyileştirmek için kuyruk yönetimi deneyim.
  • Spor Analizi: Antrenörler ve analistler maçlar sırasında oyuncuları ve topu track için MOT kullanırlar. Bu veriler, gelişmiş poz tahmini analizini kolaylaştırarak takımlar dizilişleri, oyuncu yorgunluğunu ve oyun dinamiklerini gerçek zamanlı çıkarım senaryoları.

Python ile İzleme Uygulaması

Bu ultralytics paketi gibi güçlü izleyicileri entegre ederek MOT'ın karmaşıklığını basitleştirir. BoT-SORT ve ByteTrack doğrudan tahmine boru hattı. Bu izleyiciler argümanlar aracılığıyla kolayca değiştirilebilir.

Aşağıdaki örnekte, önceden eğitilmiş bir YOLO11 modelinin nasıl yükleneceği ve bir video dosyasına nasıl izleme uygulanacağı gösterilmektedir:

from ultralytics import YOLO

# Load an official YOLO11 model pretrained on COCO
model = YOLO("yolo11n.pt")

# Perform tracking on a video file
# 'persist=True' ensures IDs are maintained between frames
# 'tracker' allows selection of algorithms like 'bytetrack.yaml' or 'botsort.yaml'
results = model.track(source="traffic_analysis.mp4", persist=True, tracker="bytetrack.yaml")

# Visualize the results
for result in results:
    result.show()

Bu kod, algılamadan kimlik atamasına kadar tüm işlem hattını yöneterek geliştiricilerin yüksek seviyeye odaklanmasına olanak tanır bölge sayımı veya davranışsal gibi mantık analizi. Daha fazla özelleştirme için bkz. izleme modu belgeleri.

Ultralytics topluluğuna katılın

Yapay zekanın geleceğine katılın. Küresel yenilikçilerle bağlantı kurun, işbirliği yapın ve birlikte büyüyün

Şimdi katılın