Çoklu Nesne Takibi (MOT)
Çoklu Nesne Takibini (MOT) keşfedin: YOLO11, Kalman Filtreleri, görünüm eşleştirme ve modern veri ilişkilendirme ile video karelerindeki nesneleri track ve yeniden tanımlayın.
Çoklu Nesne Takibi (MOT), aşağıdaki alanlarda çok önemli bir görevdir
çoklu algılamayı içeren bilgisayar görüşü
Bir video akışı içindeki farklı varlıklar ve bunların ardışık kareler boyunca benzersiz kimliklerini korumaları. Bir yandan
standart nesne tespiti neyin ne olduğunu tanımlar
Tek bir statik görüntüde mevcut olan MOT, zamansal bir boyut getirerek belirli bir görüntünün nerede olduğu sorusuna cevap verir.
nesneler zaman içinde hareket eder. MOT, tespit edilen her örneğe kalıcı bir kimlik numarası (ID) atayarak
yörüngeleri analiz etmek, etkileşimleri anlamak ve benzersiz öğeleri saymak için sistemler, onu
modern video anlama uygulamaları.
Takip Sistemlerinin Mekaniği
En son teknoloji MOT sistemleri, aşağıdakiler tarafından desteklenenler de dahil olmak üzere
YOLO11"tespit ederek izleme" yöntemiyle çalışırlar.
paradigma. Bu iş akışı, süreci videonun her karesi için tekrarlanan farklı aşamalara ayırarak yüksek
doğruluk ve süreklilik.
-
Algılama: Sistem ilk olarak ilgilenilen nesneleri bulmak için yüksek performanslı bir model kullanır,
sınırlayıcı kutular oluşturma ve
güven puanları.
-
Hareket Tahmini: Tespitleri çerçeveler arasında ilişkilendirmek için, aşağıdaki gibi algoritmalar
Kalman Filtresi bir nesnenin gelecekteki konumunu tahmin eder.
nesnenin geçmişteki hızına ve konumuna bağlı olarak. Bu bir
için arama alanını daraltan durum tahmini
Bir sonraki kare.
-
Veri İlişkilendirme: Sistem yeni tespitleri mevcut izlerle eşleştirir. Optimizasyon teknikleri
Macar algoritması gibi bu sorunu çözer
eşleştirme maliyetini en aza indirerek atama problemi, genellikle
Birlik üzerinde kesişme (IoU) arasında
tahmin edilen track ve yeni tespit.
-
Yeniden Kimlik Belirleme (ReID): Nesnelerin yollarının kesiştiği veya geçici olarak gizlendiği senaryolarda - bir
oklüzyon-ileri olarak bilinen fenomen
izleyiciler nesneyi tanımak için görsel katıştırmaları kullanır
yeniden göründüğünde, kimlik değiştirmeyi önler.
MOT ve İlgili Bilgisayarla Görme Terimleri
Belirli bir kullanım durumuna uygun teknolojiyi seçmek için MOT'yi benzer kavramlardan ayırt etmek önemlidir.
-
Nesne Algılamaya karşı: Algılama her kareyi bağımsız bir olay olarak ele alır. Eğer bir araç görünürse
Ardışık iki karede, bir dedektör iki ayrı "araba" örneği görür. Tam tersine,
nesne izleme bu örnekleri birbirine bağlar,
Onları zaman içinde hareket eden aynı araç olarak tanımak.
-
Tek Nesne Takibine (SOT) karşı: SOT, hedef tarafından başlatılan belirli bir hedefi takip etmeye odaklanır.
kullanıcı, genellikle diğer tüm faaliyetleri göz ardı eder. MOT daha karmaşıktır, çünkü bir aracı otonom olarak detect etmesi, track ve yönetmesi gerekir.
sahneye giren ve çıkan nesnelerin sayısının bilinmemesi ve dalgalanması, sağlam
bellek yönetimi mantığı.
Gerçek Dünya Uygulamaları
Birden fazla nesneyi aynı anda track yeteneği, ham videoyu dönüştürerek çeşitli sektörlerde inovasyonu teşvik eder
verileri eyleme dönüştürülebilir
tahmine dayalı modelleme içgörüleri.
-
Akıllı Ulaşım: Bu alanda
Otomotivde yapay zeka, MOT için kritik öneme sahiptir
otonom sürüş ve trafik izleme. Sistemlerin aşağıdakileri gerçekleştirmesini sağlar
a mesafesini hesaplayarak hız tahmini
Araçların zaman içindeki hareketleri ve yayaların yörüngelerini izleyerek olası çarpışmaları tahmin etmeye yardımcı olur.
bisikletçiler.
-
Perakende Analitiği: Tuğla ve harç mağazaları kaldıraç
Müşteri davranışlarını anlamak için perakendede yapay zeka. Tarafından
hassas nesne sayımı için MOT uygulamak,
perakendeciler yaya trafiğini ölçebilir, belirli reyonlardaki bekleme sürelerini analiz edebilir ve
alışverişi iyileştirmek için kuyruk yönetimi
deneyim.
-
Spor Analizi: Antrenörler ve analistler maçlar sırasında oyuncuları ve topu track için MOT kullanırlar. Bu
veriler, gelişmiş poz tahmini analizini kolaylaştırarak
takımlar dizilişleri, oyuncu yorgunluğunu ve oyun dinamiklerini
gerçek zamanlı çıkarım senaryoları.
Python ile İzleme Uygulaması
Bu ultralytics paketi gibi güçlü izleyicileri entegre ederek MOT'ın karmaşıklığını basitleştirir.
BoT-SORT ve
ByteTrack doğrudan tahmine
boru hattı. Bu izleyiciler argümanlar aracılığıyla kolayca değiştirilebilir.
Aşağıdaki örnekte, önceden eğitilmiş bir YOLO11 modelinin nasıl yükleneceği ve bir video dosyasına nasıl izleme uygulanacağı gösterilmektedir:
from ultralytics import YOLO
# Load an official YOLO11 model pretrained on COCO
model = YOLO("yolo11n.pt")
# Perform tracking on a video file
# 'persist=True' ensures IDs are maintained between frames
# 'tracker' allows selection of algorithms like 'bytetrack.yaml' or 'botsort.yaml'
results = model.track(source="traffic_analysis.mp4", persist=True, tracker="bytetrack.yaml")
# Visualize the results
for result in results:
result.show()
Bu kod, algılamadan kimlik atamasına kadar tüm işlem hattını yöneterek geliştiricilerin yüksek seviyeye odaklanmasına olanak tanır
bölge sayımı veya davranışsal gibi mantık
analizi. Daha fazla özelleştirme için bkz.
izleme modu belgeleri.