Bilgisayar görüşünde Çoklu Nesne Takibi (MOT) özelliğini keşfedin. Otonom sürüş, perakende ve daha fazlası için Ultralytics kullanarak track nasıl detect track edeceğinizi öğrenin.
Çoklu Nesne Takibi (MOT), bilgisayar görüşünde (CV) video akışı içinde birden fazla farklı nesneyi algılama ve bunların kimliklerini zaman içinde koruma işlemini içeren dinamik bir görevdir. Her kareyi izole bir anlık görüntü olarak ele alan standart nesne algılamadan farklı olarak, MOT yapay zekaya (AI) zamansal bir boyut getirir. Kalabalık içindeki belirli bir yaya veya otoyoldaki bir araç gibi algılanan her örneğe benzersiz bir kimlik numarası (ID) atayarak, MOT algoritmaları sistemlerin yörüngeleri izlemesine, davranışları analiz etmesine ve etkileşimleri anlamasına olanak tanır. Bu yetenek, modern video anlayışının temelidir ve makinelerin değişen bir ortamda sürekliliği algılamasını sağlar.
Günümüzün çoğu izleme sistemi, "algılama yoluyla izleme" paradigmasıyla çalışır. Bu yaklaşım, süreci iki ana aşamaya ayırır: çerçevede ne olduğunu belirlemek ve ardından bu bulguları geçmişte bilinen nesnelerle ilişkilendirmek.
Terminoloji benzer olsa da, Çoklu Nesne Takibi (MOT) Tekli Nesne Takibi (SOT) ile önemli ölçüde farklılık gösterir. SOT, SOT, genellikle diğer tüm varlıkları göz ardı ederek, ilk karede başlatılan belirli bir hedefi takip etmeye odaklanır. Buna karşılık, MOT, herhangi bir anda sahneye girebilecek veya sahneden çıkabilecek bilinmeyen ve değişken sayıda hedefi işlemek zorundadır. Bu, MOT'u hesaplama açısından daha zorlu hale getirir, çünkü track , sonlandırma ve birden fazla hareketli cisim arasındaki karmaşık etkileşimleri işlemek için sağlam bir mantık gerektirir.
track varlığı aynı anda track etme yeteneği, birçok önemli sektörde yenilikçiliği teşvik etmektedir.
Ultralytics , en son teknolojiye sahip modellerle izlemeyi kolayca uygulamaya koymanızı Ultralytics .
track() Yöntem, algılama ve izleme mantığını sorunsuz bir şekilde entegre eder ve aşağıdaki algoritmaları destekler:
ByteTrack ve
BoT-SORTAşağıdaki örnek,
önerilen yöntemi kullanarak bir videodaki araçları izlemeyi göstermektedir.
YOLO26 modeli.
from ultralytics import YOLO
# Load the official YOLO26 small model
model = YOLO("yolo26s.pt")
# Track objects in a video file (or use '0' for webcam)
# The 'persist=True' argument keeps track IDs consistent between frames
results = model.track(source="traffic_analysis.mp4", show=True, persist=True)
# Print the IDs of objects tracked in the first frame
if results[0].boxes.id is not None:
print(f"Tracked IDs: {results[0].boxes.id.int().tolist()}")
İlerlemelere rağmen, MOT zorlu bir alan olmaya devam ediyor. Örtülme birincil zorluktur; nesneler yollarını kesiştiğinde veya engellerin arkasına saklandığında, kimliklerini korumak karmaşıktır. Kalabalık sahneler, yoğun bir maraton veya bir kuş sürüsü gibi, veri ilişkilendirme algoritmalarının sınırlarını zorlar. Ayrıca, yüksek çözünürlüklü video akışlarını işlerken gerçek zamanlı çıkarım hızlarını korumak, verimli model mimarileri ve genellikle NVIDIA cihazları gibi özel donanımlar gerektirir. Bu, nesnelerin kimliklerini korumak için
Bu zorlukları aşmak için araştırmacılar, algılama ve izlemeyi tek bir ağda birleştiren uçtan uca derin öğrenme yaklaşımlarını araştırıyor ve Ultralytics kullanarak zorlu veri kümelerini açıklamaya ve sağlam özel modeller eğitmeye çalışıyorlar.