Çoklu Nesne Takibini (MOT) keşfedin: YOLO11, Kalman Filtreleri, görünüm eşleştirme ve modern veri ilişkilendirme ile video karelerindeki nesneleri track ve yeniden tanımlayın.
Çoklu Nesne Takibi (MOT), bilgisayar görme (CV) bir sistemlerin bir dizi video karesi boyunca birden fazla benzersiz nesneyi detect, tanımlamasını ve izlemesini sağlayan sofistike bir özelliktir. Standart nesne nesne algılama, her görüntü karesini izole bir olay olarak ele alırken, MOT yapay zekaya (AI) yapay zeka (AI). Trafikteki belirli bir araba veya spor sahasındaki bir oyuncu gibi algılanan her örneğe kalıcı bir kimlik numarası (ID) atayarak, MOT algoritmaların nesnelerin hareket ederken, etkileşime girerken ve hatta engellerin arkasında geçici olarak kaybolurken kimliklerini korumalarını sağlar. Bu süreklilik, modern video anlayışının temelidir. MOT, nesneleri algılama ve tanımlama konusunda geleneksel yöntemlerden daha başarılıdır. video anlama ve davranış analizinin
En son teknolojiyle çalışanlar da dahil olmak üzere çoğu çağdaş MOT sistemi YOLO26ile çalışanlar da dahil olmak üzere, "algılama yoluyla izleme" paradigmasıyla çalışır. Bu iş akışı, yüksek doğruluğu sağlamak için algılama ve ilişkilendirme döngüsüne dayanır . doğruluk ve minimum kimlik değiştirme sağlamak için algılama ve ilişkilendirme döngüsüne dayanır.
MOT ve benzer makine öğrenimi (ML) terimleri arasındaki farkı anlamak doğru aracı seçmek için çok önemlidir.
Video akışlarını yapılandırılmış verilere dönüştürme yeteneği, sektörler genelinde yeniliği teşvik ederek öngörüsel modelleme ve otomatik karar vermeyi mümkün kılar.
Bu ultralytics paket, MOT için kesintisiz bir arayüz sağlar ve aşağıdaki gibi güçlü algoritmaları entegre eder:
BoT-SORT ve
ByteTrackAşağıdaki örnek, bir modeli yüklemeyi ve video akışındaki track göstermektedir.
from ultralytics import YOLO
# Load a pre-trained YOLO model (YOLO11n is used here, YOLO26n is also supported)
model = YOLO("yolo11n.pt")
# Perform tracking on a video source
# 'persist=True' ensures tracks are maintained between frames
results = model.track(source="https://youtu.be/LNwODJXcvt4", persist=True, tracker="bytetrack.yaml")
# Visualize the first frame's results with IDs drawn
results[0].show()
Bu basit iş akışı, algılama, ilişkilendirme ve kimlik atamayı otomatik olarak gerçekleştirir ve geliştiricilerin bölge sayma gibi daha üst düzey mantığa bölge sayma veya davranışsal tetikleyiciler gibi daha üst düzey mantığa odaklanmalarını sağlar. Yapılandırma hakkında daha fazla bilgi için izleme modu belgelerine.