Multi-Object Tracking (MOT)
Bilgisayarlı görüde Çoklu Nesne Takibini (MOT) keşfet. Otonom sürüş, perakende ve daha fazlası için Ultralytics YOLO26 kullanarak varlıkları nasıl tespit edip takip edeceğini öğren.
Çoklu Nesne Takibi (MOT), bir video akışındaki birden fazla farklı varlığı tespit etmeyi ve kimliklerini zaman içinde korumayı içeren bilgisayarlı görü (CV) alanındaki dinamik bir görevdir. Her kareyi bağımsız bir anlık görüntü olarak ele alan standart nesne algılama yönteminin aksine, MOT yapay zekaya (AI) zamansal bir boyut katar. MOT algoritmaları, kalabalıktaki belirli bir yaya veya otoyoldaki bir araç gibi tespit edilen her bir örneğe benzersiz bir kimlik numarası (ID) atayarak, sistemlerin yörüngeleri izlemesine, davranışları analiz etmesine ve etkileşimleri anlamasına olanak tanır. Bu yetenek, modern video anlama teknolojisinin temelidir ve makinelerin değişen bir ortamda sürekliliği algılamasını sağlar.
Link to this sectionMOT Nasıl Çalışır?#
Güncel takip sistemlerinin çoğu "algılama ile takip" (tracking-by-detection) paradigması üzerinde çalışır. Bu yaklaşım, süreci iki ana aşamaya ayırır: kare içinde ne olduğunu tanımlamak ve ardından bu bulguları geçmişten gelen bilinen nesnelerle ilişkilendirmek.
-
Algılama: Her karede, YOLO26 gibi yüksek performanslı bir model görüntüyü tarayarak nesneleri konumlandırır ve sınırlayıcı kutular ile sınıf olasılıklarını oluşturur.
-
Hareket Tahmini: Algoritmalar, bir nesnenin bir sonraki hamlesini tahmin etmek için genellikle bir Kalman Filtresi kullanır. Bu matematiksel araç, hız ve konum gibi dinamik bir sistemin durumunu tahmin ederek sonraki karedeki arama alanını daraltmaya yardımcı olur.
-
Veri İlişkilendirme: Sistem, yeni algılamaları mevcut izlerle eşleştirir. Macar algoritması gibi optimizasyon yöntemleri, genellikle uzamsal örtüşmeyi ölçmek için Kesişim Üzerinden Birleşim (IoU) değerine dayanarak eşleştirme maliyetini en aza indirerek bu atama problemini çözer.
-
Yeniden Tanımlama (ReID): Tıkanma (oklüzyon) olarak bilinen görsel engeller oluştuğunda, gelişmiş takipçiler nesne yeniden ortaya çıktığında onu tanımak için görsel gömüleri (embeddings) kullanır. Bu, tünelden çıkan aracın girenle aynı olduğunu sistemin bilmesini sağlayarak "ID değiştirme" hatalarını önlemeye yardımcı olur.
Link to this sectionMOT'u Tek Nesne Takibinden Ayırmak#
Terminoloji benzer olsa da, Çoklu Nesne Takibi (MOT), Tek Nesne Takibinden (SOT) önemli ölçüde farklıdır. SOT, ilk karede başlatılan belirli bir hedefin izlenmesine odaklanır ve genellikle diğer tüm varlıkları görmezden gelir. Buna karşılık MOT, herhangi bir anda sahneye girebilecek veya sahneden ayrılabilecek bilinmeyen ve değişken sayıdaki hedefi yönetmelidir. Bu durum, iz başlatma, sonlandırma ve birden fazla hareketli gövde arasındaki karmaşık etkileşimleri yönetmek için sağlam bir mantık gerektirdiğinden, MOT'u hesaplama açısından daha zorlu kılar.
Link to this sectionGerçek Dünya Uygulamaları#
Birden fazla varlığı aynı anda takip edebilme yeteneği, birçok büyük endüstride inovasyonu yönlendirir.
- Otonom Sürüş: Kendi kendine giden araçlar, güvenli bir şekilde ilerlemek için büyük ölçüde MOT'a güvenir. Yayaları, bisikletlileri ve diğer araçları takip ederek, otonom sistemler çarpışmaları önlemek için gelecekteki konumları tahmin edebilir. Bu işlem genellikle maksimum güvenilirlik için kameralardan ve LiDAR sensörlerinden gelen verilerin birleştirilmesini içerir.
- Perakende Analitiği: Fiziksel mağazalarda perakendeciler, müşteri yolculuklarını haritalamak için perakendede yapay zekayı kullanır. MOT algoritmaları yaya trafiğinin ısı haritalarını oluşturarak yöneticilerin mağaza düzenlerini optimize etmelerine ve yoğun saatlerde sıra yönetimini iyileştirmelerine yardımcı olur.
- Spor Analitiği: Profesyonel takımlar, oyuncu hareketlerini ve takım oluşumlarını analiz etmek için MOT'u kullanır. Sahadaki her oyuncuyu takip ederek, antrenörler poz tahmini tekniklerini kullanarak hız, katedilen mesafe ve taktiksel konumlandırma hakkında ayrıntılı metrikler elde edebilir.
Link to this sectionPython ile MOT Uygulama#
Ultralytics, en son teknoloji modellerle takip uygulamayı kolaylaştırır. track() metodu, algılama ve takip mantığını sorunsuz bir şekilde entegre eder ve ByteTrack ile BoT-SORT gibi algoritmaları destekler. Aşağıdaki örnek, önerilen YOLO26 modelini kullanarak bir videodaki araçların takibini göstermektedir.
from ultralytics import YOLO
# Load the official YOLO26 small model
model = YOLO("yolo26s.pt")
# Track objects in a video file (or use '0' for webcam)
# The 'persist=True' argument keeps track IDs consistent between frames
results = model.track(source="traffic_analysis.mp4", show=True, persist=True)
# Print the IDs of objects tracked in the first frame
if results[0].boxes.id is not None:
print(f"Tracked IDs: {results[0].boxes.id.int().tolist()}")Link to this sectionÇoklu Nesne Takibindeki Zorluklar#
İlerlemelere rağmen, MOT zorlu bir alan olmaya devam ediyor. Tıkanma (Occlusion) birincil zorluktur; nesneler yollarını kestiğinde veya engellerin arkasına saklandığında kimliği korumak karmaşıktır. Kalabalık bir maraton veya bir kuş sürüsü gibi kalabalık sahneler, veri ilişkilendirme algoritmalarının sınırlarını test eder. Ayrıca, yüksek çözünürlüklü video akışlarını işlerken gerçek zamanlı çıkarım hızlarını korumak, verimli model mimarileri ve genellikle NVIDIA Jetson cihazları gibi özel donanımlar gerektirir.
Bu zorlukları ele almak için araştırmacılar, algılama ve takibi tek bir ağda birleştiren uçtan uca derin öğrenme yaklaşımlarını keşfediyor ve zorlu veri setlerini etiketlemek ve güçlü özel modeller eğitmek için Ultralytics Platform'dan yararlanıyor.






