Yolo Vision Shenzhen
Shenzhen
Şimdi katılın
Sözlük

Çoklu Nesne Takibi (MOT)

Çoklu Nesne Takibini (MOT) keşfedin: YOLO11, Kalman Filtreleri, görünüm eşleştirme ve modern veri ilişkilendirme ile video karelerindeki nesneleri track ve yeniden tanımlayın.

Çoklu Nesne Takibi (MOT), bilgisayar görme (CV) bir sistemlerin bir dizi video karesi boyunca birden fazla benzersiz nesneyi detect, tanımlamasını ve izlemesini sağlayan sofistike bir özelliktir. Standart nesne nesne algılama, her görüntü karesini izole bir olay olarak ele alırken, MOT yapay zekaya (AI) yapay zeka (AI). Trafikteki belirli bir araba veya spor sahasındaki bir oyuncu gibi algılanan her örneğe kalıcı bir kimlik numarası (ID) atayarak, MOT algoritmaların nesnelerin hareket ederken, etkileşime girerken ve hatta engellerin arkasında geçici olarak kaybolurken kimliklerini korumalarını sağlar. Bu süreklilik, modern video anlayışının temelidir. MOT, nesneleri algılama ve tanımlama konusunda geleneksel yöntemlerden daha başarılıdır. video anlama ve davranış analizinin

Takip Sistemlerinin Mekaniği

En son teknolojiyle çalışanlar da dahil olmak üzere çoğu çağdaş MOT sistemi YOLO26ile çalışanlar da dahil olmak üzere, "algılama yoluyla izleme" paradigmasıyla çalışır. Bu iş akışı, yüksek doğruluğu sağlamak için algılama ve ilişkilendirme döngüsüne dayanır . doğruluk ve minimum kimlik değiştirme sağlamak için algılama ve ilişkilendirme döngüsüne dayanır.

  1. Algılama: Her karede, YOLO26 veya önceki nesil gibi yüksek hızlı bir model YOLO11 sahneyi tarayarak nesneleri bulur ve sınırlayıcı kutular oluşturur sınırlayıcı kutular ve sınıf olasılıkları
  2. Hareket Tahmini: Bir nesnenin bir sonraki hareketini tahmin etmek için algoritmalar, Kalman Filtre gibi matematiksel tahmincileri kullanır. Kalman Filtresigibi matematiksel tahmincileri kullanır. Bu, hız ve yörüngeye dayalı oluşturur ve sonraki kare için arama alanını daraltır.
  3. Veri İlişkilendirme: Sistem, yeni algılamaları mevcut izlerle eşleştirir. Macar algoritması Macar algoritması bu eşleştirme sorununu, genellikle Birleşim Üzerine Kesişim (IoU) Birleşim Üzerine Kesişim (IoU) kullanarak uzamsal örtüşmeyi ölçer.
  4. Yeniden Tanımlama (ReID): Görsel engeller oluştuğunda ( oklüzyonolarak bilinir), gelişmiş izleyiciler görsel gömülü öğeleri kullanarak nesneyi tekrar ortaya çıktığında tanır ve onu yeni bir varlık olarak ele almak yerine orijinal kimliğini korur.

MOT ve İlgili Kavramlar

MOT ve benzer makine öğrenimi (ML) terimleri arasındaki farkı anlamak doğru aracı seçmek için çok önemlidir.

  • vs. Nesne Algılama: Algılama, statik bir görüntüde "ne ve nerede" sorularını yanıtlar. Bir kişi Çerçeve 1 ve Çerçeve 2'de görünürse, algılayıcı iki ayrı kişi görür. MOT, bunların zaman içinde hareket eden aynı kişi olduğunu anlayarak onları birbirine bağlar.
  • vs. Tek Nesne Takibi (SOT): SOT, genellikle kullanıcı tarafından manuel olarak başlatılan belirli bir hedefi takip etmeye odaklanır ve diğer dikkat dağıtıcı unsurlara bakılmaksızın onu takip eder. MOT, sahneye giren ve çıkan bilinmeyen, değişken sayıda track otonom olarak detect track gerektiğinden daha karmaşıktır ve sağlam güçlü bir bellek yönetimi mantığı gerektirir.

Gerçek Dünya Uygulamaları

Video akışlarını yapılandırılmış verilere dönüştürme yeteneği, sektörler genelinde yeniliği teşvik ederek öngörüsel modelleme ve otomatik karar vermeyi mümkün kılar.

  • Akıllı Ulaşım Sistemleri: Otomotiv sektöründe yapay zeka otomotiv sektöründe, MOT otonom araçlar ve akıllı şehir altyapısı için vazgeçilmezdir. Bu sistem, hız tahminini ve yayaların ve bisikletlilerin yörüngelerini tahmin ederek kazaların önlenmesine yardımcı olur.
  • Perakende Analitiği: Fiziksel mağazalar perakende sektöründe tüketici davranışını analiz etmek için kullanır. Nesne sayımı için MOT uygulayarak nesne sayımıuygulayarak, perakendeciler trafiğin yoğun olduğu koridorların ısı haritalarını oluşturabilir, bekleme sürelerini izleyebilir ve kuyruk yönetimini süresini optimize edebilirler. kasa

Python ile İzleme Uygulaması

Bu ultralytics paket, MOT için kesintisiz bir arayüz sağlar ve aşağıdaki gibi güçlü algoritmaları entegre eder: BoT-SORT ve ByteTrackAşağıdaki örnek, bir modeli yüklemeyi ve video akışındaki track göstermektedir.

from ultralytics import YOLO

# Load a pre-trained YOLO model (YOLO11n is used here, YOLO26n is also supported)
model = YOLO("yolo11n.pt")

# Perform tracking on a video source
# 'persist=True' ensures tracks are maintained between frames
results = model.track(source="https://youtu.be/LNwODJXcvt4", persist=True, tracker="bytetrack.yaml")

# Visualize the first frame's results with IDs drawn
results[0].show()

Bu basit iş akışı, algılama, ilişkilendirme ve kimlik atamayı otomatik olarak gerçekleştirir ve geliştiricilerin bölge sayma gibi daha üst düzey mantığa bölge sayma veya davranışsal tetikleyiciler gibi daha üst düzey mantığa odaklanmalarını sağlar. Yapılandırma hakkında daha fazla bilgi için izleme modu belgelerine.

Ultralytics topluluğuna katılın

Yapay zekanın geleceğine katılın. Küresel yenilikçilerle bağlantı kurun, işbirliği yapın ve birlikte büyüyün

Şimdi katılın