Bilgisayar görüşünde nesne izleme nasıl çalışır öğrenin. Ultralytics kullanarak benzersiz kimlik numaralarıyla nesneleri tanımlamak ve izlemek için gerçek zamanlı analiz yapmayı keşfedin.
Nesne izleme, bilgisayar görüşünde (CV) bir videodaki belirli nesneleri tanımlama ve bir dizi karede hareketlerini izlemeyi içeren dinamik bir süreçtir. Her bir anlık görüntüyü ayrı ayrı ele alan statik görüntü analizinden farklı olarak, izleme zaman boyutunu da devreye sokar. Bu, yapay zeka (AI) sistemlerinin algılanan her bir öğeye (örneğin araba, kişi veya hayvan) benzersiz bir kimlik numarası (ID) atamasını ve nesne hareket ederken, yön değiştirirken veya geçici olarak gizlendiğinde bu kimliği korumayı sağlar. Bu yetenek, makinelerin davranışları analiz etmesini, yörüngeleri hesaplamasını ve ham görüntülerden eyleme geçirilebilir içgörüler elde etmesini sağlayan gelişmiş video anlayışının temel taşıdır.
Modern izleme sistemleri genellikle "algılama yoluyla izleme" paradigmasını kullanır. Bu iş akışı, güçlü algılama modellerini, zaman içindeki algılamaları ilişkilendirmek için özel algoritmalarla birleştirir. Süreç genellikle üç ana aşamadan oluşur:
Bu terimler birbiriyle yakından ilişkili olsa da, makine öğrenimi (ML) sürecinde farklı işlevlere sahiptir.
Nesne kimliğini koruma yeteneği, çeşitli endüstrilerde karmaşık gerçek zamanlı çıkarım uygulamalarını mümkün kılar.
Ultralytics , yüksek performanslı izlemeyi kolayca uygulamaya koymanızı Ultralytics . track kütüphanedeki mod
otomatik olarak algılama, hareket tahmini ve kimlik atamayı gerçekleştirir. Aşağıdaki örnek,
Ultralytics Platformu bir videodaki track için uyumlu YOLO26 modeli.
video.
from ultralytics import YOLO
# Load the official YOLO26n model (nano version for speed)
model = YOLO("yolo26n.pt")
# Track objects in a video file or webcam (source=0)
# 'show=True' displays the video with bounding boxes and unique IDs
results = model.track(source="https://ultralytics.com/images/bus.jpg", show=True)
# Access the unique tracking IDs from the results
if results[0].boxes.id is not None:
print(f"Detected Track IDs: {results[0].boxes.id.cpu().numpy()}")
İzleme ekosistemini tam olarak anlamak için, sadece bir kutu yerine nesnenin piksel düzeyinde kesin konturlarını izleyen örnek segmentasyonunu incelemek faydalıdır. Ayrıca, Çoklu Nesne İzleme (MOT) zorlukları genellikle, algoritmaların kalabalık sahneleri ve örtülmeleri ne kadar iyi işlediğini değerlendirmek için MOTChallenge gibi yaygın olarak kullanılan karşılaştırma ölçütlerini içerir. Üretim ortamlarında dağıtım için, geliştiriciler genellikle NVIDIA veya OpenCV gibi araçları kullanarak bu modelleri verimli iş akışlarına entegre ederler.