استكشف التتبع متعدد الأجسام (MOT): track الأجسام وإعادة تحديدها عبر إطارات الفيديو باستخدام YOLO11 ومرشحات كالمان ومطابقة المظهر والربط الحديث للبيانات.
تعقب الأجسام المتعددة (MOT) هي مهمة محورية في مجال الرؤية الحاسوبية التي تتضمن اكتشاف عدة متعددة داخل دفق فيديو والحفاظ على هوياتها الفريدة عبر إطارات متتالية. في حين أن يحدد الكشف القياسي للكائنات ما هو موجود موجود في صورة واحدة ثابتة، يقدم MOT بُعدًا زمنيًا، حيث يجيب عن السؤال عن مكان تحرك تتحرك الأجسام المحددة بمرور الوقت. ومن خلال تعيين رقم تعريف ثابت (ID) لكل مثيل تم اكتشافه، يتيح نظام MOT الأنظمة من تحليل المسارات وفهم التفاعلات وإحصاء العناصر الفريدة، مما يجعلها مكونًا أساسيًا في تطبيقات فهم الفيديو الحديثة.
معظم أنظمة MOT المتطورة، بما في ذلك تلك التي تعمل بـ YOLO11تعمل وفق نموذج "التتبع بالكشف" النموذج. يقسّم سير العمل هذا العملية إلى مراحل متميزة تتكرر لكل إطار من الفيديو لضمان دقة عالية عالية الدقة والاستمرارية.
من المهم التمييز بين MOT والمفاهيم المماثلة لتحديد التقنية المناسبة لحالة استخدام محددة.
تدفع القدرة على track عدة أشياء في وقت واحد إلى الابتكار في مختلف الصناعات، وتحويل الفيديو الخام الخام إلى رؤى تنبؤية قابلة للتنفيذ.
إن ultralytics تعمل الحزمة على تبسيط تعقيدات MOT من خلال دمج أدوات تعقب قوية مثل
بوت-سورت و
بايت تراك مباشرةً في خط التنبؤ
مباشرةً في خط أنابيب التنبؤ. يمكن تبديل هذه المتعقبات بسهولة عبر الوسيطات.
يوضِّح المثال التالي كيفية تحميل نموذج YOLO11 المُدرَّب مسبقًا وتطبيق التتبع على ملف فيديو:
from ultralytics import YOLO
# Load an official YOLO11 model pretrained on COCO
model = YOLO("yolo11n.pt")
# Perform tracking on a video file
# 'persist=True' ensures IDs are maintained between frames
# 'tracker' allows selection of algorithms like 'bytetrack.yaml' or 'botsort.yaml'
results = model.track(source="traffic_analysis.mp4", persist=True, tracker="bytetrack.yaml")
# Visualize the results
for result in results:
result.show()
يتعامل هذا الرمز مع خط الأنابيب بأكمله، بدءًا من الاكتشاف وحتى تعيين المعرف، مما يسمح للمطورين بالتركيز على مثل عد المناطق أو التحليل السلوكي أو التحليل السلوكي. لمزيد من التخصيص، ارجع إلى وثائق وضع التتبع.