Yolo فيجن شنتشن
شنتشن
انضم الآن
مسرد المصطلحات

التتبع متعدد الأجسام (MOT)

استكشف التتبع متعدد الأجسام (MOT): track الأجسام وإعادة تحديدها عبر إطارات الفيديو باستخدام YOLO11 ومرشحات كالمان ومطابقة المظهر والربط الحديث للبيانات.

تعقب الأجسام المتعددة (MOT) هي مهمة محورية في مجال الرؤية الحاسوبية التي تتضمن اكتشاف عدة متعددة داخل دفق فيديو والحفاظ على هوياتها الفريدة عبر إطارات متتالية. في حين أن يحدد الكشف القياسي للكائنات ما هو موجود موجود في صورة واحدة ثابتة، يقدم MOT بُعدًا زمنيًا، حيث يجيب عن السؤال عن مكان تحرك تتحرك الأجسام المحددة بمرور الوقت. ومن خلال تعيين رقم تعريف ثابت (ID) لكل مثيل تم اكتشافه، يتيح نظام MOT الأنظمة من تحليل المسارات وفهم التفاعلات وإحصاء العناصر الفريدة، مما يجعلها مكونًا أساسيًا في تطبيقات فهم الفيديو الحديثة.

ميكانيكا أنظمة التتبع

معظم أنظمة MOT المتطورة، بما في ذلك تلك التي تعمل بـ YOLO11تعمل وفق نموذج "التتبع بالكشف" النموذج. يقسّم سير العمل هذا العملية إلى مراحل متميزة تتكرر لكل إطار من الفيديو لضمان دقة عالية عالية الدقة والاستمرارية.

  1. الكشف: يستخدم النظام أولاً نموذجًا عالي الأداء لتحديد مواقع الأجسام ذات الأهمية, وإنشاء مربعات محددة و ودرجات الثقة.
  2. التنبؤ بالحركة: للربط بين الاكتشافات عبر الإطارات، تقوم خوارزميات مثل Kalman Filter تقدير الموقع المستقبلي للجسم بناءً على سرعته وموقعه في الماضي. يؤدي هذا إلى إنشاء تقدير الحالة الذي يضيّق منطقة البحث للإطار الإطار التالي.
  3. ربط البيانات: يطابق النظام عمليات الكشف الجديدة مع المسارات الموجودة. تقنيات التحسين مثل الخوارزمية الهنغارية لحل هذه مشكلة التخصيص هذه عن طريق تقليل تكلفة المطابقة، وغالبًا ما تحسب التقاطع على الاتحاد (IoU) بين track المتوقع والكشف الجديد.
  4. إعادة تحديد الهوية (ReID): في السيناريوهات التي تتقاطع فيها الأجسام مع بعضها البعض أو تكون مخفية مؤقتًا - وهي ظاهرة ظاهرة تُعرف باسم الانسداد - تستخدم أجهزة التتبع المتقدمة تستخدم أجهزة التعقب المتقدمة التضمينات البصرية للتعرف على الكائن عندما يظهر مرة أخرى، مما يمنع تبديل الهوية.

MOT مقابل مصطلحات الرؤية الحاسوبية ذات الصلة

من المهم التمييز بين MOT والمفاهيم المماثلة لتحديد التقنية المناسبة لحالة استخدام محددة.

  • مقابل اكتشاف الكائن: يعامل الكشف كل إطار كحدث مستقل. إذا ظهرت سيارة في إطارين متتاليين، فإن الكاشف يرى حالتين منفصلتين من "السيارة". على النقيض من ذلك, يربط تتبع الكائنات بين هذه الحالات, والتعرف عليها على أنها نفس السيارة التي تتحرك عبر الزمن.
  • مقابل تتبع الهدف الواحد (SOT): يركز SOT على تتبع هدف واحد محدد تم تهيئته من قبل المستخدم، وغالبًا ما يتجاهل جميع الأنشطة الأخرى. يعد نظام MOT أكثر تعقيدًا حيث يجب أن detect track ويدير بشكل مستقل عددًا غير معروف ومتقلبًا من الأجسام التي تدخل المشهد وتخرج منه. عدد غير معروف ومتذبذب من الأجسام التي تدخل المشهد وتخرج منه، مما يتطلب منطقًا قويًا لإدارة الذاكرة منطق قوي لإدارة الذاكرة.

تطبيقات واقعية

تدفع القدرة على track عدة أشياء في وقت واحد إلى الابتكار في مختلف الصناعات، وتحويل الفيديو الخام الخام إلى رؤى تنبؤية قابلة للتنفيذ.

تنفيذ التتبع باستخدام Python

إن ultralytics تعمل الحزمة على تبسيط تعقيدات MOT من خلال دمج أدوات تعقب قوية مثل بوت-سورت و بايت تراك مباشرةً في خط التنبؤ مباشرةً في خط أنابيب التنبؤ. يمكن تبديل هذه المتعقبات بسهولة عبر الوسيطات.

يوضِّح المثال التالي كيفية تحميل نموذج YOLO11 المُدرَّب مسبقًا وتطبيق التتبع على ملف فيديو:

from ultralytics import YOLO

# Load an official YOLO11 model pretrained on COCO
model = YOLO("yolo11n.pt")

# Perform tracking on a video file
# 'persist=True' ensures IDs are maintained between frames
# 'tracker' allows selection of algorithms like 'bytetrack.yaml' or 'botsort.yaml'
results = model.track(source="traffic_analysis.mp4", persist=True, tracker="bytetrack.yaml")

# Visualize the results
for result in results:
    result.show()

يتعامل هذا الرمز مع خط الأنابيب بأكمله، بدءًا من الاكتشاف وحتى تعيين المعرف، مما يسمح للمطورين بالتركيز على مثل عد المناطق أو التحليل السلوكي أو التحليل السلوكي. لمزيد من التخصيص، ارجع إلى وثائق وضع التتبع.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن