Object Tracking
تعرف على كيفية عمل تتبع الكائنات في رؤية الكمبيوتر. اكتشف كيفية استخدام Ultralytics YOLO26 لتحديد ومراقبة الكائنات بمعرفات فريدة للتحليل في الوقت الفعلي.
تتبع الكائنات هو عملية ديناميكية في رؤية الحاسوب (CV) تتضمن تحديد كيانات معينة في مقطع فيديو ومراقبة حركتها عبر تسلسل من الإطارات. على عكس تحليل الصور الثابتة، الذي يعامل كل لقطة بشكل منفصل، يقدم التتبع بُعد الزمن. يسمح هذا لأنظمة الذكاء الاصطناعي (AI) بتعيين رقم تعريف فريد (ID) لكل عنصر مكتشف - مثل سيارة أو شخص أو حيوان - والحفاظ على هذه الهوية بينما يتحرك الكائن، أو يغير اتجاهه، أو يُحجب مؤقتاً. تُعد هذه القدرة حجر الزاوية في فهم الفيديو المتقدم، مما يمكّن الآلات من تحليل السلوك، وحساب المسارات، واستخلاص رؤى قابلة للتنفيذ من اللقطات الخام.
Link to this sectionكيف يعمل تتبع الكائنات#
تستخدم أنظمة التتبع الحديثة بشكل عام نموذج "التتبع عبر الكشف". يجمع سير العمل هذا بين نماذج كشف قوية وخوارزميات متخصصة لربط عمليات الكشف بمرور الوقت. تتبع العملية عادةً ثلاث مراحل رئيسية:
-
الكشف: في كل إطار، يقوم نموذج كشف الكائنات، مثل نموذج YOLO26 المتطور، بمسح الصورة لتحديد مواقع الكائنات محل الاهتمام. يُخرج النموذج صناديق محيطة (bounding boxes) تحدد النطاق المكاني لكل كائن.
-
توقع الحركة: تُقدّر خوارزميات مثل مرشح كالمان الموضع المستقبلي للكائن بناءً على سرعته ومساره الحاليين. يقلل هذا التوقع من مساحة البحث للإطار التالي، مما يجعل النظام أكثر كفاءة.
-
ربط البيانات: يطابق النظام عمليات الكشف الجديدة بالمسارات الموجودة باستخدام طرق تحسين مثل الخوارزمية المجرية. تعتمد هذه الخطوة غالباً على مقاييس مثل التقاطع فوق الاتحاد (IoU) لقياس مدى تداخل الصندوق المتوقع مع كشف جديد. قد تستخدم أجهزة التتبع المتقدمة أيضاً استخراج الميزات المرئية لإعادة تحديد الكائنات التي تبدو متشابهة.
Link to this sectionتتبع الكائنات مقابل كشف الكائنات#
على الرغم من ارتباط هذين المصطلحين ارتباطاً وثيقاً، إلا أنهما يؤديان وظائف متميزة داخل خط أنابيب تعلم الآلة (ML).
- كشف الكائنات يجيب على السؤال، "ما الموجود في هذه الصورة وأين؟". هو نظام عديم الحالة (stateless)، مما يعني أنه لا يمتلك ذاكرة للإطارات السابقة. إذا قادت سيارة عبر مقطع فيديو، يرى الكاشف "سيارة" في الإطار 1 و "سيارة" في الإطار 2، لكنه لا يعرف أنهما نفس المركبة.
- تتبع الكائنات يجيب على السؤال، "إلى أين يتجه هذا الكائن المحدد؟". هو نظام ذو حالة (stateful). يربط "السيارة" في الإطار 1 بـ "السيارة" في الإطار 2، مما يسمح للنظام بتسجيل أن "السيارة رقم 42" تتحرك من اليسار إلى اليمين. هذا ضروري لمهام مثل النمذجة التنبؤية والعد.
Link to this sectionتطبيقات العالم الحقيقي#
القدرة على الحفاظ على هوية الكائن تُمكّن تطبيقات الاستدلال في الوقت الفعلي المعقدة عبر مختلف الصناعات.
- أنظمة النقل الذكية: التتبع حيوي لـ المركبات ذاتية القيادة للتنقل بأمان. من خلال تتبع المشاة والمركبات الأخرى، يمكن للسيارات توقع الاصطدامات المحتملة. علاوة على ذلك، يستخدم مهندسو المرور هذه الأنظمة لـ تقدير السرعة لفرض لوائح السلامة وتحسين تدفق حركة المرور.
- تحليلات التجزئة: تستخدم المتاجر التقليدية الذكاء الاصطناعي في التجزئة لفهم سلوك العملاء. يسمح التتبع لمديري المتاجر بإجراء عد الكائنات لقياس حركة المشاة، وتحليل فترات البقاء أمام الشاشات باستخدام الخرائط الحرارية، وتحسين إدارة الطوابير لتقليل أوقات الانتظار.
- تحليل الرياضة: في الرياضات الاحترافية، يستخدم المدربون التتبع مدمجاً مع تقدير الوضعية لتحليل الميكانيكا الحيوية للاعبين وتشكيلات الفرق. توفر هذه البيانات ميزة تنافسية من خلال كشف الأنماط التي لا يمكن للعين المجردة رؤيتها.
Link to this sectionتنفيذ التتبع باستخدام Python#
تُسهّل Ultralytics تنفيذ تتبع عالي الأداء. يتعامل وضع track في المكتبة تلقائياً مع الكشف، وتوقع الحركة، وتعيين الهوية. يوضح المثال أدناه كيفية استخدام نموذج YOLO26 المتوافق مع منصة Ultralytics لتتبع الكائنات في مقطع فيديو.
from ultralytics import YOLO
# Load the official YOLO26n model (nano version for speed)
model = YOLO("yolo26n.pt")
# Track objects in a video file or webcam (source=0)
# 'show=True' displays the video with bounding boxes and unique IDs
results = model.track(source="https://ultralytics.com/images/bus.jpg", show=True)
# Access the unique tracking IDs from the results
if results[0].boxes.id is not None:
print(f"Detected Track IDs: {results[0].boxes.id.cpu().numpy()}")Link to this sectionمفاهيم ذات صلة#
لفهم نظام التتبع البيئي بالكامل، من المفيد استكشاف تجزئة المثيلات، التي تتبع محيطات الكائن بدقة على مستوى البكسل بدلاً من مجرد صندوق. بالإضافة إلى ذلك، غالباً ما تتضمن تحديات التتبع متعدد الأجسام (MOT) معايير مستخدمة على نطاق واسع مثل MOTChallenge لتقييم مدى قدرة الخوارزميات على التعامل مع المشاهد المزدحمة والانسدادات. للنشر في بيئات الإنتاج، غالباً ما يستخدم المطورون أدوات مثل NVIDIA DeepStream أو OpenCV لدمج هذه النماذج في خطوط معالجة فعالة.






