Yolo فيجن شنتشن
شنتشن
انضم الآن
مسرد المصطلحات

تتبع الأجسام

اكتشف تتبع الكائنات باستخدام Ultralytics! تعرّف على كيفية track الحركة والسلوك والتفاعلات في الفيديو باستخدام نماذج YOLO للتطبيقات في الوقت الفعلي.

تعقب الأجسام هو مهمة محورية في مجال الرؤية الحاسوبية (CV) التي تتضمن تحديد كيانات محددة ضمن تسلسل فيديو ومراقبة حركتها عبر إطارات متتالية. على عكس تحليل الصور الثابتة فإن هذه العملية تقدم بُعدًا زمنيًا، مما يسمح للأنظمة بالحفاظ على هوية فريدة لكل عنصر مكتشف أثناء عبوره المشهد. من خلال تعيين رقم تعريف ثابت (ID) لكل كيان, يمكن لنماذج الذكاء الاصطناعي (AI) تحليل المسارات وحساب السرعات وفهم التفاعلات مع مرور الوقت. هذه القدرة ضرورية من أجل لتحويل بيانات الفيديو الأولية إلى رؤى قابلة للتنفيذ، وهي بمثابة العمود الفقري لأنظمة أنظمة فهم الفيديو المتقدمة.

الآليات الأساسية للتتبع

تعمل أنظمة التتبع الحديثة عادةً باستخدام نموذج "التتبع بالكشف". يبدأ سير العمل هذا بنموذج الكشف عن الأجسام، مثل النموذج الحديث YOLO11الذي يحدد موقع الأجسام في كل إطار فردي. بمجرد اكتشاف الأجسام وتحديد موقعها باستخدام تتولى خوارزمية التتبع مهمة ربط هذه الاكتشافات بالمسارات الموجودة من الإطارات السابقة.

تتضمن العملية بشكل عام ثلاث خطوات حاسمة:

  1. التنبؤ بالحركة: خوارزميات مثل يستخدم مرشح كالمان (KF) موقع الجسم في الماضي السابق وسرعة الجسم لتقدير المكان الذي سيظهر فيه على الأرجح في الإطار التالي. هذا التوقع يضيّق نطاق البحث مما يحسن بشكل كبير من الكفاءة الحسابية.
  2. ربط البيانات: يطابق النظام الأجسام المكتشفة حديثاً مع المسارات الموجودة باستخدام مثل الخوارزمية الهنغارية. تعتمد هذه الخطوة تعتمد على مقاييس مثل التقاطع على الاتحاد (IoU) لـ للتداخل المكاني أو تشابه السمات البصرية.
  3. صيانة الهوية: أجهزة تعقب متطورة، مثل ByteTrack و تتعامل مع السيناريوهات المعقدة التي تتقاطع فيها تتقاطع فيها الأجسام في المسارات أو تكون مخفية مؤقتًا خلف عوائق (انسداد). من خلال استخدام استخراج الميزات والتعلم العميق العميق، يمكن للنظام إعادة تحديد هوية الجسم حتى بعد ظهوره مرة أخرى، مما يمنع "تبديل الهوية".

تتبع الكائنات مقابل اكتشاف الكائنات

على الرغم من أن هذه المصطلحات غالبًا ما يتم ذكرها معًا، إلا أنها تخدم أغراضًا مختلفة في التعلم الآلي (ML).

  • يجيب اكتشاف الكائن على السؤال "ما هو موجود في هذه الصورة وأين؟ يعامل يعامل كل إطار كحدث مستقل، ويخرج تسميات الفئات و ودرجات الثقة بدون ذاكرة الماضي.
  • يجيب تتبع الأجسام، "إلى أين يتجه هذا الجسم المحدد؟ إنه يربط بين الاكتشافات عبر الزمن، مما يمكّن النظام من التعرّف على أن السيارة في الإطار 10 هي نفس السيارة الموجودة في الإطار 100. هذا التمييز أمر حيوي للتطبيقات التي تتطلب النمذجة التنبؤية للسلوك.

تطبيقات واقعية

تعمل القدرة على تتبع الأجسام بشكل موثوق على تحويل مختلف الصناعات من خلال تمكين الاستدلال في الوقت الحقيقي في البيئات الديناميكية.

  • أنظمة النقل الذكية: في مجال المركبات ذاتية القيادة، فإن التتبع غير قابل للتفاوض. يجب أن track السيارات ذاتية القيادة المشاة وراكبي الدراجات والمركبات الأخرى للتنبؤ بمواقعهم المستقبلية وتجنب الاصطدامات في المستقبل. وغالباً ما يتضمن ذلك دمج البيانات من الكاميرات و ومستشعرات LiDAR للحفاظ على الدقة في مختلف الظروف الجوية.
  • تحليلات البيع بالتجزئة: تستخدم المتاجر التقليدية الذكاء الاصطناعي في البيع بالتجزئة لتخطيط رحلات العملاء. من خلال تتبع أنماط الحركة، يمكن لتجار التجزئة إنشاء خرائط حرارية للممرات الشائعة، وتحليل أوقات المكوث، وتحسين وتحسين تخطيطات المتاجر. تساعد هذه البيانات في إدارة طوابير الانتظار ووضع المخزون بكفاءة.
  • التحليل الرياضي: تستفيد الفرق المحترفة من التتبع لتحليل أداء اللاعبين. من خلال الجمع بين التتبع مع تقدير الوضعية، يستطيع المدربون تقييم الميكانيكا الحيوية، والسرعة، وتشكيلات الفريق، مما يوفر ميزة تنافسية من خلال استراتيجية تعتمد على البيانات.

تنفيذ التتبع باستخدام Python

يعد تنفيذ التتبع عالي الأداء أمرًا سهلاً ومباشرًا باستخدام ultralytics الحزمة. يوضح المثال التالي يوضح المثال التالي كيفية تحميل حزمة مُدرَّبة مسبقًا طراز YOLO11 track الكائنات في ملف فيديو. إن track يتعامل الوضع تلقائياً مع الاكتشاف وتعيين الهوية.

from ultralytics import YOLO

# Load the official YOLO11 nano model
model = YOLO("yolo11n.pt")

# Track objects in a video source (use '0' for webcam)
# The 'show=True' argument visualizes the tracking IDs in real-time
results = model.track(source="https://supervision.roboflow.com/assets/", show=True)

# Print the unique IDs detected in the first frame
if results[0].boxes.id is not None:
    print(f"Tracked IDs: {results[0].boxes.id.cpu().numpy()}")

المفاهيم ذات الصلة

لفهم الفروق الدقيقة في التتبع بشكل كامل، من المفيد فهم ما يلي التتبع متعدد الأجسام (MOT)، والذي الذي يركز بشكل خاص على التعامل مع أهداف متعددة في وقت واحد في المشاهد المزدحمة. علاوة على ذلك، غالبًا ما يتم الجمع بين التتبع مع تجزئة المثيل track ملامح دقيقة للأشياء بدلاً من مجرد مربعات محدودة، مما يوفر مستوى أعلى من التفصيل لمهام مثل التصوير الطبي التصوير الطبي أو المعالجة الروبوتية.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن