دليل حول تتبع الأجسام المتحركة في مقاطع الفيديو باستخدام نماذج Ultralytics YOLO

15 أبريل، 2025
تعرف على كيفية عمل أنظمة تتبع الرؤية الحاسوبية، واستكشف النماذج الشائعة التي تدعم تتبع الأجسام مثل YOLO11، واكتشف تطبيقاتها الواقعية.

15 أبريل، 2025
تعرف على كيفية عمل أنظمة تتبع الرؤية الحاسوبية، واستكشف النماذج الشائعة التي تدعم تتبع الأجسام مثل YOLO11، واكتشف تطبيقاتها الواقعية.
الروبوتات التي يمكنها تجميع الأجزاء الكهربائية، والأنظمة التي تضبط السيارات المسرعة، وحلول البيع بالتجزئة الذكية التي تتبع كيفية تسوق العملاء - كل هذه الابتكارات تعتمد على الرؤية الحاسوبية. إنه فرع من فروع الذكاء الاصطناعي (AI) الذي يساعد الآلات على تحليل وفهم الصور ومقاطع الفيديو.
على سبيل المثال، يحتاج الروبوت إلى التعرف على الأجزاء المختلفة وتتبعها لتجميعها بشكل صحيح. وبالمثل، يمكن لنظام المرور استخدام الرؤية الحاسوبية لاكتشاف السيارات وقراءة لوحات الترخيص ومعرفة متى يقود شخص ما بسرعة. وفي الوقت نفسه، في المتاجر، يمكن أن تساعد الرؤية الحاسوبية في تتبع ما ينظر إليه العملاء أو يلتقطونه، ويمكنها حتى مراقبة المخزون.
يتم تشغيل هذه التطبيقات بواسطة نماذج الرؤية الحاسوبية مثل Ultralytics YOLO11، التي تدعم مجموعة واسعة من المهام المرئية. تركز العديد من هذه المهام على جمع رؤى من صورة واحدة، ولكن إحدى المهام المثيرة للاهتمام بشكل خاص، وهي تتبع الأجسام، يمكن استخدامها لتتبع حركة الأجسام عبر سلسلة من الصور أو إطارات الفيديو.
في هذا الدليل، سنلقي نظرة فاحصة على كيفية عمل تتبع الأجسام واستكشاف أمثلة واقعية لكيفية استخدامه. سنناقش أيضًا كيف تدعم نماذج Vision AI مثل Ultralytics YOLO11 تتبع الأجسام. هيا بنا نبدأ!
تتبع الأجسام هو مهمة رؤية حاسوبية تستخدم لتتبع حركة الأجسام عبر إطارات الفيديو، مما يساعد الأنظمة على مراقبة وفهم كيفية تغير الأشياء بمرور الوقت. يشبه هذا إلى حد كبير كيف يمكن للبشر تتبع شخص أو جسم متحرك بأعينهم بشكل طبيعي، كما هو الحال عندما تشاهد مباراة تنس وتتبع عيناك الكرة وهي تتحرك ذهابًا وإيابًا عبر الملعب.
وبنفس الطريقة، يتضمن تتبع الأجسام استخدام الكاميرات والذكاء الاصطناعي لتتبع حركة الكرة في الوقت الفعلي. يمكن أن تمنح هذه التقنية المشاهدين في المنزل فهمًا أفضل لتدفق اللعبة، خاصة من خلال التحليلات مثل السرعة والمسار وتمركز اللاعب.
في حين أن هذا النوع من التتبع المرئي قد يبدو سهلاً بالنسبة للبشر، إلا أنه عندما يتعلق الأمر بالرؤية الآلية، فإنه ينطوي على سلسلة من الخطوات التي تدعمها نماذج Vision AI. إليك ملخص بسيط لكيفية عمل تتبع الأجسام:
هناك مهمة رؤية حاسوبية أخرى تدعمها YOLO11 وترتبط ارتباطًا وثيقًا بتتبع الأجسام وهي الكشف عن الأجسام. دعنا نستكشف الفرق بين هاتين المهمتين.
يتضمن الكشف عن الأجسام تحديد وتحديد مواقع الأجسام المهمة داخل صورة واحدة أو إطار فيديو. على سبيل المثال، تستخدم السيارة ذاتية القيادة الكشف عن الأجسام للتعرف على علامة قف أو أحد المشاة في إطار واحد تلتقطه الكاميرات الموجودة على متنها. يجيب على السؤال: "ماذا يوجد في هذه الصورة، وأين؟" ومع ذلك، فإنه لا يقدم أي معلومات حول المكان الذي سيذهب إليه الجسم بعد ذلك.
يعتمد تتبع الأجسام على الكشف عن الأجسام عن طريق إضافة فهم للحركة بمرور الوقت. والفرق الرئيسي بين الاثنين هو كيفية تعاملهما مع الوقت والحركة. يتعامل الكشف عن الأجسام مع كل إطار كلقطة مستقلة، بينما يربط تتبع الأجسام النقاط بين الإطارات، باستخدام البيانات السابقة للتنبؤ بالموقع المستقبلي للجسم.
من خلال الجمع بين الاثنين، يمكننا بناء أنظمة رؤية اصطناعية قوية قادرة على التتبع في الوقت الفعلي في البيئات الديناميكية. على سبيل المثال، يمكن لنظام أمان آلي اكتشاف الأشخاص الذين يدخلون مساحة ما وتتبع حركتهم باستمرار عبر الإطار.
الآن بعد أن غطينا الفرق بين الكشف عن الأجسام وتتبعها، دعنا نلقي نظرة على كيف تدعم نماذج Ultralytics YOLO، مثل YOLO11، تتبع الأجسام في الوقت الفعلي.
في حين أن نماذج YOLO ليست خوارزميات تتبع بحد ذاتها، إلا أنها تلعب دورًا أساسيًا من خلال الكشف عن الأجسام في كل إطار فيديو. بمجرد الكشف عن الأجسام، تكون هناك حاجة إلى خوارزميات تتبع لتعيين مُعرّفات فريدة لها، مما يسمح للنظام بتتبع حركتها من إطار إلى آخر.
لتلبية هذه الحاجة، تدمج حزمة Ultralytics Python بسلاسة الكشف عن الأجسام مع خوارزميات التتبع الشائعة مثل BoT-SORT و ByteTrack. يمكّن هذا التكامل المستخدمين من تشغيل الكشف والتتبع معًا بأقل قدر من الإعداد.
عند استخدام نماذج YOLO لتتبع الأجسام، يمكنك اختيار خوارزمية التتبع التي سيتم تطبيقها بناءً على متطلبات تطبيقك. على سبيل المثال، يعد BoT-SORT خيارًا جيدًا لتتبع الأجسام التي تتحرك بشكل غير متوقع، وذلك بفضل استخدامه للتنبؤ بالحركة والتعلم العميق. من ناحية أخرى، يعمل ByteTrack بشكل جيد بشكل خاص في المشاهد المزدحمة، ويحافظ على تتبع موثوق حتى عندما تكون الأجسام ضبابية أو مخفية جزئيًا.
التدريب المخصص هو عملية الضبط الدقيق لنموذج الكشف عن الأجسام المدرب مسبقًا، مثل YOLO11، على مجموعة بيانات معينة حتى يتمكن من التعرف على الأجسام غير المدرجة في مجموعات البيانات القياسية. وهذا مهم بشكل خاص عندما يحتاج نظام التتبع الخاص بك إلى تتبع أجسام مخصصة أو غير شائعة.
تعتمد أنظمة التتبع على نموذج الكشف للتعرف على الجسم أولاً. إذا كان نموذج YOLO لا يستطيع اكتشاف عنصر معين، مثل نوع معين من الآلات أو أنواع الحياة البرية، فلن تتمكن خوارزمية التتبع من تتبعه.
هذا هو السبب في أن التدريب المخصص ضروري: فهو يضمن أن نموذج الكشف يمكنه تحديد الأجسام التي تريد تتبعها بدقة.
من المهم أيضًا أن تضع في اعتبارك أنه يتم فقط الضبط الدقيق لنموذج الكشف خلال هذه العملية. خوارزميات التتبع، مثل BoT-SORT أو ByteTrack، ليست مدربة تدريبًا مخصصًا - فهي ببساطة تستخدم الإخراج من نموذج YOLO لتتبع الأجسام المكتشفة عبر الإطارات.
الآن بعد أن أصبح لدينا فهم أفضل لما هو تتبع الأجسام وكيف يعمل، دعنا نستكشف بعض التطبيقات الواقعية حيث تحدث هذه التكنولوجيا تأثيرًا.
تعتمد أنظمة تقدير السرعة التي تدعمها الرؤية الحاسوبية على مهام مثل الكشف عن الأجسام وتتبعها. تم تصميم هذه الأنظمة لحساب مدى سرعة تحرك الجسم - سواء كان مركبة أو راكب دراجة أو حتى شخصًا. هذه المعلومات ضرورية لمجموعة متنوعة من التطبيقات، من إدارة حركة المرور إلى مراقبة السلامة والأتمتة الصناعية.
باستخدام نموذج مثل Ultralytics YOLO11، يمكن اكتشاف الأجسام وتتبعها عبر إطارات الفيديو. من خلال تحليل المسافة التي يتحركها الجسم خلال فترة زمنية محددة، يمكن للنظام تقدير سرعته.
يمكن أن تكون عمليات التصنيع سريعة الخطى ومعقدة للغاية، مما يجعل من الصعب تتبع كل عنصر يتم إنتاجه يدويًا. يوفر تتبع الأجسام حلاً جيدًا لأتمتة مراقبة المنتجات أثناء انتقالها عبر كل مرحلة من مراحل الإنتاج. يمكن أن يساعد المصانع في الحفاظ على مستويات عالية من الدقة والكفاءة دون إبطاء الأمور.
من عد المنتجات على حزام ناقل إلى اكتشاف العيوب أو التحقق من التجميع الصحيح، يوفر تتبع الأجسام رؤية وتحكمًا في المهام التي قد تستغرق وقتًا طويلاً أو تكون عرضة للأخطاء. هذه التقنية مؤثرة بشكل خاص في الصناعات ذات الحجم الكبير مثل معالجة الأغذية والإلكترونيات والتعبئة والتغليف، حيث السرعة والدقة أمران بالغان الأهمية.
يدخل ويخرج عدد لا يحصى من العملاء من متاجر البيع بالتجزئة كل يوم، وفهم سلوكهم هو مفتاح لتحسين كل من تجربة العملاء وأداء الأعمال. يتيح تتبع الأجسام لتجار التجزئة مراقبة حركة المرور، وقياس وقت التوقف، وتحليل أنماط الحركة - كل ذلك دون الحاجة إلى طرق تدخلية أو يدوية.
من خلال تتبع الأفراد أثناء دخولهم وخروجهم وتحركهم في جميع أنحاء المتجر، يمكن للشركات الحصول على رؤى حول ساعات الذروة والمناطق الشائعة وحتى أطوال قائمة الانتظار. يمكن لهذه الرؤى أن تفيد القرارات المتعلقة بالتوظيف وتخطيط المتجر وتحديد مواقع المخزون، مما يؤدي في النهاية إلى عمليات أكثر كفاءة وزيادة المبيعات.
من متاجر البيع بالتجزئة إلى أرضيات المصانع، يتم استخدام تتبع الأجسام في جميع أنواع الصناعات لتحسين عوامل مثل الكفاءة والسلامة والتجربة الشاملة. فيما يلي بعض الفوائد الرئيسية التي يمكن أن يجلبها تتبع الأجسام إلى مختلف الصناعات:
في حين أن هذه الفوائد تسلط الضوء على كيفية تأثير تتبع الأجسام بشكل إيجابي على حالات الاستخدام المختلفة، فمن المهم أيضًا مراعاة التحديات التي ينطوي عليها تنفيذه. دعنا نلقي نظرة فاحصة على بعض قيود تتبع الأجسام:
تتبع الأجسام هو مهمة رؤية حاسوبية تتيح للآلات تتبع حركة الأجسام بمرور الوقت. يتم استخدامه في مجموعة واسعة من السيناريوهات الواقعية - من تقدير سرعة السيارة وعد المنتجات على خط تجميع إلى تحليل حركات اللاعبين في الألعاب الرياضية.
باستخدام نماذج الرؤية الحاسوبية مثل YOLO11 وخوارزميات التتبع مثل BoT-SORT و ByteTrack، أصبح تتبع الأجسام أسرع وأكثر ذكاءً وأكثر سهولة في الوصول إليه عبر مختلف الصناعات. مع تطور تكنولوجيا تتبع الأجسام، فإنها تساعد الأنظمة على أن تصبح أكثر ذكاءً وكفاءة واستجابة، إطارًا واحدًا في كل مرة.
هل تريد معرفة المزيد عن الرؤية الحاسوبية والذكاء الاصطناعي؟ استكشف مستودع GitHub الخاص بنا، وتواصل مع مجتمعنا، وتحقق من خيارات الترخيص الخاصة بنا لبدء مشروع الرؤية الحاسوبية الخاص بك. إذا كنت تستكشف ابتكارات مثل الذكاء الاصطناعي في التصنيع و الرؤية الحاسوبية في صناعة السيارات، فقم بزيارة صفحات الحلول الخاصة بنا لاكتشاف المزيد.