شيك أخضر
تم نسخ الرابط إلى الحافظة

دليل حول تتبع الأجسام المتحركة في مقاطع الفيديو باستخدام نماذج Ultralytics YOLO

تعرّف على كيفية عمل أنظمة تتبع الرؤية الحاسوبية، واستكشف النماذج الشائعة التي تدعم تتبع الأجسام مثل YOLO11 واكتشف تطبيقاتها في العالم الحقيقي.

الروبوتات التي يمكنها تجميع الأجزاء الكهربائية، والأنظمة التي تلتقط السيارات المسرعة، وحلول البيع بالتجزئة الذكية التي تتعقب كيفية تسوق العملاء - كل هذه الابتكارات تعتمد على الرؤية الحاسوبية. وهو فرع من الذكاء الاصطناعي (AI) يساعد الآلات على تحليل الصور ومقاطع الفيديو وفهمها.

على سبيل المثال، يحتاج الروبوت إلى التعرف على الأجزاء المختلفة ومتابعتها لتجميعها معاً بشكل صحيح. وبالمثل، يمكن لنظام المرور استخدام الرؤية الحاسوبية لرصد السيارات وقراءة لوحات السيارات ومعرفة متى يكون شخص ما مسرعاً. وفي الوقت نفسه، في المتاجر، يمكن للذكاء الاصطناعي للرؤية أن يساعد في تتبع ما ينظر إليه العملاء أو يلتقطونه، ويمكنه أيضاً مراقبة المخزون.

يتم تشغيل هذه التطبيقات بواسطة نماذج الرؤية الحاسوبية مثل Ultralytics YOLO11التي تدعم مجموعة واسعة من المهام البصرية. تركز العديد من هذه المهام على جمع الرؤى من صورة واحدة، ولكن يمكن استخدام إحدى المهام المثيرة للاهتمام بشكل خاص، وهي تتبع الأجسام، لتتبع حركة الأجسام عبر سلسلة من الصور أو إطارات الفيديو.

الشكل 1. مثال على اكتشاف السيارات وتتبعها.

في هذا الدليل، سنلقي نظرة فاحصة على كيفية عمل تتبع الكائنات واستكشاف أمثلة واقعية لكيفية استخدامه. كما سنناقش أيضًا كيف تدعم نماذج الذكاء الاصطناعي المرئي مثل Ultralytics YOLO11 تتبع الكائنات. لنبدأ!

نظرة فاحصة على أنظمة تتبع الرؤية الحاسوبية

تتبع الأجسام هو مهمة رؤية حاسوبية تُستخدم لتتبع حركة الأجسام عبر إطارات الفيديو، مما يساعد الأنظمة على مراقبة وفهم كيفية تغير الأشياء بمرور الوقت. يشبه هذا الأمر إلى حدٍ كبير الطريقة التي يمكن للبشر من خلالها تتبع شخص أو جسم متحرك بأعينهم بشكل طبيعي، كما هو الحال عندما تشاهد مباراة تنس وتتبع عيناك الكرة أثناء تحركها ذهابًا وإيابًا عبر الملعب.

وبنفس الطريقة، يتضمن تتبع الأجسام استخدام الكاميرات والذكاء الاصطناعي لمتابعة حركة الكرة في الوقت الفعلي. يمكن لهذه التقنية أن تمنح المشاهدين في المنزل فهماً أفضل لسير اللعبة، خاصةً من خلال تحليلات مثل السرعة والمسار وموقع اللاعب.

في حين أن هذا النوع من التتبع البصري قد يبدو سهلاً بالنسبة للبشر، إلا أنه عندما يتعلق الأمر بالرؤية الآلية، فإنه يتضمن سلسلة من الخطوات المدعومة بنماذج الذكاء الاصطناعي للرؤية. فيما يلي تفصيل بسيط لكيفية عمل تتبع الأجسام: 

  • التقاط الفيديو: تسجل الكاميرات لقطات فيديو، وتلتقط كيف تتحرك الأجسام في مشهد ما مع مرور الوقت.
  • اكتشاف الأجسام: يمكن لنماذج الرؤية الحاسوبية التي تعمل بالذكاء الاصطناعي مثل YOLO11 تحليل كل إطار لتحديد وتحديد موقع أجسام معينة، مثل الأشخاص أو المركبات أو المنتجات.
  • تعيين الهوية: بمجرد اكتشاف كائن ما، تقوم خوارزميات التتبع بتعيين هوية فريدة له لتتبعه عبر إطارات متعددة، مما يضمن معرفة النظام أنه نفس الكائن حتى أثناء تحركه.
  • مراقبة الحركة: يتتبع النظام الحركة مع مرور الوقت، ويمكن استخدام هذه البيانات لجمع بيانات مثل السرعة والاتجاه والتفاعلات مع الأجسام الأخرى.
  • توليد الرؤى: يمكن استخدام هذه المعلومات في الوقت الفعلي لتوفير التحليلات أو المساعدة في اتخاذ القرار أو تشغيل التراكبات المرئية - اعتمادًا على حالة الاستخدام المحددة.

مقارنة اكتشاف الأجسام وتتبعها باستخدام YOLO

من مهام الرؤية الحاسوبية الأخرى التي يدعمها YOLO11 والتي ترتبط ارتباطًا وثيقًا بتتبع الكائنات هي اكتشاف الكائنات. دعونا نستكشف الفرق بين هاتين المهمتين. 

يتضمن اكتشاف الكائنات تحديد الكائنات ذات الأهمية وتحديد موقعها في صورة واحدة أو إطار فيديو واحد. على سبيل المثال، تستخدم السيارة ذاتية القيادة عملية اكتشاف الأجسام للتعرف على علامة توقف أو أحد المشاة في إطار واحد تلتقطه الكاميرات الموجودة على متنها. يجيب على السؤال: "ماذا يوجد في هذه الصورة، وأين هو؟ ومع ذلك، فإنه لا يوفر أي معلومات حول المكان الذي يتجه إليه الجسم بعد ذلك.

يعتمد تتبع الكائنات على اكتشاف الكائنات من خلال إضافة فهم الحركة بمرور الوقت. الفرق الرئيسي بين الاثنين هو كيفية تعاملهما مع الوقت والحركة. يعالج اكتشاف الكائنات كل إطار كل لقطة مستقلة، بينما يربط تتبع الكائنات النقاط بين الإطارات، باستخدام البيانات السابقة للتنبؤ بالموقع المستقبلي للكائن.

من خلال الجمع بين الاثنين معاً، يمكننا بناء أنظمة ذكاء اصطناعي بصرية قوية قادرة على التتبع في الوقت الحقيقي في البيئات الديناميكية. على سبيل المثال، يمكن لنظام أمني آلي اكتشاف الأشخاص الذين يدخلون إلى مكان ما وتتبع حركتهم باستمرار عبر الإطار.

التتبع في الوقت الحقيقي باستخدام نماذج Ultralytics YOLO

والآن بعد أن قمنا بتغطية الفرق بين اكتشاف الأجسام وتتبعها، دعنا نلقي نظرة على كيفية دعم نماذج Ultralytics YOLO مثل YOLO11 لتتبع الأجسام في الوقت الفعلي.

على الرغم من أن نماذج YOLO ليست خوارزميات تتبع بحد ذاتها، إلا أنها تلعب دورًا أساسيًا من خلال اكتشاف الأجسام في كل إطار فيديو. وبمجرد اكتشاف الأجسام، تكون خوارزميات التتبع ضرورية لتعيين معرّفات فريدة لها، مما يسمح للنظام بتتبع حركتها من إطار إلى آخر. 

لتلبية هذه الحاجة، تدمج حزمةUltralytics Python بسلاسة اكتشاف الكائنات مع خوارزميات التتبع الشائعة مثل BoT-SORT و ByteTrack. يتيح هذا التكامل للمستخدمين تشغيل الكشف والتتبع معًا بأقل قدر من الإعداد.

عند استخدام نماذج YOLO لتتبع الأجسام، يمكنك اختيار خوارزمية التتبع التي تريد تطبيقها بناءً على متطلبات تطبيقك. على سبيل المثال، تُعد BoT-SORT خيارًا جيدًا لتتبع الأجسام التي تتحرك بشكل غير متوقع، وذلك بفضل استخدامها للتنبؤ بالحركة والتعلم العميق. من ناحية أخرى، تعمل خوارزمية ByteTrack بشكل جيد في المشاهد المزدحمة بشكل خاص، حيث تحافظ على تتبع موثوق به حتى عندما تكون الأجسام ضبابية أو مخفية جزئياً.

الشكل 2. تدمج حزمة Ultralytics Python بسلاسة بين BoT-SORT و ByteTrack.

كيف يرتبط تدريب نموذج YOLO المخصص بتتبع الأجسام؟

التدريب المخصص هو عملية الضبط الدقيق لنموذج الكشف عن الكائنات المدرب مسبقًا، مثل YOLO11 على مجموعة بيانات محددة حتى يتمكن من التعرف على الكائنات غير المدرجة في مجموعات البيانات القياسية. هذا مهم بشكل خاص عندما يحتاج نظام التتبع الخاص بك إلى تتبع كائنات مخصصة أو غير شائعة.

تعتمد أنظمة التتبع على نموذج الكشف للتعرف على الكائن أولاً. إذا لم يتمكن نموذج YOLO من اكتشاف عنصر معين، مثل نوع معين من الآلات أو أنواع الحياة البرية، فلن تتمكن خوارزمية التتبع من تتبعه.

هذا هو السبب في أهمية التدريب المخصص: فهو يضمن قدرة نموذج الاكتشاف على تحديد الكائنات التي تريد تتبعها بدقة.

من المهم أيضًا أن تضع في اعتبارك أنه يتم ضبط نموذج الكشف فقط أثناء هذه العملية. لا يتم تدريب خوارزميات التتبع، مثل BoT-SORT أو ByteTrack، بشكل مخصص - فهي ببساطة تستخدم مخرجات نموذج YOLO لمتابعة الأجسام المكتشفة عبر الإطارات.

تطبيقات تتبع الأجسام باستخدام Ultralytics YOLO

والآن بعد أن أصبح لدينا فهم أفضل لماهية تتبع الكائنات وكيفية عملها، دعنا نستكشف بعض التطبيقات الواقعية التي تؤثر فيها هذه التقنية.

التتبع في الوقت الحقيقي باستخدام Ultralytics YOLO لتقدير السرعة

تعتمد أنظمة تقدير السرعة التي تتيحها الرؤية الحاسوبية على مهام مثل اكتشاف الأجسام وتتبعها. تم تصميم هذه الأنظمة لحساب سرعة حركة جسم ما - سواء كان مركبة أو راكب دراجة أو حتى شخص. هذه المعلومات ضرورية لمجموعة متنوعة من التطبيقات، من إدارة حركة المرور إلى مراقبة السلامة والأتمتة الصناعية.

باستخدام نموذج مثل Ultralytics YOLO11 يمكن اكتشاف الأجسام وتتبعها عبر إطارات الفيديو. من خلال تحليل المسافة التي يتحركها الجسم خلال فترة زمنية محددة، يمكن للنظام تقدير سرعته. 

الشكل 3. استخدام دعم YOLO11لتتبع الأجسام لتقدير السرعة.

استكشاف تتبع الأجسام في التصنيع

يمكن أن تكون عمليات التصنيع سريعة الخطى ومعقدة للغاية، مما يجعل من الصعب تتبع كل عنصر يتم إنتاجه يدويًا. يوفر تتبع الكائنات حلاً جيدًا لأتمتة مراقبة المنتجات أثناء انتقالها خلال كل مرحلة من مراحل الإنتاج. يمكن أن يساعد المصانع في الحفاظ على مستويات عالية من الدقة والكفاءة دون إبطاء الأمور.

بدءًا من عد المنتجات على الحزام الناقل إلى اكتشاف العيوب أو التحقق من التجميع السليم، يوفر تتبع الأجسام إمكانية الرؤية والتحكم في المهام التي قد تستغرق وقتًا طويلاً أو تكون عرضة للخطأ. هذه التكنولوجيا مؤثرة بشكل خاص في الصناعات ذات الحجم الكبير مثل معالجة الأغذية والإلكترونيات والتعبئة والتغليف، حيث تكون السرعة والدقة أمرًا بالغ الأهمية.

الشكل 4. مثال على تتبع وعدّ المنتجات الغذائية على خط التجميع باستخدام YOLO11.

نظرة عامة على تتبع الكائنات في تحليلات البيع بالتجزئة

يدخل عدد لا يُحصى من العملاء إلى متاجر البيع بالتجزئة ويخرجون منها كل يوم، ويُعد فهم سلوكهم أمرًا أساسيًا لتحسين تجربة العملاء وأداء الأعمال. يتيح تتبُّع الأجسام لتجار التجزئة إمكانية مراقبة حركة الزبائن وقياس وقت المكوث وتحليل أنماط الحركة، كل ذلك دون الحاجة إلى أساليب يدوية أو تطفلية.

من خلال تتبع الأفراد أثناء دخولهم وخروجهم وتحركهم في جميع أنحاء المتجر، يمكن للشركات الحصول على رؤى حول ساعات الذروة والمناطق التي تحظى بشعبية كبيرة وحتى طول طوابير الانتظار. يمكن لهذه الرؤى أن تفيد في اتخاذ القرارات المتعلقة بالتوظيف وتخطيط المتجر ووضع المخزون، مما يؤدي في النهاية إلى عمليات أكثر كفاءة وزيادة المبيعات.

الشكل 5. استخدام قدرات YOLO11لتتبع الأشياء لمراقبة الأشخاص الذين يدخلون ويخرجون من المتجر.

إيجابيات وسلبيات تتبع الكائنات

من متاجر البيع بالتجزئة إلى أرضيات المصانع، يتم استخدام تتبع الأجسام في جميع أنواع الصناعات لتحسين عوامل مثل الكفاءة والسلامة والتجربة الشاملة. فيما يلي بعض الفوائد الرئيسية التي يمكن أن يحققها تتبع الأجسام في مختلف الصناعات:

  • تمكين التنبيهات في الوقت الحقيقي: يمكن تهيئة الأنظمة المدمجة مع تتبع الكائنات لتشغيل التنبيهات تلقائيًا عند اكتشاف شيء غير اعتيادي، مثل دخول شخص إلى منطقة محظورة أو ترك توصيلة لفترة طويلة جدًا في مكان واحد.
  • تتكامل مع الأنظمة الأخرى: يمكن دمج بيانات تتبع الكائنات مع تقنيات أخرى، مثل التعرف على الوجه أو الكاميرات الحرارية أو أنظمة الجرد، للحصول على رؤى أكثر قوة.
  • فعالة من حيث التكلفة على المدى الطويل: على الرغم من أن الإعداد الأولي قد يتطلب الاستثمار، إلا أن التتبع الآلي يقلل من الحاجة إلى العمل اليدوي، ويقلل من معدلات الخطأ، ويخفض التكاليف التشغيلية بمرور الوقت.

على الرغم من أن هذه الفوائد تسلط الضوء على كيفية تأثير تتبع الكائنات بشكل إيجابي على حالات الاستخدام المختلفة، إلا أنه من المهم أيضًا النظر في التحديات التي ينطوي عليها تنفيذه. دعونا نلقي نظرة فاحصة على بعض قيود تتبع الكائنات:

  • الصعوبة في البيئات المزدحمة: في البيئات المزدحمة مثل الحفلات الموسيقية أو مراكز التسوق أو شوارع المدينة، قد تواجه أنظمة التتبع صعوبة في التمييز بين الأشخاص أو الأشياء القريبة من بعضها البعض، مما يؤدي إلى الخلط أو النتائج غير الدقيقة.
  • حساس للظروف البيئية: يمكن أن تؤثر الإضاءة الضعيفة أو الضباب أو الحركة السريعة أو اهتزاز الكاميرا على قدرة النظام على تتبع الأجسام بدقة، خاصة في البيئات الخارجية أو غير الخاضعة للرقابة.
  • الخصوصية والمخاوف القانونية: قد يؤدي التعامل غير السليم مع البيانات الشخصية، أو عدم موافقة المستخدم، أو المراقبة في الأماكن العامة إلى إثارة قضايا أخلاقية ويؤدي إلى عدم الامتثال لقوانين الخصوصية.

الوجبات الرئيسية

تتبع الأجسام هو مهمة رؤية حاسوبية تتيح للآلات تتبع حركة الأجسام بمرور الوقت. وتُستخدم في مجموعة واسعة من السيناريوهات في العالم الحقيقي، بدءاً من تقدير سرعة السيارة وعدّ المنتجات على خط التجميع إلى تحليل حركات اللاعبين في الألعاب الرياضية.

مع نماذج الذكاء الاصطناعي للرؤية مثل YOLO11 وخوارزميات التتبع مثل BoT-SORT و ByteTrack، أصبح تتبع الأجسام أسرع وأكثر ذكاءً وسهولة في مختلف الصناعات. ومع تطور تكنولوجيا تتبع الأجسام، فإنها تساعد الأنظمة على أن تصبح أكثر ذكاءً وفعالية واستجابةً، إطاراً تلو الآخر.

هل تريد معرفة المزيد عن رؤية الكمبيوتر والذكاء الاصطناعي؟ استكشف مستودع GitHub الخاص بنا، وتواصل مع مجتمعنا، وتحقق من خيارات الترخيص لدينا لبدء مشروع رؤية الكمبيوتر الخاص بك. إذا كنت تستكشف ابتكارات مثل الذكاء الاصطناعي في التصنيع والرؤية الحاسوبية في صناعة السيارات، تفضل بزيارة صفحات الحلول الخاصة بنا لاكتشاف المزيد. 

شعار LinkedInشعار تويترشعار الفيسبوكرمز نسخ الرابط

اقرأ المزيد في هذه الفئة

دعونا نبني المستقبل
من الذكاء الاصطناعي معا!

ابدأ رحلتك مع مستقبل التعلم الآلي