دليل حول تتبع الأجسام المتحركة في مقاطع الفيديو باستخدام نماذج Ultralytics YOLO

15 أبريل، 2025
تعرّف على كيفية عمل أنظمة تتبع الرؤية الحاسوبية، واستكشف النماذج الشائعة التي تدعم تتبع الأجسام مثل YOLO11 واكتشف تطبيقاتها في العالم الحقيقي.

15 أبريل، 2025
تعرّف على كيفية عمل أنظمة تتبع الرؤية الحاسوبية، واستكشف النماذج الشائعة التي تدعم تتبع الأجسام مثل YOLO11 واكتشف تطبيقاتها في العالم الحقيقي.
الروبوتات التي يمكنها تجميع الأجزاء الكهربائية، والأنظمة التي تلتقط السيارات المسرعة، وحلول البيع بالتجزئة الذكية التي track كيفية تسوق العملاء - كل هذه الابتكارات تعتمد على الرؤية الحاسوبية. وهو فرع من الذكاء الاصطناعي (AI) يساعد الآلات على تحليل الصور ومقاطع الفيديو وفهمها.
على سبيل المثال، يحتاج الروبوت إلى التعرف على الأجزاء المختلفة ومتابعتها لتجميعها معاً بشكل صحيح. وبالمثل، يمكن لنظام المرور استخدام الرؤية الحاسوبية لرصد السيارات وقراءة لوحات السيارات ومعرفة متى يكون شخص ما مسرعاً. وفي الوقت نفسه، في المتاجر، يمكن للذكاء الاصطناعي للرؤية أن يساعد في track ما ينظر إليه العملاء أو يلتقطونه، ويمكنه أيضاً مراقبة المخزون.
يتم تشغيل هذه التطبيقات بواسطة نماذج الرؤية الحاسوبية مثل Ultralytics YOLO11التي تدعم مجموعة واسعة من المهام البصرية. تركز العديد من هذه المهام على جمع الرؤى من صورة واحدة، ولكن يمكن استخدام إحدى المهام المثيرة للاهتمام بشكل خاص، وهي تتبع الأجسام، لمتابعة حركة الأجسام عبر سلسلة من الصور أو إطارات الفيديو.

في هذا الدليل، سنلقي نظرة فاحصة على كيفية عمل تتبع الكائنات واستكشاف أمثلة واقعية لكيفية استخدامه. كما سنناقش أيضًا كيف تدعم نماذج الذكاء الاصطناعي المرئي مثل Ultralytics YOLO11 تتبع الكائنات. لنبدأ!
تتبع الأجسام هو مهمة رؤية حاسوبية تُستخدم لتتبع حركة الأجسام عبر إطارات الفيديو، مما يساعد الأنظمة على مراقبة وفهم كيفية تغير الأشياء بمرور الوقت. يشبه هذا الأمر إلى حدٍ كبير الطريقة التي يمكن للبشر من خلالها متابعة شخص أو جسم متحرك بأعينهم بشكل طبيعي، كما هو الحال عندما تشاهد مباراة تنس track عيناك الكرة أثناء تحركها ذهاباً وإياباً عبر الملعب.
وبنفس الطريقة، يتضمن تتبع الأجسام استخدام الكاميرات والذكاء الاصطناعي لتتبع حركة الكرة في الوقت الفعلي. يمكن أن تمنح هذه التقنية المشاهدين في المنزل فهمًا أفضل لتدفق اللعبة، خاصة من خلال التحليلات مثل السرعة والمسار وتمركز اللاعب.
في حين أن هذا النوع من التتبع المرئي قد يبدو سهلاً بالنسبة للبشر، إلا أنه عندما يتعلق الأمر بالرؤية الآلية، فإنه ينطوي على سلسلة من الخطوات التي تدعمها نماذج Vision AI. إليك ملخص بسيط لكيفية عمل تتبع الأجسام:
من مهام الرؤية الحاسوبية الأخرى التي يدعمها YOLO11 والتي ترتبط ارتباطًا وثيقًا بتتبع الكائنات هي اكتشاف الكائنات. دعونا نستكشف الفرق بين هاتين المهمتين.
يتضمن الكشف عن الأجسام تحديد وتحديد مواقع الأجسام المهمة داخل صورة واحدة أو إطار فيديو. على سبيل المثال، تستخدم السيارة ذاتية القيادة الكشف عن الأجسام للتعرف على علامة قف أو أحد المشاة في إطار واحد تلتقطه الكاميرات الموجودة على متنها. يجيب على السؤال: "ماذا يوجد في هذه الصورة، وأين؟" ومع ذلك، فإنه لا يقدم أي معلومات حول المكان الذي سيذهب إليه الجسم بعد ذلك.
يعتمد تتبع الأجسام على الكشف عن الأجسام عن طريق إضافة فهم للحركة بمرور الوقت. والفرق الرئيسي بين الاثنين هو كيفية تعاملهما مع الوقت والحركة. يتعامل الكشف عن الأجسام مع كل إطار كلقطة مستقلة، بينما يربط تتبع الأجسام النقاط بين الإطارات، باستخدام البيانات السابقة للتنبؤ بالموقع المستقبلي للجسم.
من خلال الجمع بين الاثنين معاً، يمكننا بناء أنظمة ذكاء اصطناعي بصرية قوية قادرة على التتبع في الوقت الحقيقي في البيئات الديناميكية. على سبيل المثال، يمكن لنظام أمني آلي detect الأشخاص الذين يدخلون إلى مكان ما track حركتهم باستمرار عبر الإطار.
والآن بعد أن غطينا الفرق بين اكتشاف الأجسام وتتبعها، دعنا نلقي نظرة على كيفية دعم نماذج Ultralytics YOLO مثل YOLO11 لتتبع الأجسام في الوقت الفعلي.
على الرغم من أن نماذج YOLO ليست خوارزميات تتبع بحد ذاتها، إلا أنها تلعب دورًا أساسيًا من خلال اكتشاف الأجسام في كل إطار فيديو. وبمجرد اكتشاف الأجسام، تكون خوارزميات التتبع ضرورية لتعيين معرّفات فريدة لها، مما يسمح للنظام بتتبع حركتها من إطار إلى آخر.
لتلبية هذه الحاجة، تدمج حزمةUltralytics Python بسلاسة اكتشاف الكائنات مع خوارزميات التتبع الشائعة مثل BoT-SORT و ByteTrack. يتيح هذا التكامل للمستخدمين تشغيل الكشف والتتبع معًا بأقل قدر من الإعداد.
عند استخدام نماذج YOLO لتتبع الأجسام، يمكنك اختيار خوارزمية التتبع التي تريد تطبيقها بناءً على متطلبات تطبيقك. على سبيل المثال، تُعد BoT-SORT خيارًا جيدًا لتتبع الأجسام التي تتحرك بشكل غير متوقع، وذلك بفضل استخدامها للتنبؤ بالحركة والتعلم العميق. من ناحية أخرى، تعمل خوارزمية ByteTrack بشكل جيد في المشاهد المزدحمة بشكل خاص، حيث تحافظ على تتبع موثوق به حتى عندما تكون الأجسام ضبابية أو مخفية جزئياً.

التدريب المخصص هو عملية الضبط الدقيق لنموذج الكشف عن الكائنات المدرب مسبقًا، مثل YOLO11 على مجموعة بيانات محددة حتى يتمكن من التعرف على الكائنات غير المدرجة في مجموعات البيانات القياسية. هذا مهم بشكل خاص عندما يحتاج نظام التتبع الخاص بك إلى تتبع كائنات مخصصة أو غير شائعة.
تعتمد أنظمة التتبع على نموذج الكشف للتعرف على الكائن أولاً. إذا لم يتمكن نموذج YOLO من detect عنصر معين، مثل نوع معين من الآلات أو أنواع الحياة البرية، فلن تتمكن خوارزمية التتبع من تتبعه.
هذا هو السبب في أهمية التدريب المخصص: فهو يضمن قدرة نموذج الاكتشاف على تحديد الكائنات التي تريد track بدقة.
من المهم أيضًا أن تضع في اعتبارك أنه يتم ضبط نموذج الكشف فقط أثناء هذه العملية. لا يتم تدريب خوارزميات التتبع، مثل BoT-SORT أو ByteTrack، بشكل مخصص - فهي ببساطة تستخدم مخرجات نموذج YOLO لمتابعة الأجسام المكتشفة عبر الإطارات.
الآن بعد أن أصبح لدينا فهم أفضل لما هو تتبع الأجسام وكيف يعمل، دعنا نستكشف بعض التطبيقات الواقعية حيث تحدث هذه التكنولوجيا تأثيرًا.
تعتمد أنظمة تقدير السرعة التي تدعمها الرؤية الحاسوبية على مهام مثل الكشف عن الأجسام وتتبعها. تم تصميم هذه الأنظمة لحساب مدى سرعة تحرك الجسم - سواء كان مركبة أو راكب دراجة أو حتى شخصًا. هذه المعلومات ضرورية لمجموعة متنوعة من التطبيقات، من إدارة حركة المرور إلى مراقبة السلامة والأتمتة الصناعية.
باستخدام نموذج مثل Ultralytics YOLO11 يمكن اكتشاف الأجسام وتتبعها عبر إطارات الفيديو. من خلال تحليل المسافة التي يتحركها الجسم خلال فترة زمنية محددة، يمكن للنظام تقدير سرعته.

يمكن أن تكون عمليات التصنيع سريعة الخطى ومعقدة للغاية، مما يجعل من الصعب track كل عنصر يتم إنتاجه يدويًا. يوفر تتبع الكائنات حلاً جيدًا لأتمتة مراقبة المنتجات أثناء انتقالها خلال كل مرحلة من مراحل الإنتاج. يمكن أن يساعد المصانع في الحفاظ على مستويات عالية من الدقة والكفاءة دون إبطاء الأمور.
من عد المنتجات على حزام ناقل إلى اكتشاف العيوب أو التحقق من التجميع الصحيح، يوفر تتبع الأجسام رؤية وتحكمًا في المهام التي قد تستغرق وقتًا طويلاً أو تكون عرضة للأخطاء. هذه التقنية مؤثرة بشكل خاص في الصناعات ذات الحجم الكبير مثل معالجة الأغذية والإلكترونيات والتعبئة والتغليف، حيث السرعة والدقة أمران بالغان الأهمية.

يدخل ويخرج عدد لا يحصى من العملاء من متاجر البيع بالتجزئة كل يوم، وفهم سلوكهم هو مفتاح لتحسين كل من تجربة العملاء وأداء الأعمال. يتيح تتبع الأجسام لتجار التجزئة مراقبة حركة المرور، وقياس وقت التوقف، وتحليل أنماط الحركة - كل ذلك دون الحاجة إلى طرق تدخلية أو يدوية.
من خلال تتبع الأفراد أثناء دخولهم وخروجهم وتحركهم في جميع أنحاء المتجر، يمكن للشركات الحصول على رؤى حول ساعات الذروة والمناطق الشائعة وحتى أطوال قائمة الانتظار. يمكن لهذه الرؤى أن تفيد القرارات المتعلقة بالتوظيف وتخطيط المتجر وتحديد مواقع المخزون، مما يؤدي في النهاية إلى عمليات أكثر كفاءة وزيادة المبيعات.

من متاجر البيع بالتجزئة إلى أرضيات المصانع، يتم استخدام تتبع الأجسام في جميع أنواع الصناعات لتحسين عوامل مثل الكفاءة والسلامة والتجربة الشاملة. فيما يلي بعض الفوائد الرئيسية التي يمكن أن يجلبها تتبع الأجسام إلى مختلف الصناعات:
في حين أن هذه الفوائد تسلط الضوء على كيفية تأثير تتبع الأجسام بشكل إيجابي على حالات الاستخدام المختلفة، فمن المهم أيضًا مراعاة التحديات التي ينطوي عليها تنفيذه. دعنا نلقي نظرة فاحصة على بعض قيود تتبع الأجسام:
تتبع الأجسام هو مهمة رؤية حاسوبية تتيح للآلات تتبع حركة الأجسام بمرور الوقت. يتم استخدامه في مجموعة واسعة من السيناريوهات الواقعية - من تقدير سرعة السيارة وعد المنتجات على خط تجميع إلى تحليل حركات اللاعبين في الألعاب الرياضية.
مع نماذج الذكاء الاصطناعي للرؤية مثل YOLO11 وخوارزميات التتبع مثل BoT-SORT و ByteTrack، أصبح تتبع الأجسام أسرع وأكثر ذكاءً وسهولة في مختلف الصناعات. ومع تطور تكنولوجيا تتبع الأجسام، فإنها تساعد الأنظمة على أن تصبح أكثر ذكاءً وفعالية واستجابةً، إطاراً تلو الآخر.
هل تريد معرفة المزيد عن الرؤية الحاسوبية والذكاء الاصطناعي؟ استكشف مستودع GitHub الخاص بنا، وتواصل مع مجتمعنا، وتحقق من خيارات الترخيص الخاصة بنا لبدء مشروع الرؤية الحاسوبية الخاص بك. إذا كنت تستكشف ابتكارات مثل الذكاء الاصطناعي في التصنيع و الرؤية الحاسوبية في صناعة السيارات، فقم بزيارة صفحات الحلول الخاصة بنا لاكتشاف المزيد.