Yolo فيجن شنتشن
شنتشن
انضم الآن

تجعل الرؤية الحاسوبية تتبع الحركة أكثر موثوقية

تعرف على كيفية قيام الذكاء الاصطناعي والرؤية الحاسوبية بجعل تتبع الحركة أكثر ذكاءً وسرعة وموثوقية في مجالات الرياضة والروبوتات والتطبيقات المحمولة وغيرها من سير العمل في العالم الواقعي.

عندما تشاهد مسرحية ويقوم ممثلك المفضل بالتحرك عبر المسرح، يمكن لعينيك أن تتبعه دون بذل أي جهد واعٍ يذكر. بالنسبة للبشر، هذا النوع من تتبع الحركة يبدو طبيعياً. يقوم دماغك تلقائياً بربط ما تراه من لحظة إلى أخرى، وسد الثغرات والحفاظ على الإحساس بالاستمرارية مع تغير المشهد.

عندما يتعلق الأمر بالآلات، فإن المهمة نفسها تكون أكثر تعقيدًا. تلتقط الكاميرا مقطع فيديو على شكل سلسلة من الإطارات الفردية، ويجب على النظام أن يتعرف مرارًا وتكرارًا على الكائن نفسه خطوة بخطوة لتقدير المكان الذي تحرك إليه، وتحديد ما إذا كان لا يزال هو الكائن الذي يجب متابعته. 

هذا التحدي هو جوهر تتبع الحركة. يتضمن تتبع الحركة تتبع كائن عبر مقطع فيديو على مدار الوقت، ويؤدي دورًا مهمًا في مجالات مثل تحليل الألعاب الرياضية والروبوتات والتطبيقات المحمولة. 

غالبًا ما تعتمد الحركة التقليدية وتتبع الكاميرا على الإعداد اليدوي track والإطارات الرئيسية. يمكن أن يعمل ذلك في المشاهد البسيطة، ولكنه سرعان ما يصبح بطيئًا وغير موثوق به عندما تكون الحركة سريعة أو معوقة جزئيًا.

الشكل 1. نظرة على نظام تتبع الحركة (المصدر)

التطورات الحديثة في مجال الرؤية الحاسوبية تجعل هذا الأمر أسهل بكثير. الرؤية الحاسوبية هي أحد فروع الذكاء الاصطناعي الذي يساعد الآلات على فهم الصور والفيديو، مما يجعل تتبع الحركة أكثر دقة وأقل اعتمادًا على العمل اليدوي. من خلال الكشف عن الكائنات في كل إطار والحفاظ على هويتها ثابتة بمرور الوقت، track هذه الأنظمة track بشكل أكثر موثوقية في الظروف الواقعية.

في هذه المقالة، سوف نستكشف كيف يمكن للرؤية الحاسوبية أن تجعل تتبع الحركة أكثر سلاسة. هيا بنا نبدأ!

طرق التقاط الحركة والتتبع التقليدية وقيودها

غالبًا ما يتطلب تتبع الحركة التقليدي إعدادًا يدويًا دقيقًا، خاصة في عمليات تحرير الفيديو وسير عمل المؤثرات البصرية، حيث يكون الهدف هو إرفاق رسومات أو مؤثرات أو تراكبات بالعناصر المتحركة في اللقطات. 

تبدأ العديد من سير العمل بوضع track على أجزاء محددة من اللقطة، ثم يتتبعها البرنامج عبر الإطارات لرسم مسار الحركة. هذا أمر شائع في أدوات مثل After Effects، وتظهر سير عمل مماثلة في Premiere Pro من خلال ميزات مثل تتبع القناع، حيث track المحررون track أو منطقة track بمرور الوقت.

تعد مطابقة الحركة طريقة شائعة أخرى. فهي تساعد على مواءمة العناصر الرقمية مع حركة الكاميرا الحقيقية بحيث تظل المؤثرات أو الرسومات في مكانها داخل لقطة حية. يمكن أن تعمل هذه الأساليب بشكل جيد مع المشاهد الأبسط، ولكنها غالبًا ما تواجه صعوبات عندما تكون اللقطات مزدحمة أو عندما تتحرك الأشياء بسرعة.

قد يتعطل التتبع أيضًا عند تغير الإضاءة أو عند حجب الأجسام جزئيًا، مما قد يتسبب في انحراف أو قفزات مفاجئة في track. يؤدي ذلك إلى إبطاء سير العمل ويجبر المحررين على إعادة أجزاء من اللقطة. عندما تغير الأجسام اتجاهها بسرعة، قد تواجه أجهزة تتبع الحركة القديمة صعوبة في مواكبة ذلك، مما يجعل النتائج غير متسقة ويصعب الوثوق بها. 

كيف تغير الرؤية الحاسوبية تتبع الحركة

تستخدم أنظمة الرؤية الحاسوبية المتطورة نماذج الذكاء الاصطناعي لتتبع الأجسام المتحركة عبر الفيديو. بدلاً من الاعتماد على التعديلات اليدوية المستمرة أو التتبع الهش إطارًا بإطار، يتعلم النموذج شكل الجسم وكيفية تحركه. وهذا يساعد على استقرار تتبع الحركة حتى عندما تكون المشاهد مزدحمة أو تتغير الإضاءة أو تختفي الأجسام لفترة وجيزة.

على سبيل المثال، نماذج الرؤية الحاسوبية مثل Ultralytics YOLO11 و Ultralytics القادم تدعم تتبع الكائنات من خلال اكتشاف الكائنات في كل إطار. بعبارات بسيطة، فإنها تحدد ما يوجد في الإطار ومكانه من خلال إخراج مربعات حدودية ودرجات ثقة لكل كائن تم اكتشافه.

الشكل 2. تتبع المركبات باستخدام Ultralytics YOLO11 منطقة معينة (المصدر)

ومن المثير للاهتمام أن YOLO لا track بمرور الوقت من تلقاء نفسها. بل يتم تمكين التتبع من خلال Python Ultralytics Python التي تربط YOLO بخوارزميات تتبع الأجسام المتعددة مثل ByteTrack و BoT-SORT. في هذا الإعداد، YOLO الأجسام إطارًا بإطار، ويقوم المتتبع بربط عمليات الكشف هذه عبر الإطارات للحفاظ على معرف ثابت لكل جسم أثناء حركته.

تطبيقات واقعية لتتبع الحركة المدعوم بالذكاء الاصطناعي

بعد ذلك، دعونا نلقي نظرة فاحصة على بعض التطبيقات الواقعية التي تؤثر فيها تقنية تتبع الحركة المدعومة بالذكاء الاصطناعي.

تحليلات رياضية وتتبع دقيق للاعبين

في مباراة كرة القدم، يقوم اللاعبون باستمرار بالتسارع والتوقف وتغيير الاتجاه، مما يجعل من الصعب قياس الحركة بدقة عبر الملعب. غالبًا ما يفشل التتبع اليدوي في هذه اللحظات، خاصةً عندما يتداخل اللاعبون أو يتجمعون معًا أو يتحركون في مناطق مزدحمة. 

يساعد تتبع الحركة المدعوم بالذكاء الاصطناعي في متابعة كل لاعب خلال الحركة والحفاظ على مسارات حركتهم واضحة ومتسقة. على سبيل المثال، في دراسة حديثة، استخدم الباحثون YOLO11 detect والكرة من زوايا كاميرا متعددة. YOLO11 كل لاعب في كل إطار، بينما ربط نظام التتبع تلك الاكتشافات بمرور الوقت للحفاظ على هوية كل لاعب متسقة أثناء تحركهم.

الشكل 3. اكتشاف وتتبع عدة لاعبي كرة قدم (المصدر)

تتبع الحركة في الواقع المعزز والواقع الافتراضي

الواقع المعزز (AR) هو ما يجعل من الممكن للتطبيقات وضع كائنات رقمية في العالم الحقيقي، مثل ملصق على منتج، أو شخصية على الأرض، أو طبقة فوقية على قدمك أثناء تحركك. لكي تبدو هذه التجارب واقعية، يجب أن يظل المحتوى الافتراضي ثابتًا في المكان الصحيح أثناء تحركك أو إمالة هاتفك أو تحريك الكائن نفسه.

تلعب الرؤية الحاسوبية دوراً أساسياً هنا لأنها تساعد الجهاز المحمول على فهم ما يراه وكيف تتحرك الكاميرا خلال المشهد. بعبارة أخرى، تتيح الرؤية الحاسوبية التتبع ثلاثي الأبعاد من خلال تقدير مكان وجود الجسم في الفضاء واتجاهه، ثم تحديث هذا الموقع مع تحرك المستخدم.

الشكل 4. مثال على التتبع ثلاثي الأبعاد داخل تطبيق الواقع المعزز (المصدر)

تعتمد الواقع الافتراضي (VR) على أفكار تتبع مماثلة، ولكن الهدف مختلف. بدلاً من ربط المحتوى الرقمي بالعالم الحقيقي، يركز الواقع الافتراضي على تتبع رأسك ويديك حتى يستجيب العالم الافتراضي بشكل طبيعي أثناء تحركك.

تتبع المعدات المتحركة وأتمتة العمليات

غالبًا ما تمر المعدات والمنتجات في البيئات الصناعية بمراحل متعددة من سير العمل. وتعتمد كل مرحلة على التوقيت والتنسيق الدقيقين. وقد يتأخر التتبع اليدوي لأن العناصر تتحرك بسرعات مختلفة، أو تتداخل مع بعضها البعض، أو تتغير مواقعها بسرعة.

يساعد تتبع الحركة المدعوم بالذكاء الاصطناعي في منح أنظمة الإنتاج رؤية أوضح لكل كائن أثناء تحركه عبر الخط. في دراسة مثيرة للاهتمام، قامت شبكة من الكاميرات المتصلة بتتبع المنتجات عبر دورة الإنتاج بأكملها وتحديث التوأم الرقمي، وهو نسخة افتراضية من العملية الحقيقية، في الوقت الفعلي. 

قام النظام بتحديد كل منتج، وتتبع حركته، والحفاظ على توافق النموذج الرقمي مع ما يحدث على أرض الواقع. وقد أدى هذا النهج إلى تحسين المراقبة ودعم التشغيل الآمن من خلال تزويد المشغلين برؤية موثوقة في كل مرحلة. كما أظهر كيف يمكن لتتبع الحركة أن يتيح أتمتة أكثر مرونة وقابلية للتطوير عند توفر بيانات تتبع متسقة.

إيجابيات وسلبيات تتبع الحركة المدعوم بالذكاء الاصطناعي

فيما يلي بعض مزايا استخدام تتبع الحركة المدعوم بالذكاء الاصطناعي:

  • تحسين التعافي من الانسداد: غالبًا ما يمكن لأنظمة الذكاء الاصطناعي الخاصة بالرؤية الحفاظ على المسارات أو استعادتها عندما تتداخل الكائنات أو تختفي لفترة وجيزة.
  • قابلية التوسع: بمجرد نشرها، يمكن لأجهزة تتبع الذكاء الاصطناعي معالجة مقاطع فيديو طويلة ومدخلات متعددة من الكاميرات دون الحاجة إلى إعادة الإعداد لكل لقطة.
  • بيانات حركة أكثر ثراءً: يمكن استخدام مخرجات التتبع لقياس المسارات والعدد ووقت البقاء وتقديرات السرعة الأساسية للتحليلات.

يعمل التتبع المدعوم بالذكاء الاصطناعي بشكل جيد في كثير من الحالات، ولكنه لا يعمل بشكل تلقائي في كل الإعدادات. فيما يلي بعض القيود التي يجب أخذها في الاعتبار:

  • الصيانة المستمرة: قد يتغير الأداء بمرور الوقت مع تغير زوايا الكاميرا أو البيئات أو أحمال العمل، لذا غالبًا ما تكون هناك حاجة إلى تحديثات دورية.
  • تعقيد التكامل: قد يتطلب توصيل أجهزة التتبع بمحررات الفيديو أو أنظمة التحليل أو الأتمتة الحالية محولات ومعايرة واختبارات إضافية.
  • الحالات الاستثنائية في الظروف القاسية: قد يؤدي الإضاءة المنخفضة، وضبابية الحركة، والانسداد الشديد، والأجسام الصغيرة جدًا إلى حدوث أخطاء في التتبع.

النقاط الرئيسية

أصبحت ميزات تتبع الحركة المدعومة بالذكاء الاصطناعي الخيار الأكثر عملية للفيديو الواقعي، حيث تكون الحركة سريعة والمشاهد مزدحمة ولا يمكن إجراء تعديلات يدوية. تتحسن الرؤية الحاسوبية بسرعة، مما يجعل أنظمة التتبع أسهل في النشر وأكثر موثوقية في الظروف الصعبة. ونتيجة لذلك، أصبح تتبع الحركة أكثر فائدة في مجالات الروبوتات والتطبيقات المحمولة والتحليلات وإنشاء المحتوى.

انضم إلى مجتمعنا واستكشف أحدث ما توصلنا إليه في مجال الذكاء الاصطناعي البصري على مستودع GitHub الخاص بنا. قم بزيارة صفحات الحلول الخاصة بنا لمعرفة كيف أن تطبيقات مثل الذكاء الاصطناعي في التصنيع والرؤية الحاسوبية في مجال الرعاية الصحية تقود التقدم، وتحقق من خيارات الترخيص لدينا لتشغيل حل الذكاء الاصطناعي التالي.

لنبنِ مستقبل
الذكاء الاصطناعي معًا!

ابدأ رحلتك مع مستقبل تعلم الآلة

ابدأ مجانًا