Yolo فيجن شنتشن
شنتشن
انضم الآن

تحسين التنبؤ بالتصادم باستخدام نماذج Ultralytics YOLO

أبيرامي فينا

6 دقائق قراءة

27 نوفمبر 2025

تعرّف على كيفية مساعدة الرؤى المستقاة من نماذج Ultralytics YOLO في مساعدة أنظمة التنبؤ بالاصطدام على اتخاذ قرارات أكثر أماناً وسرعة في البيئات الديناميكية.

على الرغم من توخي الحذر على الطريق، لا يزال من الممكن أن تقع الحوادث. سيارة تغير حارة السير، أو أحد المشاة يمشي على غير هدى، أو راكب دراجة يسرع دون سابق إنذار. هذه اللحظات اليومية هي أمثلة على اللحظات التي يمكن فيها لأنظمة التنبؤ بالاصطدام أن تحدث فرقاً حقيقياً وتساعد في الحفاظ على سلامة الجميع.

في السابق، تناولنا التنبؤ بمسار الكرة ورأينا كيف يساعد التنبؤ بمسار الكرة سريعة الحركة التحليلات الرياضية على فهم الحركة وتوقع ما سيحدث بعد ذلك. يعمل التنبؤ بالتصادم بطريقة مماثلة. 

تنظر أنظمة التنبؤ هذه بشكل أساسي إلى المستقبل. فمن خلال مراقبة كيفية تحرك المركبات والمشاة، يمكنها اكتشاف المخاطر في وقت مبكر وتعديل مسارها أو سلوكها قبل أن تأخذ الأمور منحى خطيراً (أو ما يُعرف بتخطيط الحركة أو تخطيط المسار).

إن تقنيات علوم الكمبيوتر الرئيسية وراء أنظمة التنبؤ بالاصطدام هي الذكاء الاصطناعي ومجالاته الفرعية، مثل الرؤية الحاسوبية وأساليب التنبؤ التي تساعد على التنبؤ بكيفية تحرك الأشياء. على سبيل المثال، نماذج الرؤية الحاسوبية مثل Ultralytics YOLO11 ونموذج Ultralytics YOLO26 القادم detect track الأجسام مثل المركبات والمشاة في الوقت الفعلي، وتستخدم نماذج التنبؤ هذه الرؤى لتقدير تحركاتها التالية.

الشكل 1. مثال على استخدام YOLO11 detect الأجسام الموجودة على الطريق(المصدر).

والنتيجة هي نظام ذكاء اصطناعي يفهم ما يحدث حوله ويدعم اتخاذ قرارات أكثر ذكاءً في البيئات الديناميكية. في هذه المقالة، سنستكشف كيفية عمل التنبؤ بالاصطدام، والطرق التي تقف وراءه، والدور الذي يمكن أن تلعبه الرؤية الحاسوبية ونماذجYOLO Ultralytics هذه العملية. لنبدأ!

ما هو التنبؤ بالتصادم؟

التنبؤ بالاصطدام هو قدرة نظام الذكاء الاصطناعي على فهم كيفية تحرك الأجسام وتوقع متى قد تقترب أو تتلامس بشكل كبير. يمكن للأنظمة المختلفة استخدام هذه المعلومات بعدة طرق، بما في ذلك دعم ميزات السلامة أو تحسين الحركة أو تنسيق الإجراءات في المساحات المشتركة.

أينما تتحرك الأجسام عبر مساحة مشتركة، سواء كانت سيارات على طريق سريع، أو رافعات شوكية في ممر مستودع، أو مشاة يعبرون شارعًا، فإن التنبؤ بالتصادم يساعد الأنظمة على فهم كيفية حدوث هذه التفاعلات. في التطبيقات التي تركز على السلامة، يمكن استخدام هذا التنبؤ للحد من المخاطر، بينما في إعدادات أخرى، يمكن أن يدعم مهام مثل تخطيط المسار أو التوقيت أو الحركة المنسقة.

على سبيل المثال، في العديد من السيارات الحديثة المزوّدة بأنظمة مساعدة السائق المتقدمة أو ADAS، تراقب الكاميرات والمستشعرات الطريق أمامك وتقدر مدى سرعة اقتراب السيارة من الأجسام القريبة. إذا اكتشف النظام أن الموقف قد يصبح غير آمن، فإنه يقوم بتنبيه السائق، وفي بعض الحالات، قد يساعد الكبح التلقائي في تقليل التصادم.

استكشاف المراحل الأربع للتنبؤ بالتصادم

ينطوي التنبؤ بالتصادم على عملية منسقة تعمل فيها مكونات الذكاء الاصطناعي المختلفة معًا لتحديد الأجسام وتتبع حركتها وتقدير ما قد يحدث بعد ذلك. تعمل هذه الأنظمة عادةً من خلال أربع مراحل متصلة: اكتشاف الأجسام، وتتبع الأجسام، والتنبؤ بالمسار، وأخيراً التنبؤ بالتصادم، حيث تعتمد كل مرحلة على دقة المرحلة التي تسبقها. 

بعد ذلك، دعنا نلقي نظرة فاحصة على كيفية عمل كل مرحلة.

نظرة على اكتشاف الأجسام

اكتشاف الكائنات هو مهمة أساسية من مهام الرؤية الحاسوبية حيث تقوم نماذج الذكاء الاصطناعي للرؤية بتحديد الكائنات في صورة أو إطار فيديو وتحديد موقعها. من خلال تحليل بيانات البكسل، يمكن لنموذج الكشف عن الأجسام أن ينتج ثلاثة مخرجات رئيسية: المربعات المحيطة، وفئات الأجسام، ودرجات الثقة. تُظهِر المربعات المحدودة مكان وجود الجسم، وتشير فئات الجسم إلى ماهيته، مثل سيارة أو أحد المشاة أو راكب دراجة، وتعكس درجات الثقة مدى يقين النموذج من التنبؤ.

تعتمد نماذج الذكاء الاصطناعي للرؤية مثل YOLO11 و YOLO26 على هذا الأساس وتدعم العديد من المهام ذات الصلة، بما في ذلك اكتشاف الأجسام وتتبع الأجسام واكتشاف المربعات المحدودة الموجهة (OBB). يمكن لاكتشاف الكائنات أن يخبر نظام التنبؤ بما هو موجود في كل إطار، ويتتبع التتبع تلك الكائنات أثناء تحركها، وتوفر الصناديق المحدودة الموجهة أشكالاً أكثر دقة للأجسام التي تظهر في زوايا مختلفة. 

في هذه المرحلة، يركز نظام التنبؤ بالتصادم في هذه المرحلة على فهم ما هو موجود في البيانات المرئية فقط. وهو يشكل الطبقة الأساسية للمعلومات التي تعتمد عليها جميع الخطوات اللاحقة، لكنه لا يأخذ في الاعتبار بعد كيفية تحرك الأجسام أو تفاعلها.

نظرة عامة على تتبع الأجسام

بمجرد اكتشاف الأجسام، فإن الخطوة التالية هي track عبر الإطارات حتى يتمكن النظام من فهم كيفية تحركها بمرور الوقت. في حين أن الكشف يوفر مربعات محددة جديدة في كل إطار، فإن تتبع الأجسام يضيف الاستمرارية من خلال ربط تلك الاكتشافات عبر الزمن.

تعمل خوارزميات التتبع التي تدعمها حزمةUltralytics Python مثل ByteTrack أو BoT-SORT، مع نماذج مثل YOLO11 باستخدام بيانات الكشف من كل إطار لتتبع الأجسام أثناء تحركها. تعيّن هذه الخوارزميات معرّفًا فريدًا لكل كائن وتستخدمه للحفاظ على تلك الهوية حتى عندما يتحرك الكائن بسرعة أو يصبح مخفيًا جزئيًا. يؤدي هذا إلى إنشاء سجل تتبع سلس يلتقط كيفية تحرك الجسم. 

الشكل 2. نظرة على تعيين معرفات فريدة لمختلف الاكتشافات باستخدام YOLO (المصدر)

إليك لمحة سريعة عن كيفية عمل هاتين الطريقتين للتتبع:

  • ByteTrack: يستخدم كلاً من الاكتشافات عالية الثقة ومنخفضة الثقة للحفاظ على معرّفات الأجسام متسقة، مع تنبؤات الحركة من مرشح كالمان التي تساعد المتعقب على البقاء مستقرًا عندما تتحرك الأجسام بسرعة أو يصعب detect لفترة وجيزة.

  • BoT-SORT: تعمل هذه الخوارزمية على توسيع نطاق SORT من خلال الجمع بين تنبؤات حركة مرشح كالمان مع إشارات المظهر، مما يسمح للمتعقب بتتبع الأجسام بشكل أكثر موثوقية في المشاهد المزدحمة أو أثناء الانسداد الجزئي.

ولقياس مدى جودة أداء طرق التتبع هذه، يقوم الباحثون بتقييمها على مجموعات بيانات ومعايير تتبع الأجسام المتعددة (MOT) القائمة. كما تتضمن المقاييس التي يشيع استخدامها دقة التتبع متعدد الأجسام (MOTA)، والتي تعكس جودة التتبع الإجمالية؛ ودرجة F1 للتعرف على الهوية (IDF1)، والتي تقيس مدى اتساق الحفاظ على هويات الأجسام؛ ودقة التتبع من الدرجة الأعلى (HOTA)، والتي تقدم رؤية متوازنة لكل من أداء الكشف ودقة الارتباط.

فهم التنبؤ بالمسار

بعد تتبُّع الجسم عبر إطارات متعددة، فإن الخطوة التالية هي التنبؤ بالمكان الذي سيذهب إليه بعد ذلك. يُعرف هذا باسم التنبؤ بالمسار. بينما يعثر الاكتشاف على الأجسام ويتتبع التتبع كيفية تحركها، فإن التنبؤ يتطلع إلى الأمام ويقدر مواقعها المستقبلية. 

يمكن استخدام المعلومات المستقاة من الكشف والتتبع، مثل المربع المحدّد للجسم وموقعه عبر الإطارات والمُعرّف المُعيّن، لحساب ميزات الحركة مثل السرعة والاتجاه وأنماط الحركة. تمنح هذه الرؤى المستخلصة نموذج التنبؤ البيانات التي يحتاجها لتقدير المكان الذي من المحتمل أن يكون فيه الجسم في الثواني القليلة القادمة.

في الحالات التي تحتوي فيها بيانات التتبع على فجوات أو قفزات مفاجئة، تساعد تقنيات الاستيفاء في إعادة بناء مسارات أكثر سلاسة واتساقًا. يضمن ذلك أن يتلقى نموذج التنبؤ مدخلات حركة عالية الجودة بدلاً من بيانات الموقع المشوشة أو غير المكتملة.

الشكل 3. تصور للتنبؤ بمسار السيارة.(المصدر)

ولإجراء هذه التنبؤات، تعتمد العديد من الأنظمة على نماذج التعلّم العميق المصممة لفهم كيفية تغيّر حركة الجسم بمرور الوقت. من خلال تحليل تسلسلات المواضع السابقة وخصائص الحركة المستمدة منها، تتعلم هذه النماذج أنماط الحركة الشائعة وتستخدم هذه المعرفة للتنبؤ بالمسارات المستقبلية. 

فيما يلي بعض مناهج التعلم العميق والتعلم الآلي الشائعة الاستخدام للتنبؤ بالمسار:

  • الشبكات العصبية المتكررة (RNNs): الشبكات العصبية المتكررة هي نماذج تعلم عميقة مصممة للعمل مع التسلسل، مثل سلسلة من إطارات الفيديو. ويمكنها الاحتفاظ بذاكرة للمواضع السابقة واستخدام هذه المعلومات لفهم كيفية تحرك الجسم. وهذا يساعد النظام على التعرف على أنماط الحركة البسيطة مثل زيادة السرعة أو إبطاءها أو التحرك في خط مستقيم.
  • شبكات الذاكرة طويلة وقصيرة المدى (LSTMs): تُعد شبكات الذاكرة طويلة المدى القصيرة نوعًا أكثر تقدمًا من شبكات الذاكرة الشبكية ذات الذاكرة طويلة المدى التي يمكنها تذكر المعلومات لفترات أطول. ويسمح لها ذلك بالتقاط حركات أكثر تعقيداً، مثل مركبة تستعد للانعطاف أو أحد المشاة الذي يغير اتجاهه. ولأنها تستطيع track اتجاهات أطول، فإنها غالباً ما تنتج تنبؤات أكثر موثوقية في البيئات المزدحمة.
  • المحولات: تعالج المحولات تسلسلات الحركة الكاملة وتستخدم الانتباه للتركيز على أهم تفاصيل هذه التسلسلات. وهذا يجعلها فعالة بشكل خاص في المشاهد التي تتفاعل فيها أجسام متعددة، مثل اندماج السيارات أو عبور المشاة.

يمكن لهذه النماذج التنبؤ بالمسارات قصيرة الأجل وطويلة الأجل. تميل التنبؤات قصيرة الأجل، التي عادة ما تكون أقل من ثانيتين، إلى أن تكون الأكثر دقة، في حين أن التنبؤات على مدى فترات أطول، مثل ثانيتين إلى ست ثوان، توفر المزيد من التبصر ولكنها تأتي مع قدر أكبر من عدم اليقين.

اجمع كل شيء معًا: خوارزميات اكتشاف التصادم

في المرحلة الأخيرة، وهي مرحلة التنبؤ بالتصادم، يستخدم النظام كل ما تعلّمه حتى الآن: ماهية كل جسم (الكشف)، وكيفية تحركه (التتبع)، والمكان الذي من المحتمل أن يتجه إليه بعد ذلك (التنبؤ). تتحقق هذه الخطوة مما إذا كان أي من المسارات المتوقعة قد يتقاطع بطريقة قد تؤدي إلى تصادم.

الشكل 4. كيفية عمل نظام التنبؤ بالاصطدام(المصدر)

في حالة المركبات ذاتية القيادة، يقوم نظام التحقق من التصادم بمقارنة المسارات المستقبلية للأجسام القريبة مثل السيارات والمشاة وراكبي الدراجات. إذا تداخل مساران متوقعان أو اقتربا بشكل خطير، فإنه يضع علامة على الموقف على أنه تصادم محتمل للمركبة. لفهم مدى إلحاح خطر التصادم، يقوم النظام أيضاً بحساب قيمة تُعرف باسم وقت التصادم.

وقت التصادم (TTC) هو مقياس رئيسي في البيئات سريعة الحركة. فهو يقدّر الوقت المتبقي قبل أن يصطدم جسمان إذا استمرا بسرعاتهما واتجاهاتهما الحالية. عندما ينخفض وقت التصادم إلى أقل من عتبة معينة، يمكن للنظام الاستجابة عن طريق إصدار تحذيرات أو استخدام المكابح أو تعديل المسار المخطط له.

تطبيقات العالم الحقيقي للتنبؤ بالتصادم

أصبح التنبؤ بالتصادم أمرًا بالغ الأهمية في العديد من الصناعات، بما في ذلك إدارة حركة المرور والبنية التحتية للمدن الذكية والأتمتة الصناعية والروبوتات المتنقلة. ومع استمرار تقدم نماذج الرؤية والتنبؤ الحاسوبية الحديثة، أصبحت هذه الأنظمة أكثر قدرة على توقع الحركة.

والآن بعد أن أصبح لدينا فهم أفضل لكيفية عمل التنبؤ بالتصادم والتنبؤ بالمسار، دعونا نلقي نظرة على بعض الدراسات البحثية المثيرة للاهتمام التي توضح كيفية استخدام هذه الأساليب في بيئات واقعية مختلفة.

التنبؤ بالتصادم YOLO للمركبات ذاتية القيادة في حالات الطوارئ

يعد التنقل في البيئات المزدحمة وغير المتوقعة أحد أصعب التحديات التي تواجهها الأنظمة ذاتية القيادة، خاصة عندما يتحرك المشاة بطرق لا تتبع أنماطاً واضحة. وتواجه مركبات الطوارئ هذه المشكلة بشكل أكبر، حيث إنها تحتاج إلى التحرك بسرعة وبسرعات عالية عبر الأماكن العامة المكتظة دون الاعتماد على طرق منظمة أو علامات الحارات أو سلوك المشاة الذي يمكن التنبؤ به. 

في هذه الأنواع من السيناريوهات، يصبح فهم مكان وجود الأشخاص وكيف يمكن أن يتحركوا في الثواني القليلة القادمة أمراً ضرورياً لتجنب الحوادث. على سبيل المثال، استكشفت دراسة بحثية حديثة هذا التحدي من خلال بناء خط كامل للتنبؤ بالاصطدام لمركبة ذاتية القيادة في حالات الطوارئ (EAV) تعمل في بيئات غنية بالمشاة. 

كيفية عمل خط أنابيب التنبؤ بالتصادم YOLO

إليك لمحة عن كيفية عمل هذه المنهجية:

  • الكشف عن المشاة باستخدام YOLO: يقوم كاشف YOLO بتحديد المشاة في كل إطار كاميرا ويخرج مربعات محددة لكل شخص مرئي.
  • تتبع الحركة باستخدام ByteTrack: تربط خوارزمية ByteTrack بين هذه الاكتشافات عبر الإطارات، مما يمنح كل مشاة معرّفًا متسقًا ويخلق تاريخًا للحركة يوضح كيفية تحركهم بمرور الوقت.
  • تقدير الموقع في العالم الحقيقي: يحول نظام رسم الخرائط المنظورية العكسية (IPM) إحداثيات البكسل ثنائية الأبعاد إلى مواقع تقريبية على مستوى الأرض، مما يساعد النظام على فهم مكان وجود المشاة في الفضاء الواقعي بالنسبة إلى المركبة.
  • توليد رؤية عين الطائر باستخدام شبكة GAN الشرطية: تُنشئ شبكة GAN المشروطة، وهي نموذج ذكاء اصطناعي يترجم تنسيق صورة إلى تنسيق آخر، تمثيلًا للمشهد من أعلى إلى أسفل. هذا التخطيط من أعلى إلى أسفل يجعل من السهل تفسير مواقع المشاة ومحيطهم.
  • التنبؤ بالمسار باستخدام نموذج LSTM: باستخدام المواضع السابقة لكل مشاة وأنماط حركتهم السابقة، يتنبأ نموذج LSTM بالمكان الذي من المحتمل أن يتحركوا فيه في الثواني القليلة القادمة.
  • الكشف الفعال عن التصادم باستخدام مخروط التصادم: تتم مقارنة المسارات المتوقعة باستخدام طريقة مخروط التصادم، والتي تحدد ما إذا كانت مسارات المركبة وأي مشاة في مسار التقاطع.
  • تجنب الاصطدام من خلال الإشارات: إذا تنبأ النظام بحدوث تصادم، فإنه يقوم بتفعيل إشارة سمعية (مثل البوق أو الجرس) في اللحظة المثلى. يتم اختيار التوقيت للتأثير على سلوك المشاة ومنحهم فرصة للإسراع أو الإبطاء والوصول إلى بر الأمان.

ضمان سلامة المشاة في المدن باستخدام رؤية الحافة و YOLO

وبالمثل، هناك طريقة أخرى لمنع التصادم تتخطى المركبات وتركز على البنية التحتية نفسها. فبدلاً من الاعتماد على أجهزة الاستشعار داخل السيارة، تستخدم هذه الطريقة كاميرات ذكية مثبتة في ممرات المشاة والتقاطعات لمراقبة كيفية تحرك المشاة والمركبات في الوقت الفعلي. لا يمكن التنبؤ بهذه المواقع في كثير من الأحيان؛ فقد يدخل الناس إلى الطريق فجأة، وقد يتنقل راكبو الدراجات الهوائية بين حركة المرور، وقد لا يخفف السائقون من سرعتهم دائماً، لذا فإن اكتشاف المخاطر مبكراً أمر حيوي.

وقد استكشفت دراسة مثيرة للاهتمام هذه الفكرة من خلال نظام يسمى NAVIBox، وهو جهاز رؤية حافة الطريق مصمم للتنبؤ بمخاطر المركبات على المشاة مباشرة عند التقاطع. يستخدم النظام نظام Ultralytics YOLOv8detect المشاة والمركبات، وجهاز تعقب مركزي خفيف الوزن لتتبعهم عبر الإطارات. يؤدي ذلك إلى إنشاء تواريخ حركة قصيرة وموثوقة يتم تنقيحها بعد ذلك باستخدام تحويل المنظور الذي يحول عرض كاميرات المراقبة بزاوية إلى تخطيط أوضح للطريق.

من خلال هذه المسارات المحسّنة، يمكن لنظام NAVIBox تقدير كيفية تحرك مستخدمي الطريق في الثواني القليلة القادمة والتحقق مما إذا كانت مساراتهم قد تتقاطع (يشار إليها أيضاً باسم اختبار التقاطع). عندما يكتشف النظام تقاطعاً محفوفاً بالمخاطر، فإنه يرسل تحذيرات فورية من خلال شاشات العرض للسائقين ومكبرات الصوت للمشاة، دون الاعتماد على خادم بعيد أو اتصال بالشبكة. أظهر الاختبار في مواقع حضرية حقيقية أن نظام NAVIBox يعمل بسرعة كافية للاستجابة الحقيقية في الوقت الحقيقي ويمكنه تحديد سيناريوهات التصادم المحتملة بدقة، مما يجعله أداة سلامة عملية لتقاطعات المدن المزدحمة.

الشكل 5. التنبؤ بخطر الاصطدام بين المركبات والمشاة.(المصدر)

إيجابيات وسلبيات اكتشاف التصادم والتنبؤ به

فيما يلي بعض مزايا استخدام أنظمة التصادم التنبؤي المدعومة بالذكاء الاصطناعي:

  • تحسين الوعي الظرفي: ترسم أنظمة الذكاء الاصطناعي باستمرار خريطة لكيفية تحرك الأشياء في بيئة ما، مما يوفر فهماً أكثر ثراءً لتدفق الحشود على نطاق واسع أو سلوك حركة المرور أو مسارات الآلات.
  • رؤى قائمة على البيانات للتخطيط طويل المدى: من خلال تسجيل الاكتشافات والأخطاء الوشيكة وأنماط الحركة، توفر أنظمة الذكاء الاصطناعي تحليلات يمكن لمخططي المدن وفرق السلامة ومشغلي الأساطيل استخدامها لإعادة تصميم التقاطعات أو تحسين اللافتات أو تحسين السياسات التشغيلية.
  • الوقاية من المخاطر الفعالة من حيث التكلفة: من خلال الكشف عن المخاطر قبل تفاقمها، يمكن لهذه الأنظمة أن تجعل من الممكن تجنب الحوادث المكلفة أو مطالبات التأمين أو إصلاح المعدات.

على الرغم من فوائدها، إلا أن الأنظمة الخالية من التصادم تواجه أيضاً بعض القيود. فيما يلي بعض التحديات التي يجب مراعاتها:

  • قيود وضع المستشعر والكاميرا: يمكن أن تؤدي الكاميرات ذات الوضع السيئ أو ذات الزوايا الضعيفة إلى تشويه حجم الجسم أو المسافة، مما يجعل تقدير العمق والتنبؤ بالمسار أقل موثوقية.
  • الانسداد: قد تختفي الأجسام جزئياً أو كلياً خلف أجسام أخرى. وهذا يجعل تتبع الأجسام صعباً لأن النموذج يفقد الاستمرارية البصرية.
  • الظروف البيئية: يمكن أن تقلل الإضاءة المنخفضة أو أشعة الشمس القاسية أو المطر أو الضباب أو ضعف جودة الكاميرا من قدرة النموذج على رؤية المشهد بوضوح، مما يؤثر على الدقة.

النقاط الرئيسية

يجمع التنبؤ بالاصطدام بين قدرتين قويتين: الرؤية الحاسوبية التي تتيح للأنظمة فهم ما يحدث في البيئة في الوقت الحالي، والتنبؤ بالمسار الذي يساعدها على توقع ما قد يحدث بعد ذلك. 

من خلال الجمع بين نقاط القوة هذه، يمكن للآلات detect الأجسام المتحركة في الوقت الفعلي والتنبؤ بكيفية تفاعل هذه الأجسام في الثواني القادمة. ومع استمرار تطور تقنيات الرؤية الحاسوبية والتنبؤ، من المرجح أن يصبح التنبؤ بالاصطدام أمراً أساسياً لبناء أنظمة ذاتية القيادة أكثر أماناً وموثوقية وقابلية للتطوير.

اطلع على مجتمعنا ومستودع GitHub لمعرفة المزيد عن الذكاء الاصطناعي. استكشف تطبيقات مثل الذكاء الاصطناعي في الرعاية الصحية والرؤية الحاسوبية في التصنيع على صفحات الحلول الخاصة بنا. اكتشف خيارات الترخيص لدينا وابدأ في البناء اليوم!

لنبنِ مستقبل
الذكاء الاصطناعي معًا!

ابدأ رحلتك مع مستقبل تعلم الآلة

ابدأ مجانًا