تعرّف على كيفية عمل أنظمة تتبع الرؤية الحاسوبية، واستكشف النماذج الشائعة التي تدعم تتبع الأجسام مثل YOLO11 واكتشف تطبيقاتها في العالم الحقيقي.
الروبوتات التي يمكنها تجميع الأجزاء الكهربائية، والأنظمة التي تلتقط السيارات المسرعة، وحلول البيع بالتجزئة الذكية التي تتعقب كيفية تسوق العملاء - كل هذه الابتكارات تعتمد على الرؤية الحاسوبية. وهو فرع من الذكاء الاصطناعي (AI) يساعد الآلات على تحليل الصور ومقاطع الفيديو وفهمها.
على سبيل المثال، يحتاج الروبوت إلى التعرف على الأجزاء المختلفة ومتابعتها لتجميعها معاً بشكل صحيح. وبالمثل، يمكن لنظام المرور استخدام الرؤية الحاسوبية لرصد السيارات وقراءة لوحات السيارات ومعرفة متى يكون شخص ما مسرعاً. وفي الوقت نفسه، في المتاجر، يمكن للذكاء الاصطناعي للرؤية أن يساعد في تتبع ما ينظر إليه العملاء أو يلتقطونه، ويمكنه أيضاً مراقبة المخزون.
يتم تشغيل هذه التطبيقات بواسطة نماذج الرؤية الحاسوبية مثل Ultralytics YOLO11التي تدعم مجموعة واسعة من المهام البصرية. تركز العديد من هذه المهام على جمع الرؤى من صورة واحدة، ولكن يمكن استخدام إحدى المهام المثيرة للاهتمام بشكل خاص، وهي تتبع الأجسام، لتتبع حركة الأجسام عبر سلسلة من الصور أو إطارات الفيديو.
في هذا الدليل، سنلقي نظرة فاحصة على كيفية عمل تتبع الكائنات واستكشاف أمثلة واقعية لكيفية استخدامه. كما سنناقش أيضًا كيف تدعم نماذج الذكاء الاصطناعي المرئي مثل Ultralytics YOLO11 تتبع الكائنات. لنبدأ!
تتبع الأجسام هو مهمة رؤية حاسوبية تُستخدم لتتبع حركة الأجسام عبر إطارات الفيديو، مما يساعد الأنظمة على مراقبة وفهم كيفية تغير الأشياء بمرور الوقت. يشبه هذا الأمر إلى حدٍ كبير الطريقة التي يمكن للبشر من خلالها تتبع شخص أو جسم متحرك بأعينهم بشكل طبيعي، كما هو الحال عندما تشاهد مباراة تنس وتتبع عيناك الكرة أثناء تحركها ذهابًا وإيابًا عبر الملعب.
وبنفس الطريقة، يتضمن تتبع الأجسام استخدام الكاميرات والذكاء الاصطناعي لمتابعة حركة الكرة في الوقت الفعلي. يمكن لهذه التقنية أن تمنح المشاهدين في المنزل فهماً أفضل لسير اللعبة، خاصةً من خلال تحليلات مثل السرعة والمسار وموقع اللاعب.
في حين أن هذا النوع من التتبع البصري قد يبدو سهلاً بالنسبة للبشر، إلا أنه عندما يتعلق الأمر بالرؤية الآلية، فإنه يتضمن سلسلة من الخطوات المدعومة بنماذج الذكاء الاصطناعي للرؤية. فيما يلي تفصيل بسيط لكيفية عمل تتبع الأجسام:
من مهام الرؤية الحاسوبية الأخرى التي يدعمها YOLO11 والتي ترتبط ارتباطًا وثيقًا بتتبع الكائنات هي اكتشاف الكائنات. دعونا نستكشف الفرق بين هاتين المهمتين.
يتضمن اكتشاف الكائنات تحديد الكائنات ذات الأهمية وتحديد موقعها في صورة واحدة أو إطار فيديو واحد. على سبيل المثال، تستخدم السيارة ذاتية القيادة عملية اكتشاف الأجسام للتعرف على علامة توقف أو أحد المشاة في إطار واحد تلتقطه الكاميرات الموجودة على متنها. يجيب على السؤال: "ماذا يوجد في هذه الصورة، وأين هو؟ ومع ذلك، فإنه لا يوفر أي معلومات حول المكان الذي يتجه إليه الجسم بعد ذلك.
يعتمد تتبع الكائنات على اكتشاف الكائنات من خلال إضافة فهم الحركة بمرور الوقت. الفرق الرئيسي بين الاثنين هو كيفية تعاملهما مع الوقت والحركة. يعالج اكتشاف الكائنات كل إطار كل لقطة مستقلة، بينما يربط تتبع الكائنات النقاط بين الإطارات، باستخدام البيانات السابقة للتنبؤ بالموقع المستقبلي للكائن.
من خلال الجمع بين الاثنين معاً، يمكننا بناء أنظمة ذكاء اصطناعي بصرية قوية قادرة على التتبع في الوقت الحقيقي في البيئات الديناميكية. على سبيل المثال، يمكن لنظام أمني آلي اكتشاف الأشخاص الذين يدخلون إلى مكان ما وتتبع حركتهم باستمرار عبر الإطار.
والآن بعد أن قمنا بتغطية الفرق بين اكتشاف الأجسام وتتبعها، دعنا نلقي نظرة على كيفية دعم نماذج Ultralytics YOLO مثل YOLO11 لتتبع الأجسام في الوقت الفعلي.
على الرغم من أن نماذج YOLO ليست خوارزميات تتبع بحد ذاتها، إلا أنها تلعب دورًا أساسيًا من خلال اكتشاف الأجسام في كل إطار فيديو. وبمجرد اكتشاف الأجسام، تكون خوارزميات التتبع ضرورية لتعيين معرّفات فريدة لها، مما يسمح للنظام بتتبع حركتها من إطار إلى آخر.
لتلبية هذه الحاجة، تدمج حزمةUltralytics Python بسلاسة اكتشاف الكائنات مع خوارزميات التتبع الشائعة مثل BoT-SORT و ByteTrack. يتيح هذا التكامل للمستخدمين تشغيل الكشف والتتبع معًا بأقل قدر من الإعداد.
عند استخدام نماذج YOLO لتتبع الأجسام، يمكنك اختيار خوارزمية التتبع التي تريد تطبيقها بناءً على متطلبات تطبيقك. على سبيل المثال، تُعد BoT-SORT خيارًا جيدًا لتتبع الأجسام التي تتحرك بشكل غير متوقع، وذلك بفضل استخدامها للتنبؤ بالحركة والتعلم العميق. من ناحية أخرى، تعمل خوارزمية ByteTrack بشكل جيد في المشاهد المزدحمة بشكل خاص، حيث تحافظ على تتبع موثوق به حتى عندما تكون الأجسام ضبابية أو مخفية جزئياً.
التدريب المخصص هو عملية الضبط الدقيق لنموذج الكشف عن الكائنات المدرب مسبقًا، مثل YOLO11 على مجموعة بيانات محددة حتى يتمكن من التعرف على الكائنات غير المدرجة في مجموعات البيانات القياسية. هذا مهم بشكل خاص عندما يحتاج نظام التتبع الخاص بك إلى تتبع كائنات مخصصة أو غير شائعة.
تعتمد أنظمة التتبع على نموذج الكشف للتعرف على الكائن أولاً. إذا لم يتمكن نموذج YOLO من اكتشاف عنصر معين، مثل نوع معين من الآلات أو أنواع الحياة البرية، فلن تتمكن خوارزمية التتبع من تتبعه.
هذا هو السبب في أهمية التدريب المخصص: فهو يضمن قدرة نموذج الاكتشاف على تحديد الكائنات التي تريد تتبعها بدقة.
من المهم أيضًا أن تضع في اعتبارك أنه يتم ضبط نموذج الكشف فقط أثناء هذه العملية. لا يتم تدريب خوارزميات التتبع، مثل BoT-SORT أو ByteTrack، بشكل مخصص - فهي ببساطة تستخدم مخرجات نموذج YOLO لمتابعة الأجسام المكتشفة عبر الإطارات.
والآن بعد أن أصبح لدينا فهم أفضل لماهية تتبع الكائنات وكيفية عملها، دعنا نستكشف بعض التطبيقات الواقعية التي تؤثر فيها هذه التقنية.
تعتمد أنظمة تقدير السرعة التي تتيحها الرؤية الحاسوبية على مهام مثل اكتشاف الأجسام وتتبعها. تم تصميم هذه الأنظمة لحساب سرعة حركة جسم ما - سواء كان مركبة أو راكب دراجة أو حتى شخص. هذه المعلومات ضرورية لمجموعة متنوعة من التطبيقات، من إدارة حركة المرور إلى مراقبة السلامة والأتمتة الصناعية.
باستخدام نموذج مثل Ultralytics YOLO11 يمكن اكتشاف الأجسام وتتبعها عبر إطارات الفيديو. من خلال تحليل المسافة التي يتحركها الجسم خلال فترة زمنية محددة، يمكن للنظام تقدير سرعته.
يمكن أن تكون عمليات التصنيع سريعة الخطى ومعقدة للغاية، مما يجعل من الصعب تتبع كل عنصر يتم إنتاجه يدويًا. يوفر تتبع الكائنات حلاً جيدًا لأتمتة مراقبة المنتجات أثناء انتقالها خلال كل مرحلة من مراحل الإنتاج. يمكن أن يساعد المصانع في الحفاظ على مستويات عالية من الدقة والكفاءة دون إبطاء الأمور.
بدءًا من عد المنتجات على الحزام الناقل إلى اكتشاف العيوب أو التحقق من التجميع السليم، يوفر تتبع الأجسام إمكانية الرؤية والتحكم في المهام التي قد تستغرق وقتًا طويلاً أو تكون عرضة للخطأ. هذه التكنولوجيا مؤثرة بشكل خاص في الصناعات ذات الحجم الكبير مثل معالجة الأغذية والإلكترونيات والتعبئة والتغليف، حيث تكون السرعة والدقة أمرًا بالغ الأهمية.
يدخل عدد لا يُحصى من العملاء إلى متاجر البيع بالتجزئة ويخرجون منها كل يوم، ويُعد فهم سلوكهم أمرًا أساسيًا لتحسين تجربة العملاء وأداء الأعمال. يتيح تتبُّع الأجسام لتجار التجزئة إمكانية مراقبة حركة الزبائن وقياس وقت المكوث وتحليل أنماط الحركة، كل ذلك دون الحاجة إلى أساليب يدوية أو تطفلية.
من خلال تتبع الأفراد أثناء دخولهم وخروجهم وتحركهم في جميع أنحاء المتجر، يمكن للشركات الحصول على رؤى حول ساعات الذروة والمناطق التي تحظى بشعبية كبيرة وحتى طول طوابير الانتظار. يمكن لهذه الرؤى أن تفيد في اتخاذ القرارات المتعلقة بالتوظيف وتخطيط المتجر ووضع المخزون، مما يؤدي في النهاية إلى عمليات أكثر كفاءة وزيادة المبيعات.
من متاجر البيع بالتجزئة إلى أرضيات المصانع، يتم استخدام تتبع الأجسام في جميع أنواع الصناعات لتحسين عوامل مثل الكفاءة والسلامة والتجربة الشاملة. فيما يلي بعض الفوائد الرئيسية التي يمكن أن يحققها تتبع الأجسام في مختلف الصناعات:
على الرغم من أن هذه الفوائد تسلط الضوء على كيفية تأثير تتبع الكائنات بشكل إيجابي على حالات الاستخدام المختلفة، إلا أنه من المهم أيضًا النظر في التحديات التي ينطوي عليها تنفيذه. دعونا نلقي نظرة فاحصة على بعض قيود تتبع الكائنات:
تتبع الأجسام هو مهمة رؤية حاسوبية تتيح للآلات تتبع حركة الأجسام بمرور الوقت. وتُستخدم في مجموعة واسعة من السيناريوهات في العالم الحقيقي، بدءاً من تقدير سرعة السيارة وعدّ المنتجات على خط التجميع إلى تحليل حركات اللاعبين في الألعاب الرياضية.
مع نماذج الذكاء الاصطناعي للرؤية مثل YOLO11 وخوارزميات التتبع مثل BoT-SORT و ByteTrack، أصبح تتبع الأجسام أسرع وأكثر ذكاءً وسهولة في مختلف الصناعات. ومع تطور تكنولوجيا تتبع الأجسام، فإنها تساعد الأنظمة على أن تصبح أكثر ذكاءً وفعالية واستجابةً، إطاراً تلو الآخر.
هل تريد معرفة المزيد عن رؤية الكمبيوتر والذكاء الاصطناعي؟ استكشف مستودع GitHub الخاص بنا، وتواصل مع مجتمعنا، وتحقق من خيارات الترخيص لدينا لبدء مشروع رؤية الكمبيوتر الخاص بك. إذا كنت تستكشف ابتكارات مثل الذكاء الاصطناعي في التصنيع والرؤية الحاسوبية في صناعة السيارات، تفضل بزيارة صفحات الحلول الخاصة بنا لاكتشاف المزيد.