استعدوا لـ YOLO Vision 2025!
25 سبتمبر، 2025
10:00 — 18:00 بتوقيت بريطانيا الصيفي
حدث هجين
مؤتمر Yolo Vision 2024
مسرد المصطلحات

الاعتراف بالإجراءات

استكشف التعرُّف على الحركة (التعرُّف على النشاط البشري): كيف يمكن للفيديو وتقدير الوضعية والتعلُّم العميق اكتشاف الأفعال البشرية في مجالات الرعاية الصحية والأمن والرياضة.

التعرّف على الحركة، والمعروف أيضًا باسم التعرّف على النشاط البشري (HAR)، هو مجال من مجالات الرؤية الحاسوبية (CV) يركز على تحديد وفهم الأفعال البشرية من سلسلة من الملاحظات، وعادةً ما تكون تسلسلات فيديو. على عكس المهام التي تحدد الأجسام في الصور الثابتة، فإن التعرف على الحركة يحلل الحركة وتغيرات الوضعيات بمرور الوقت لتحديد ما يفعله الشخص، مثل المشي أو الجري أو التلويح. وتسمح هذه القدرة لأنظمة الذكاء الاصطناعي بتفسير السلوك البشري الديناميكي، وهو أمر بالغ الأهمية لإنشاء تطبيقات أكثر تفاعلية وإدراكاً للسياق. يتوسع السوق العالمي لهذه التكنولوجيا بسرعة، مما يعكس أهميتها المتزايدة في مختلف الصناعات.

كيف يعمل التعرف على الإجراءات

تقوم أنظمة التعرّف على الحركة بمعالجة البيانات المرئية، بشكل أساسي من مقاطع الفيديو، لتصنيف الحركات البشرية. وغالباً ما تتضمن العملية مزيجاً من العديد من تقنيات الرؤية الحاسوبية ونماذج التعلم العميق (DL).

  • إدخال البيانات: يبدأ النظام عادةً بدفق فيديو أو سلسلة من الصور. ويمكن التقاط هذه البيانات باستخدام كاميرات قياسية أو أجهزة استشعار متخصصة.
  • استخراج الميزات: يتم استخراج المعلومات الأساسية من إطارات الفيديو. يبدأ هذا غالبًا بمهام تأسيسية مثل اكتشاف الكائنات لتحديد موقع الأشخاص داخل المشهد. بعد ذلك، يتم استخدام تتبع الكائنات لتتبع الأفراد عبر إطارات متعددة، مما يؤدي إلى فهم زمني لحركتهم.
  • تحليل الحركة: لفهم الحركة المحددة، غالبًا ما تعتمد النماذج على تقدير الوضعية، والذي يحدد ويتتبع مفاصل الجسم الرئيسية. من خلال تحليل حركة هذه النقاط الرئيسية مع مرور الوقت، يمكن للنظام التفريق بين الأفعال المتشابهة، مثل المشي مقابل الجري.
  • التصنيف: تُستخدم بنيات الشبكات العصبية المتقدمة، مثل الشبكات العصبية التلافيفية ثلاثية الأبعاد أو مزيج من الشبكات العصبية التلافيفية (CNNs) مع الشبكات العصبية المتكررة (RNNs)، لتصنيف تسلسل الحركات إلى فئات حركات محددة مسبقاً. تُعد جودة بيانات التدريب، التي غالبًا ما يتم الحصول عليها من مجموعات بيانات معيارية واسعة النطاق مثل Kinetics أو UCF101، أمرًا حيويًا لدقة النموذج.

التعرف على العمل مقابل المفاهيم ذات الصلة

من المهم التفريق بين التعرف على الإجراءات ومهام السيرة الذاتية الأخرى ذات الصلة لفهم دورها الفريد.

  • التعرف على الحركة مقابل التعرف على الصورة: يهتم التعرف على الصور بتحديد وتصنيف الأشياء أو المشاهد داخل صورة واحدة ثابتة. ومع ذلك، فإن التعرف على الحركة يتوسع في هذا المجال من خلال تحليل سلسلة من الصور لفهم الأحداث والحركات الديناميكية مع مرور الوقت.
  • التعرف على الحركة مقابل فهم الفيديو: فهم الفيديو هو مجال أوسع يشمل التعرف على الحركة. في حين يركز التعرف على الحركة على وجه التحديد على تحديد الإجراءات، يهدف فهم الفيديو إلى فهم أكثر شمولية لمحتوى الفيديو، بما في ذلك تغييرات المشهد وتفاعلات الكائنات والسرد العام. على سبيل المثال، التعرف على أن شخصًا ما يفتح بابًا هو التعرف على الحركة، أما فهم أنه يدخل غرفة لتحية شخص ما فهو جزء من فهم الفيديو.
  • التعرف على الحركة مقابل تقدير الوضعية: تقدير الوضعية هو مكوّن يُستخدم غالبًا في أنظمة التعرّف على الحركة لتحديد وضعية الشخص من خلال تحديد موقع مفاصله. يوفر تقدير الوضعية البيانات الأولية عن وضعية الجسم، بينما يفسر التعرف على الحركة تسلسل هذه الوضعيات لتصنيف الحركة التي يتم تنفيذها.

تطبيقات واقعية

يعد التعرف على الحركة تقنية رئيسية وراء العديد من أنظمة الذكاء الاصطناعي الحديثة، مما يمكّنها من التفاعل مع العالم المادي وفهمه بطريقة أكثر تطوراً.

  • الرعاية الصحية ورعاية المسنين: في مجال الذكاء الاصطناعي في الرعاية الصحية، يمكن لأنظمة التعرف على الحركة مراقبة المرضى لضمان سلامتهم ورفاهيتهم. على سبيل المثال، يمكن نشر هذه الأنظمة في المستشفيات أو المنازل لاكتشاف سقوط شخص مسن تلقائياً وإرسال تنبيه للمساعدة الفورية. كما أنها تستخدم في إعادة التأهيل البدني لمراقبة ما إذا كان المرضى يؤدون تمارينهم بشكل صحيح.
  • المراقبة الذكية والأمن: بالإضافة إلى الكشف البسيط عن الحركة، يعمل التعرف على الحركة على تعزيز المراقبة الأمنية من خلال تحديد سلوكيات معينة. يمكن تدريب النظام على اكتشاف الأنشطة المشبوهة، مثل التسكع في منطقة محظورة أو أعمال التخريب، وإخطار موظفي الأمن في الوقت الفعلي. وهذا يسمح باتباع نهج أكثر استباقية للأمن.
  • التحليلات الرياضية: في مجال التحليلات الرياضية، يستخدم المدربون والمحللون تقنية التعرف على الحركة لتحليل تحركات اللاعبين تلقائيًا، وتتبع مقاييس الأداء، وتحديد الأنماط التكتيكية أثناء المباراة.
  • التفاعل بين الإنسان والحاسوب: يعد التعرف على الحركة أمرًا أساسيًا لتطوير أنظمة التحكم القائمة على الإيماءات لكل شيء بدءًا من وحدات التحكم في الألعاب إلى الأجهزة المنزلية الذكية، مما يسمح للمستخدمين بالتفاعل مع التكنولوجيا بشكل طبيعي أكثر دون الحاجة إلى وحدات تحكم مادية.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن
تم نسخ الرابط إلى الحافظة