يولو فيجن شنتشن
شنتشن
انضم الآن

هل يمكن للذكاء الاصطناعي اكتشاف الأفعال البشرية؟ استكشاف التعرف على النشاط

أبيرامي فينا

6 دقائق قراءة

22 سبتمبر، 2025

من تطبيقات اللياقة البدنية إلى مراقبة المرضى، اكتشف كيف تعالج رؤية الحاسوب السؤال التالي: هل يمكن للذكاء الاصطناعي اكتشاف الأفعال البشرية في بيئات العالم الحقيقي؟

الحياة اليومية مليئة بالحركات الصغيرة التي نادراً ما نتوقف للتفكير فيها. قد يبدو المشي عبر الغرفة، أو الجلوس على المكتب، أو التلويح لصديق أمرًا سهلاً بالنسبة لنا، ومع ذلك فإن اكتشافها باستخدام الذكاء الاصطناعي أكثر تعقيدًا بكثير. ما يأتي بشكل طبيعي للبشر يترجم إلى شيء أكثر تعقيدًا عندما تحاول الآلة فهمه.

تُعرف هذه القدرة باسم التعرف على النشاط البشري (HAR)، وهي تمكن أجهزة الكمبيوتر من اكتشاف وتفسير الأنماط في السلوك البشري. يعد تطبيق اللياقة البدنية مثالًا رائعًا على التعرف على النشاط البشري أثناء العمل. من خلال تتبع الخطوات وروتينات التمرين، فإنه يوضح كيف يمكن للذكاء الاصطناعي مراقبة الأنشطة اليومية. 

بالنظر إلى إمكانات تقنية التعرف على الأفعال البشرية (HAR)، بدأت العديد من الصناعات في تبني هذه التقنية. في الواقع، من المتوقع أن يصل حجم سوق التعرف على الأفعال البشرية إلى أكثر من 12.56 مليار دولار بحلول عام 2033.

جزء كبير من هذا التقدم مدفوع بالرؤية الحاسوبية، وهو فرع من فروع الذكاء الاصطناعي الذي يمكّن الآلات من تحليل البيانات المرئية، مثل الصور ومقاطع الفيديو. مع الرؤية الحاسوبية والتعرف على الصور، تطور التعرف على النشاط البشري (HAR) من مفهوم بحثي إلى جزء عملي ومثير من تطبيقات الذكاء الاصطناعي المتطورة. 

في هذه المقالة، سوف نستكشف ماهية HAR، والطرق المختلفة المستخدمة للتعرف على الأفعال البشرية، وكيف تساعد الرؤية الحاسوبية في الإجابة على السؤال: هل يمكن للذكاء الاصطناعي اكتشاف الأفعال البشرية في تطبيقات العالم الحقيقي؟ هيا بنا نبدأ!

ما هو التعرف على الأفعال البشرية؟

يتيح التعرف على الأفعال البشرية للأنظمة الحاسوبية فهم الأنشطة أو الأفعال البشرية من خلال تحليل حركات الجسم. على عكس مجرد اكتشاف شخص في صورة، يمكن أن يساعد التعرف على الأفعال البشرية في تحديد ما يفعله الشخص. على سبيل المثال، التمييز بين المشي والجري، والتعرف على التلويح باليد، أو ملاحظة سقوط شخص ما.

يكمن أساس التعرف على النشاط البشري (HAR) في أنماط الحركة والوضعية. يمكن أن يشير تغيير طفيف في كيفية وضع ذراعي الإنسان أو ساقيه إلى مجموعة متنوعة من الإجراءات. من خلال التقاط هذه التفاصيل الدقيقة وتفسيرها، يمكن لأنظمة التعرف على النشاط البشري (HAR) الحصول على رؤى ذات مغزى من حركات الجسم.

لتحقيق ذلك، يجمع التعرف على الأفعال البشرية بين تقنيات متعددة مثل تعلم الآلة ونماذج التعلم العميق والرؤية الحاسوبية ومعالجة الصور، والتي تعمل معًا لتحليل حركات الجسم وتفسير الأفعال البشرية بدقة أعلى. 

الشكل 1. يتضمن التعرف على النشاط البشري فروعًا مختلفة من علوم الحاسوب (المصدر)

كانت أنظمة التعرف على الأنشطة البشرية (HAR) السابقة أكثر محدودية. يمكنها التعامل مع عدد قليل فقط من الإجراءات البسيطة والمتكررة في البيئات الخاضعة للرقابة وغالبًا ما كانت تواجه صعوبات في مواقف العالم الحقيقي. 

اليوم، بفضل الذكاء الاصطناعي وكميات كبيرة من بيانات الفيديو، فقد تقدم التعرف على النشاط البشري (HAR) بشكل كبير في كل من الدقة والمتانة. يمكن للأنظمة الحديثة التعرف على مجموعة واسعة من الأنشطة بدقة أكبر بكثير، مما يجعل التكنولوجيا عملية لمجالات مثل الرعاية الصحية والأمن والأجهزة التفاعلية.

طرق مختلفة لاكتشاف أفعال الإنسان

الآن بعد أن أصبح لدينا فهم أفضل لما هو التعرف على الأفعال البشرية، دعنا نلقي نظرة على الطرق المختلفة التي يمكن للآلات من خلالها اكتشاف الأفعال البشرية. 

فيما يلي بعض الطرق الشائعة:

  • الطرق القائمة على المستشعرات: يمكن للأجهزة الذكية مثل مقاييس التسارع والأجهزة القابلة للارتداء والهواتف الذكية التقاط إشارات مباشرة من جسم الإنسان. يمكنهم إظهار أنماط الحركة مثل المشي أو الجري أو حتى الوقوف بلا حراك. يعد عداد الخطوات الموجود في الساعة الذكية مثالًا رائعًا على هذه الطريقة.
  • الطرق القائمة على الرؤية: تقوم الكاميرات المقترنة برؤية الكمبيوتر بتحليل الصور ومقاطع الفيديو لتتبع كيف يبدو الجسم ويتحرك إطارًا بإطار. يتيح ذلك التعرف على الأنشطة الأكثر تعقيدًا. تعتمد أجهزة التلفزيون أو أنظمة الألعاب التي يتم التحكم فيها بالإيماءات على هذه الطريقة.
  • طرق متعددة الوسائط: هو مزيج من أجهزة الاستشعار والكاميرات التي تخلق نظامًا أكثر موثوقية، حيث يمكن لمصدر واحد تأكيد ما يكتشفه الآخر. على سبيل المثال، قد يسجل جهاز يمكن ارتداؤه حركة بينما تتحقق الكاميرا من الوضعية، وهو إعداد يستخدم غالبًا في اكتشاف السقوط لرعاية المسنين.

دور مجموعات البيانات في التعرف على النشاط البشري

بالنسبة إلى أي نموذج أو نظام HAR، فإن مجموعات البيانات هي نقطة البداية. مجموعة بيانات HAR هي عبارة عن مجموعة من الأمثلة، مثل مقاطع الفيديو أو الصور أو بيانات المستشعر، التي تلتقط إجراءات مثل المشي أو الجلوس أو التلويح. تُستخدم هذه الأمثلة لتدريب نماذج الذكاء الاصطناعي للتعرف على الأنماط في حركة الإنسان، والتي يمكن تطبيقها بعد ذلك في تطبيقات الحياة الواقعية. 

تؤثر جودة بيانات التدريب بشكل مباشر على مدى جودة أداء النموذج. البيانات النظيفة والمتسقة تسهل على النظام التعرف على الإجراءات بدقة. 

هذا هو السبب في أن مجموعات البيانات غالبًا ما تتم معالجتها مسبقًا قبل التدريب. إحدى الخطوات الشائعة هي التسوية، التي تعمل على توسيع القيم باستمرار لتقليل الأخطاء ومنع التجاوز (عندما يكون أداء النموذج جيدًا على بيانات التدريب ولكنه يواجه صعوبة مع البيانات الجديدة).

لقياس كيفية أداء النماذج خارج نطاق التدريب، يعتمد الباحثون على مقاييس التقييم ومجموعات البيانات المعيارية التي تسمح بإجراء اختبار ومقارنة عادلة. تتضمن المجموعات الشائعة مثل UCF101 و HMDB51 و Kinetics آلاف مقاطع الفيديو المصنفة لاكتشاف حركة الإنسان. على جانب المستشعر، توفر مجموعات البيانات التي يتم جمعها من الهواتف الذكية والأجهزة القابلة للارتداء إشارات حركة قيمة تجعل نماذج التعرف أكثر قوة عبر البيئات المختلفة.

الشكل 2. لمحة عن مجموعة بيانات التعرف على النشاط البشري. (المصدر)

كيف تدعم رؤية الكمبيوتر التعرف على النشاط البشري؟

من بين الطرق المختلفة لاكتشاف الأفعال البشرية، سرعان ما أصبحت الرؤية الحاسوبية واحدة من أكثر الطرق شيوعًا وبحثًا على نطاق واسع. وتتمثل ميزتها الرئيسية في أنها يمكن أن تستخلص تفاصيل غنية مباشرة من الصور ومقاطع الفيديو. من خلال النظر إلى وحدات البكسل إطارًا تلو الآخر وتحليل أنماط الحركة، يمكنها التعرف على الأنشطة في الوقت الفعلي دون الحاجة إلى ارتداء الأشخاص لأجهزة إضافية.

أدى التقدم الأخير في التعلم العميق، وخاصة الشبكات العصبية التلافيفية (CNNs)، المصممة لتحليل الصور، إلى جعل رؤية الحاسوب أسرع وأكثر دقة وموثوقية. 

على سبيل المثال، تم بناء نماذج رؤية حاسوبية حديثة مستخدمة على نطاق واسع مثل Ultralytics YOLO11 على هذه التطورات. يدعم YOLO11 مهام مثل الكشف عن الكائنات وتقسيم الحالات وتتبع الأشخاص عبر إطارات الفيديو وتقدير وضعيات الإنسان، مما يجعله أداة رائعة للتعرف على النشاط البشري.

نظرة عامة على Ultralytics YOLO11

Ultralytics YOLO11 هو نموذج رؤية الذكاء الاصطناعي مصمم لكل من السرعة والدقة. وهو يدعم مهام الرؤية الحاسوبية الأساسية مثل الكشف عن الكائنات وتتبع الكائنات و تقدير الوضعية. هذه القدرات مفيدة بشكل خاص للتعرف على النشاط البشري.

يحدد اكتشاف الكائنات الأشخاص ويحدد مواقعهم في مشهد ما، ويتتبع التتبع حركاتهم عبر إطارات الفيديو للتعرف على تسلسل الإجراءات، ويقوم تقدير الوضع بتعيين المفاصل الرئيسية لجسم الإنسان للتمييز بين الأنشطة المتشابهة أو اكتشاف التغييرات المفاجئة مثل السقوط. 

على سبيل المثال، يمكن استخدام الرؤى المستقاة من النموذج للتمييز بين شخص يجلس بهدوء، ثم يقف، ثم يرفع ذراعيه أخيرًا للتشجيع. قد تبدو هذه الإجراءات اليومية البسيطة متشابهة للوهلة الأولى، ولكنها تحمل معاني مختلفة جدًا عند تحليلها في تسلسل.

الشكل 3. استخدام Ultralytics YOLO11 لتقدير الوضعية. (المصدر)

تطبيقات واقعية لرؤية الحاسوب والتعرف على النشاط البشري (HAR)

بعد ذلك، دعنا نلقي نظرة فاحصة على كيفية تطبيق التعرف على النشاط البشري المدعوم بالرؤية الحاسوبية في حالات الاستخدام الواقعية التي تؤثر على حياتنا اليومية.

الرعاية الصحية والرفاهية

في مجال الرعاية الصحية، يمكن للتغيرات الطفيفة في الحركة أن تقدم رؤى مفيدة حول حالة الشخص. على سبيل المثال، قد يكشف تعثر مريض مسن أو زاوية أحد الأطراف أثناء إعادة التأهيل عن مخاطر أو تقدم. غالبًا ما يكون من السهل تفويت هذه العلامات بالوسائل التقليدية، مثل الفحوصات. 

يمكن أن يساعد YOLO11 باستخدام تقدير الوضعية وتحليل الصور لمراقبة المرضى في الوقت الفعلي. يمكن استخدامه للكشف عن السقوط، وتتبع تمارين التعافي، ومراقبة الأنشطة اليومية مثل المشي أو التمدد. نظرًا لأنه يعمل من خلال التحليل المرئي دون الحاجة إلى أجهزة استشعار أو أجهزة يمكن ارتداؤها، فإنه يوفر طريقة بسيطة لجمع معلومات دقيقة تدعم رعاية المرضى.

الشكل 4. تتبع حركات الجسم باستخدام دعم YOLO11 لتقدير الوضع. (المصدر)

الأمن والمراقبة

تعتمد أنظمة الأمان على اكتشاف الأنشطة البشرية غير العادية بسرعة، مثل شخص يتسكع أو يركض في منطقة محظورة أو يظهر عدوانًا مفاجئًا. غالبًا ما يتم تفويت هذه العلامات في البيئات المزدحمة حيث لا يستطيع حراس الأمن مشاهدة كل شيء يدويًا. هذا هو المكان الذي تظهر فيه الرؤية الحاسوبية و YOLO11. 

يسهل YOLO11 مراقبة الأمان من خلال تشغيل المراقبة بالفيديو في الوقت الفعلي التي يمكنها اكتشاف الحركات المشبوهة وإرسال تنبيهات فورية. وهو يدعم سلامة الحشود في الأماكن العامة ويعزز اكتشاف التسلل في المناطق الخاصة. 

باستخدام هذا النهج، يمكن لحراس الأمن العمل جنبًا إلى جنب مع أنظمة رؤية الحاسوب، مما يخلق تفاعلًا وشراكة بين الإنسان والحاسوب تتيح استجابات أسرع وفي الوقت المناسب للأنشطة المشبوهة.

إيجابيات وسلبيات استخدام رؤية الكمبيوتر لـ HAR

فيما يلي بعض مزايا استخدام رؤية الكمبيوتر للتعرف على النشاط البشري:

  • قابلية التوسع: بمجرد الإعداد، يمكن لنظام التعرف نفسه مراقبة العديد من الأشخاص في وقت واحد تلقائيًا، مما يجعله مفيدًا للأتمتة في مرافق الرعاية الصحية والمصانع والأماكن العامة.
  • المعالجة في الوقت الفعلي: يمكن استخدام حلول رؤية الذكاء الاصطناعي لتحليل تدفقات الفيديو فور حدوثها، مما يتيح استجابات أسرع.
  • تتبع غير جراحي: على عكس الأجهزة القابلة للارتداء أو المستشعرات، فإنه لا يتطلب من الأشخاص حمل أجهزة، مما يسمح بتحليل السلوك الطبيعي والسهل. 

في حين أن هناك العديد من الفوائد لاستخدام الرؤية الحاسوبية لـ HAR، إلا أن هناك أيضًا قيودًا يجب مراعاتها. فيما يلي بعض العوامل التي يجب وضعها في الاعتبار:  

  • مخاوف الخصوصية: يمكن أن تثير المراقبة القائمة على الفيديو مشكلات تتعلق بحماية البيانات والموافقة، خاصة في البيئات الحساسة مثل المنازل أو أماكن العمل.
  • التحيز المحتمل: إذا كانت مجموعات بيانات التدريب تفتقر إلى التنوع، فقد تسيء الخوارزميات تفسير الإجراءات لبعض فئات الأشخاص، مما يؤدي إلى نتائج غير عادلة أو غير دقيقة.
  • الحساسية البيئية: يمكن أن تنخفض الدقة بسبب الإضاءة السيئة أو تشويش الخلفية أو الأشخاص المختبئين جزئيًا، مما يعني أن الأنظمة يجب أن تصمم بعناية.

النقاط الرئيسية

يعمل الذكاء الاصطناعي ورؤية الحاسوب على تمكين الآلات من التعرف على الأفعال البشرية بدقة أكبر وفي الوقت الفعلي. من خلال تحليل إطارات الفيديو وأنماط الحركة، يمكن لهذه الأنظمة تحديد كل من الإيماءات اليومية والتغيرات المفاجئة. مع استمرار تحسن التكنولوجيا، يتجاوز التعرف على النشاط البشري المختبرات البحثية ويصبح أداة عملية للرعاية الصحية والأمن والتطبيقات اليومية.

استكشف المزيد حول الذكاء الاصطناعي من خلال زيارة مستودع GitHub الخاص بنا والانضمام إلى مجتمعنا. تحقق من صفحات الحلول الخاصة بنا للتعرف على الذكاء الاصطناعي في الروبوتات و رؤية الحاسوب في التصنيع. اكتشف خيارات الترخيص الخاصة بنا لتبدأ مع Vision AI.

لنبنِ مستقبل
الذكاء الاصطناعي معًا!

ابدأ رحلتك مع مستقبل تعلم الآلة

ابدأ مجانًا
تم نسخ الرابط إلى الحافظة