ما هو OpenPose؟ استكشاف إنجازٍ في تقدير الوضعيات

أبيرامي فينا

5 دقائق للقراءة

17 يونيو 2025

اكتشف كيفية استخدام OpenPose لتقدير الوضعيات في تطبيقات الرؤية الحاسوبية. تعرّف على ميزاته وأهميته في Vision AI.

في أيامنا هذه، أصبحت الصور والكاميرات في كل مكان، مدمجة في هواتفنا ومنازلنا وحتى في الأماكن العامة. نعتمد عليها ليس فقط لالتقاط اللحظات، بل لمساعدتنا على فهم العالم من حولنا والتفاعل معه. 

خلف الكواليس، تُمكّن الرؤية الحاسوبية ، وهي مجال فرعي من الذكاء الاصطناعي، من تحقيق ذلك من خلال تمكين الآلات من تفسير البيانات المرئية. فهي تُمكّن الأنظمة من اكتشاف الأشياء والتعرف على الوجوه وتتبع الحركة، مما يلعب دورًا أساسيًا في العديد من التقنيات التي نستخدمها يوميًا. 

بفضل التطورات الحديثة في الذكاء الاصطناعي، أصبحت نماذج الرؤية الحاسوبية قادرة على تحليل واستخراج بيانات ورؤى أكثر تعقيدًا. ومن الأمثلة على ذلك تقدير الوضعية ، وهي مهمة رؤية حاسوبية تركز على فهم حركة الإنسان. 

يعمل هذا النظام من خلال تحديد نقاط رئيسية في الجسم، مثل الكتفين والمرفقين والركبتين، في الصور أو مقاطع الفيديو. يتيح هذا تحليل حركة الأشخاص، مما يتيح تطبيقات في تتبع اللياقة البدنية والرسوم المتحركة والرعاية الصحية وغيرها.

من بين الأدوات العديدة المُطوّرة لتقدير الوضعيات، يبرز OpenPose كإنجازٍ كبير. طوّره باحثون في مختبر الحوسبة الإدراكية بجامعة كارنيجي ميلون، وكان من أوائل الأنظمة مفتوحة المصدر القادرة على رصد وضعيات الجسم الكاملة، بما في ذلك اليدين والقدمين ونقاط الوجه الرئيسية، لعدة أشخاص في الوقت الفعلي باستخدام كاميرا واحدة فقط (مع ما يصل إلى 135 نقطة رئيسية لكل شخص).

في هذه المقالة، سنستكشف OpenPose، وكيف يعمل، وأهميته كمعلم بارز في مجال الرؤية الحاسوبية.

الشكل 1. تقدير وضعية الأشخاص المتعددين باستخدام OpenPose.

نظرة على تاريخ تقدير الوضعية

قبل انتشار الذكاء الاصطناعي على نطاق واسع، كان تتبّع حركة الإنسان في الفيديوهات يتطلب استخدام معدات متخصصة. في صناعات مثل السينما والرسوم المتحركة ، غالبًا ما كان الممثلون يرتدون بدلات بعلامات عاكسة لتتمكن الكاميرات من التقاط حركاتهم في بيئة استوديو مُتحكّم بها. 

على الرغم من دقة تقنيات التقاط الحركة القائمة على العلامات، إلا أنها كانت مكلفة ومحدودة بإعدادات محددة. مع تطور الرؤية الحاسوبية، بحث الباحثون عن طرق لتتبع حركة الجسم دون استخدام العلامات. استخدموا الحواف والخطوط والقوالب للعثور على الأشكال البشرية في الصور.

عملت هذه الأنظمة المبكرة في حالات بسيطة ومباشرة، لكنها واجهت صعوبات في التعامل مع سيناريوهات واقعية. وكثيرًا ما كانت تُعطي نتائج ضعيفة عند تحرك الأشخاص بطرق غير متوقعة أو عند ظهور أكثر من شخص واحد في إطار واحد.

في أواخر العقد الأول من القرن الحادي والعشرين، أحدث التعلم العميق نقلة نوعية في تقدير الوضعيات. إذ أصبح من الممكن تدريب نماذج الذكاء الاصطناعي البصري على مجموعات بيانات ضخمة من وضعيات الجسم البشري. وبدلاً من الاعتماد على الحواف والقوالب، تعلمت النماذج التعرف على مفاصل الجسم وبنيته من خلال دراسة آلاف الصور المُصنّفة. وقد جعل هذا تقدير الوضعيات أكثر دقة ومرونة وتأثيرًا في نطاق أوسع من البيئات.

الشكل 2. تطور نماذج تقدير وضعية الإنسان من عام 2017 إلى عام 2023.

OpenPose: حيث انطلقت عملية تقدير الوضعية الحديثة

أُطلق OpenPose لأول مرة عام ٢٠١٧، وهو قادر على تقدير وضعيات عدة أشخاص في آنٍ واحد في صورة واحدة. على عكس الأنظمة القديمة، لا يتطلب OpenPose بدلات أو علامات خاصة. يعمل مع الكاميرات القياسية، ويمكنه معالجة الصور والفيديوهات آنيًا. هذه الميزات جعلت تقدير الوضعيات أسهل للمطورين والباحثين.

ساعد الأساس الذي أرساه OpenPose للرؤية الحاسوبية الآخرين على بناء هياكل أحدث لتطبيقات أخرى متنوعة. واليوم، تُقدم نماذج Vision AI، مثل Ultralytics YOLO8 و Ultralytics YOLO11 التي تدعم مهام تقدير الوضعية، نتائج أسرع وزمن وصول أقل. 

الشكل 3. استخدام YOLO11 لتقدير الوضع.

مع ذلك، يُعد OpenPose نقطة انطلاق رائعة إذا كنت مهتمًا بمعرفة كيفية تطور تقدير الوضعية. فقد طرح أفكارًا أساسية لا تزال العديد من الأنظمة الحديثة تعتمد عليها حتى اليوم. 

القدرات الرئيسية لـ OpenPose

الآن بعد أن أصبح لدينا فهم أفضل لأهمية OpenPose، دعونا نلقي نظرة عن كثب على ما يمكنه فعله بالفعل.

يعتمد نظام OpenPose على ميزة تُسمى اكتشاف النقاط الرئيسية . النقاط الرئيسية هي معالم محددة على جسم الإنسان، مثل طرف الأنف، ومنتصف الكتفين، والمرفقين، والمعصمين، والوركين، والركبتين، والكاحلين. يستطيع OpenPose اكتشاف ما يصل إلى 135 نقطة لكل شخص، بما في ذلك مناطق مفصلة مثل الأصابع وملامح الوجه.

عند توصيل هذه النقاط، تُشكّل تمثيلًا مُبسّطًا لجسم الإنسان - يُمكن تشبيهه بهيكل عظمي رقمي. لا يُظهر هذا الهيكل العظمي مكان الشخص فحسب، بل يُظهر أيضًا وضعيته: سواءً كان جالسًا، أو واقفًا، أو يُلوّح، أو يبتسم، أو يمشي. تستطيع الحواسيب تفسير حركة الإنسان بصريًا باستخدام هذه الهياكل العظمية، تمامًا كما نفهم غريزيًا لغة جسد شخص ما.

يُعدّ تتبع الهيكل العظمي مفيدًا بشكل خاص لأنه يزيل ضوضاء الخلفية والمشتتات، مما يتيح للنظام التركيز فقط على وضعية الإنسان وحركته. فبدلاً من تحليل كل بكسل، يُركز OpenPose على نقاط مهمة تُبيّن كيفية حركة الشخص أو تفاعله.

ومن خلال استخراج هذه المعلومات المنظمة من الصور أو مقاطع الفيديو اليومية، يجعل OpenPose من الممكن إنشاء تطبيقات تستجيب للإيماءات، أو تراقب النشاط البدني، أو تقيم الإشارات العاطفية، أو حتى تحريك الشخصيات الرقمية.

كيف يعمل OpenPose؟ 

فيما يلي نظرة عامة حول كيفية اكتشاف OpenPose لنقاط رئيسية على جسم الإنسان وتوصيلها من المدخلات المرئية:

  • يبدأ بصورة: يأخذ OpenPose صورة واحدة من صورة فوتوغرافية أو مقطع فيديو أو موجز كاميرا مباشر.
  • يحدد أجزاء الجسم المهمة: يبحث النظام عن نقاط رئيسية في الجسم، مثل الأنف، والمرفقين، والمعصمين، والركبتين، والكاحلين. ويتم تحديدها أينما يتأكد النظام من وجود جزء من الجسم.
  • يحدد الأجزاء المتصلة: بعد ذلك، يتحقق OpenPose من كيفية اتصال النقاط الرئيسية. ويستخدم حسابات رياضية لتحديد المفاصل التي تنتمي إلى الشخص نفسه - على سبيل المثال، مطابقة المعصم مع الكوع والكتف الأيمن.
  • يرسم هيكلًا لكل شخص: بعد تجميع النقاط الرئيسية، يربطها OpenPose في شكل "شكل عصا" يُظهر وضعية كل شخص. يعمل هذا حتى عند ظهور عدة أشخاص في الإطار نفسه.
  • يُرجع بيانات الوضعية: وأخيرًا، يُوفر المواضع الدقيقة لجميع النقاط الرئيسية المكتشفة. يمكن استخدام هذه البيانات لتتبع الحركة، والتعرف على الإيماءات، أو إنشاء أدوات تفاعلية - كل ذلك في الوقت الفعلي.
الشكل 4. اكتشاف النقاط الرئيسية البشرية وتتبعها باستخدام OpenPose.

تطبيقات تقدير الوضع عبر الصناعات باستخدام OpenPose 

كان OpenPose من أوائل الأدوات المتقدمة التي جعلت تقدير الوضعية عمليًا في العديد من حالات الاستخدام الواقعية. ورغم أنه لا يُستخدم بشكل شائع في حلول الرؤية الحاسوبية في الوقت الفعلي اليوم، إلا أنه لعب دورًا هامًا في صياغة الأعمال المبكرة في مجالات مثل الرياضة والترفيه والتعليم والسلامة. 

دعونا نلقي نظرة عن كثب على كيفية مساعدتها في تمهيد الطريق في هذه المجالات.

تقدير الوضعية باستخدام OpenPose للياقة البدنية والرياضة

عندما تشاهد البيسبول، يسهل عليك فهم ما يحدث - يمكنك فورًا تمييز رمية أو ضربة أو قاعدة مسروقة. كبشر، نقرأ حركات الجسم بشكل حدسي ونفهمها دون عناء كبير. أما بالنسبة للآلات، فإن تمييز هذه الحركات أكثر تعقيدًا بكثير. فهي تحتاج إلى معلومات دقيقة حول كيفية حركة كل جزء من الجسم في الفراغ.

كان OpenPose خطوةً مهمةً في مجال الرؤية الحاسوبية. فقد كان أداةً عمليةً لتحليل اللياقة البدنية في بيئات متنوعة.

استخدمت العديد من مشاريع البحث نظام OpenPose لتحليل حركات مثل التأرجح والقفز، بل وتصنيف حركات بيسبول محددة بناءً على حركة اللاعبين. ولأنه يعمل في بيئات مفتوحة مع فيديو قياسي، فقد سمح للباحثين باختبار كيفية عمل هذه الأنظمة في سيناريوهات التدريب أو التدريب الواقعية.

ساعدت هذه الدراسات المبكرة في إرساء الأساس لأدوات تتبع الأداء المستخدمة الآن في تكنولوجيا الرياضة المتقدمة.

الشكل 5. نظرة على خط أنابيب تصنيف عمل البيسبول باستخدام OpenPose.

استخدام OpenPose في أنظمة الأمن والسلامة

وبالمثل، استخدم الباحثون أيضًا OpenPose لاستكشاف كيفية دعم تتبع الوضعيات بالفيديو لمراقبة السلامة. وقد تم اختباره في الكشف عن سلوكيات مثل السقوط، والإيماءات غير المتوقعة، أو أنماط الحركة في الأماكن العامة.

بفضل توافقه مع الكاميرات القياسية، سهّل OpenPose إجراء التجارب المبكرة في بيئات مثل المستشفيات ومراكز النقل. ساهمت هذه الدراسات في تطوير نماذج أحدث تُستخدم الآن في أنظمة المراقبة، وكشف السقوط، والاستجابة للطوارئ.

الشكل 6. اكتشاف السقوط الممكّن بواسطة OpenPose.

إيجابيات وسلبيات OpenPose

فيما يلي لمحة عن بعض المزايا التي يقدمها OpenPose:

  • مفيد للأبحاث والنماذج الأولية: تم استخدامه على نطاق واسع في الأبحاث الأكاديمية، وخاصة في مجالات مثل التفاعل بين الإنسان والحاسوب، والميكانيكا الحيوية، وتحليل السلوك.
  • دعم متعدد الأنظمة الأساسية: يمكن تشغيله على أنظمة Windows وLinux وmacOS، مع دعم كل من وحدات المعالجة المركزية (CPUs) ووحدات معالجة الرسومات (GPUs) .
  • إمكانية المعالجة دون اتصال بالإنترنت : يمكن تشغيله في بيئات لا يتوفر فيها اتصال بالإنترنت، مما يجعله مثاليًا للإعدادات الحساسة للخصوصية مثل الرعاية الصحية أو التعليم.

على الرغم من أن OpenPose كان خطوةً كبيرةً للأمام، إلا أنه يعاني أيضًا من قيود تقنية يجب مراعاتها. فيما يلي بعض التحديات الرئيسية المرتبطة بـ OpenPose: 

  • متطلبات معالجة عالية: يتطلب تشغيل OpenPose في الوقت الفعلي وحدة معالجة رسومية قوية وموارد حوسبة كبيرة.
  • حساس للبيئة: قد ينخفض الأداء في ظروف الإضاءة المنخفضة، أو الأماكن المزدحمة، أو عندما لا تكون زوايا الكاميرا مثالية.
  • ثقيل مقارنةً بالنماذج الأحدث: مقارنةً بنماذج تقدير الوضعيات الأحدث، يُعد OpenPose كبيرًا نسبيًا وأبطأ. وهو غير مناسب للنشر على الأجهزة محدودة الموارد مثل الهواتف الذكية والأجهزة اللوحية والأنظمة المدمجة.

الوجبات الرئيسية

لعب OpenPose دورًا هامًا في تسهيل تقدير الوضعيات. فقد أظهر إمكانية تتبع حركات الجسم باستخدام كاميرا بسيطة، دون الاعتماد على بدلات أو معدات متخصصة.

لقد أرسى هذا النظام الأساس للعديد من التطبيقات العملية في مجالات الرعاية الصحية والتعليم والترفيه والبحث العلمي. وبينما توفر الطُرز الأحدث الآن سرعات أعلى وأداءً أخف، يظل OpenPose مرجعًا رئيسيًا لفهم كيفية تطور تقدير الوضعية. 

انضم إلى مجتمعنا وتفضل بزيارة مستودع GitHub الخاص بنا لمعرفة المزيد عن الذكاء الاصطناعي. إذا كنت ترغب في بناء حلول رؤية حاسوبية خاصة بك، فاستكشف خيارات الترخيص لدينا. تعرّف أيضًا على تأثير رؤية الحاسوب في الرعاية الصحية والذكاء الاصطناعي في الخدمات اللوجستية !

دعونا نبني المستقبل
للذكاء الاصطناعي معاً!

ابدأ رحلتك مع مستقبل التعلم الآلي

ابدأ مجاناً
تم نسخ الرابط إلى الحافظة