ما هو OpenPose؟ استكشاف علامة فارقة في تقدير الوضعية
استكشف كيف يمكن استخدام OpenPose لتقدير الوضعية في تطبيقات الرؤية الحاسوبية. تعرف على ميزاته وأهميته في الذكاء الاصطناعي البصري.

في الوقت الحاضر، أصبحت الصور والكاميرات موجودة في كل مكان - مدمجة في هواتفنا، ومنازلنا، وحتى الأماكن العامة. نحن لا نعتمد عليها فقط لالتقاط اللحظات، بل لمساعدتنا على فهم العالم من حولنا والتفاعل معه.
خلف الكواليس، يجعل الرؤية الحاسوبية، وهو مجال فرعي من الذكاء الاصطناعي (AI)، هذا ممكنًا من خلال تمكين الآلات من تفسير البيانات المرئية. فهي تسمح للأنظمة باكتشاف الكائنات، والتعرف على الوجوه، وتتبع الحركة، مما يلعب دورًا رئيسيًا في العديد من التقنيات التي نستخدمها كل يوم.
بفضل التطورات الأخيرة في الذكاء الاصطناعي، يمكن لنماذج الرؤية الحاسوبية الآن تحليل واستخراج المزيد من البيانات والرؤى المعقدة. أحد الأمثلة على ذلك هو تقدير الوضعية، وهي مهمة رؤية حاسوبية تركز على فهم حركة الإنسان.
تعمل هذه التقنية عن طريق تحديد نقاط رئيسية على الجسم، مثل الكتفين، والمرفقين، والركبتين، في الصور أو الفيديو. وهذا يجعل من الممكن تحليل كيفية تحرك الأشخاص، مما يتيح تطبيقات في تتبع اللياقة البدنية، والرسوم المتحركة، والرعاية الصحية، والمزيد.
من بين العديد من الأدوات التي تم تطويرها لتقدير الوضعية، يبرز OpenPose كاختراق رئيسي. تم إنشاؤه بواسطة باحثين في مختبر الحوسبة الإدراكية في جامعة كارنيجي ميلون، وكان أحد أول الأنظمة مفتوحة المصدر القادرة على اكتشاف وضعيات الجسم بالكامل، بما في ذلك اليدين، والقدمين، والنقاط الرئيسية للوجه، لأشخاص متعددين في الوقت الفعلي باستخدام كاميرا فقط (مع ما يصل إلى 135 نقطة رئيسية لكل شخص).
في هذه المقالة، سنستكشف OpenPose، وكيف يعمل، وأهميته كعلامة فارقة في الرؤية الحاسوبية.

Fig 1. تقدير وضعية متعدد الأشخاص باستخدام OpenPose.
Link to this sectionنظرة على تاريخ تقدير الوضعية#
قبل اعتماد الذكاء الاصطناعي على نطاق واسع، كان تتبع حركة الإنسان في مقاطع الفيديو يتضمن استخدام معدات متخصصة. في صناعات مثل الأفلام والرسوم المتحركة، كان الممثلون يرتدون غالبًا بدلات ذات علامات عاكسة حتى تتمكن الكاميرات من التقاط حركاتهم في بيئة استوديو خاضعة للرقابة.
بينما كانت تقنيات التقاط الحركة المعتمدة على العلامات هذه دقيقة، إلا أنها كانت أيضًا باهظة الثمن ومحدودة بإعدادات معينة. مع تقدم الرؤية الحاسوبية، بحث الباحثون عن طرق لتتبع حركة الجسم دون استخدام علامات. استخدموا الحواف، والخطوط العريضة، والقوالب للعثور على أشكال البشر في الصور.
عملت هذه الأنظمة المبكرة في حالات بسيطة ومباشرة ولكنها عانت في سيناريوهات العالم الحقيقي. غالبًا ما قدمت نتائج ضعيفة عندما تحرك الأشخاص بطرق غير متوقعة أو عندما ظهر أكثر من شخص في الإطار.
في أواخر العقد الأول من القرن الحادي والعشرين، أحدث التعلم العميق تحولًا كبيرًا في تقدير الوضعية. يمكن تدريب نماذج الذكاء الاصطناعي المرئي على مجموعات بيانات كبيرة من وضعيات الإنسان. بدلاً من الاعتماد على الحواف والقوالب، تعلمت النماذج التعرف على مفاصل الجسم وهيكله من خلال دراسة آلاف الصور المصنفة. جعل هذا تقدير الوضعية أكثر دقة ومرونة وتأثيرًا في مجموعة أوسع من الإعدادات.

Fig 2. تطور نماذج تقدير وضعية الإنسان من 2017 إلى 2023.
Link to this sectionOpenPose: حيث انطلق تقدير الوضعية الحديث#
تم إصدار OpenPose لأول مرة في عام 2017 وهو قادر على تقدير وضعيات أشخاص متعددين في وقت واحد في صورة واحدة. على عكس الأنظمة الأقدم، لا يتطلب OpenPose بدلات أو علامات خاصة. إنه يعمل مع الكاميرات القياسية ويمكنه معالجة الصور والفيديو في الوقت الفعلي. جعلت هذه الميزات تقدير الوضعية أكثر سهولة للمطورين والباحثين.
الأساس الذي وضعه OpenPose للرؤية الحاسوبية ساعد الآخرين على بناء بنيات أحدث لمجموعة متنوعة من التطبيقات الأخرى. اليوم، نماذج الذكاء الاصطناعي المرئي مثل Ultralytics YOLOv8 و Ultralytics YOLO11 التي تدعم مهام تقدير الوضعية تقدم نتائج أسرع وزمن انتقال أقل.

Fig 3. استخدام YOLO11 لتقدير الوضعية.
ومع ذلك، يعد OpenPose مكانًا رائعًا للبدء إذا كنت مهتمًا بكيفية تطور تقدير الوضعية. لقد قدم أفكارًا رئيسية لا تزال العديد من الأنظمة الأحدث تعتمد عليها اليوم.
Link to this sectionقدرات OpenPose الرئيسية#
الآن بعد أن أصبح لدينا فهم أفضل لسبب أهمية OpenPose، دعونا نلقي نظرة فاحصة على ما يمكنه فعله بالفعل.
في قلب قدرات OpenPose يوجد شيء يسمى اكتشاف النقاط الرئيسية. النقاط الرئيسية هي علامات محددة على جسم الإنسان، مثل طرف الأنف، ومركز الكتفين، والمرفقين، والمعصمين، والوركين، والركبتين، والكاحلين. يمكن لـ OpenPose اكتشاف ما يصل إلى 135 من هذه النقاط لكل شخص، بما في ذلك المناطق التفصيلية مثل الأصابع وميزات الوجه.
عند ربط هذه النقاط، فإنها تشكل تمثيلًا مبسطًا لجسم الإنسان - يمكنك التفكير فيه كهيكل عظمي رقمي. يظهر هذا المخطط الهيكلي ليس فقط مكان وجود الشخص، بل كيفية وضعيته: سواء كان جالسًا، أو واقفًا، أو يلوح بيده، أو يبتسم، أو يمشي. يمكن لأجهزة الكمبيوتر تفسير حركة الإنسان بصريًا باستخدام هذه الهياكل العظمية، تمامًا كما نفهم نحن غريزيًا لغة جسد شخص ما.
يعد تتبع الهيكل العظمي مفيدًا بشكل خاص لأنه يزيل ضوضاء الخلفية والتشتيت، مما يسمح للنظام بالتركيز فقط على وضعية الإنسان وحركته. بدلاً من تحليل كل بكسل، يركز OpenPose على النقاط ذات المعنى التي تحكي قصة كيفية تحرك الشخص أو تفاعله.
من خلال استخراج هذه المعلومات المنظمة من الصور أو الفيديو اليومي، يجعل OpenPose من الممكن بناء تطبيقات تستجيب للإيماءات، أو تراقب النشاط البدني، أو تقيم الإشارات العاطفية، أو حتى تحريك الشخصيات الرقمية.
Link to this sectionكيف يعمل OpenPose؟#
فيما يلي نظرة عامة على كيفية اكتشاف OpenPose للنقاط الرئيسية على جسم الإنسان وربطها من المدخلات المرئية:
- يبدأ بصورة: يأخذ OpenPose صورة واحدة من صورة فوتوغرافية، أو فيديو، أو بث كاميرا مباشر.
- يحدد أجزاء الجسم المهمة: يبحث النظام عن نقاط رئيسية على الجسم، مثل الأنف، والمرفقين، والمعصمين، والركبتين، والكاحلين. يتم وضع علامة عليها أينما كان النظام واثقًا من وجود جزء من الجسم.
- يكتشف الأجزاء التي تنتمي لبعضها: بعد ذلك، يتحقق OpenPose من كيفية ربط النقاط الرئيسية. يستخدم حسابات رياضية ليقرر أي المفاصل تنتمي لنفس الشخص - على سبيل المثال، مطابقة المعصم بالمرفق والكتف الأيمن.
- يرسم هيكلًا عظميًا لكل شخص: بعد تجميع النقاط الرئيسية، يقوم OpenPose بربطها في "شكل عصا" يظهر وضعية كل شخص. يعمل هذا حتى عندما يظهر عدة أشخاص في نفس الإطار.
- يعيد بيانات الوضعية: أخيرًا، يوفر المواقع الدقيقة لجميع النقاط الرئيسية المكتشفة. يمكن استخدامها لتتبع الحركة، أو التعرف على الإيماءات، أو بناء أدوات تفاعلية - كل ذلك في الوقت الفعلي.

Fig 4. اكتشاف وتتبع النقاط الرئيسية للإنسان باستخدام OpenPose.
Link to this sectionتطبيقات تقدير الوضعية عبر الصناعات باستخدام OpenPose#
كان OpenPose أحد أول الأدوات المتقدمة التي جعلت تقدير الوضعية عمليًا لمجموعة متنوعة من حالات الاستخدام في العالم الحقيقي. على الرغم من أنه لا يُستخدم بشكل شائع في حلول الرؤية الحاسوبية في الوقت الفعلي اليوم، فقد لعب دورًا مهمًا في تشكيل العمل المبكر عبر مجالات مثل الرياضة، والترفيه، والتعليم، والسلامة.
دعونا نلقي نظرة فاحصة على كيفية مساهمته في تمهيد الطريق في هذه المجالات.
Link to this sectionتقدير الوضعية باستخدام OpenPose للياقة البدنية والرياضة#
عندما تشاهد لعبة البيسبول، من السهل فهم ما يحدث - يمكنك التعرف فورًا على الرمية، أو الأرجوحة، أو القاعدة المسروقة. كبشر، نقرأ حركات الجسم بشكل حدسي ونفهمها دون الكثير من الجهد. ولكن بالنسبة للآلات، فإن التعرف على هذه الإجراءات أكثر تعقيدًا بكثير. فهي تحتاج إلى معلومات دقيقة حول كيفية تحرك كل جزء من الجسم عبر الفضاء.
كان OpenPose خطوة كبيرة للأمام في هذا المجال من الرؤية الحاسوبية. لقد كان أداة عملية لتحليل الأداء الرياضي في مجموعة متنوعة من الإعدادات.
استخدمت العديد من المشاريع البحثية OpenPose لتحليل حركات مثل الأرجحات والقفزات، حتى تصنيف حركات البيسبول المحددة بناءً على كيفية تحرك اللاعبين. ولأنه كان يعمل في بيئات مفتوحة باستخدام فيديو قياسي، فقد سمح للباحثين باختبار كيف يمكن لهذه الأنظمة أن تعمل في سيناريوهات التدريب أو التدريب الواقعية.
ساعدت هذه الدراسات المبكرة في وضع الأساس لأدوات تتبع الأداء المستخدمة الآن في تكنولوجيا الرياضة المتقدمة.

Fig 5. نظرة على خط تصنيف حركات البيسبول باستخدام OpenPose.
Link to this sectionاستخدام OpenPose في أنظمة الأمن والسلامة#
وبالمثل، استخدم الباحثون أيضًا OpenPose لاستكشاف كيف يمكن لتتبع الوضعية القائم على الفيديو أن يدعم مراقبة السلامة. تم اختباره في اكتشاف السلوكيات مثل السقوط، أو الإيماءات غير المتوقعة، أو أنماط الحركة في الأماكن العامة.
لأنه كان يعمل مع الكاميرات القياسية، جعل OpenPose التجارب المبكرة أكثر سهولة في بيئات مثل المستشفيات ومراكز النقل. ساعدت هذه الدراسات في دفع تطوير نماذج أحدث تستخدم الآن في المراقبة، واكتشاف السقوط، وأنظمة الاستجابة للطوارئ.

Fig 6. اكتشاف السقوط بتمكين من OpenPose.
Link to this sectionإيجابيات وسلبيات OpenPose#
إليك لمحة عن بعض المزايا التي يقدمها OpenPose:
- مفيد للبحث والنماذج الأولية: لقد تم استخدامه على نطاق واسع في البحث الأكاديمي، خاصة في مجالات مثل التفاعل بين الإنسان والحاسوب، والميكانيكا الحيوية، والتحليل السلوكي.
- دعم عبر الأنظمة الأساسية: يمكن تشغيله على Windows، وLinux، وmacOS، مع دعم لكل من وحدات المعالجة المركزية (CPUs) ووحدات معالجة الرسومات (GPUs).
- إمكانية المعالجة دون اتصال: يمكن تشغيله في بيئات بدون وصول إلى الإنترنت، مما يجعله مثاليًا للإعدادات الحساسة للخصوصية مثل الرعاية الصحية أو التعليم.
على الرغم من أن OpenPose كان خطوة كبيرة للأمام، إلا أن لديه أيضًا قيودًا فنية من المهم وضعها في الاعتبار. إليك بعض التحديات الرئيسية المرتبطة بـ OpenPose:
- متطلبات معالجة عالية: يتطلب تشغيل OpenPose في الوقت الفعلي وحدة معالجة رسومات قوية وموارد حوسبة كبيرة.
- حساس للبيئة: قد ينخفض الأداء في الإضاءة المنخفضة، أو الأماكن المزدحمة، أو عندما لا تكون زوايا الكاميرا مثالية.
- ثقيل مقارنة بالنماذج الأحدث: مقارنة بنماذج تقدير الوضعية الأحدث، يعتبر OpenPose كبيرًا وبطيئًا نسبيًا. وهو غير مناسب تمامًا للنشر على الأجهزة محدودة الموارد مثل الهواتف الذكية، أو الأجهزة اللوحية، أو الأنظمة المدمجة.
Link to this sectionأبرز النقاط#
لعب OpenPose دورًا مهمًا في جعل تقدير الوضعية أكثر سهولة. لقد أظهر أن تتبع حركات الجسم يمكن القيام به بكاميرا بسيطة، دون الاعتماد على بدلات أو معدات متخصصة.
لقد وضع الأساس للعديد من التطبيقات العملية عبر الرعاية الصحية، والتعليم، والترفيه، والبحث. بينما توفر النماذج الأحدث الآن سرعات أسرع وأداء أخف، يظل OpenPose نقطة مرجعية رئيسية لفهم كيفية تطور تقدير الوضعية.
انضم إلى مجتمعنا وقم بزيارة مستودع GitHub الخاص بنا لمعرفة المزيد عن الذكاء الاصطناعي. إذا كنت تتطلع إلى بناء حلول الرؤية الحاسوبية الخاصة بك، فاستكشف خيارات الترخيص الخاصة بنا. أيضًا، تحقق من كيفية تأثير الرؤية الحاسوبية في الرعاية الصحية والذكاء الاصطناعي في الخدمات اللوجستية!






