اكتشف كيفية استخدام OpenPose لتقدير الوضعيات في تطبيقات الرؤية الحاسوبية. تعرّف على ميزاته وأهميته في Vision AI.

اكتشف كيفية استخدام OpenPose لتقدير الوضعيات في تطبيقات الرؤية الحاسوبية. تعرّف على ميزاته وأهميته في Vision AI.
في أيامنا هذه، أصبحت الصور والكاميرات في كل مكان، مدمجة في هواتفنا ومنازلنا وحتى في الأماكن العامة. نعتمد عليها ليس فقط لالتقاط اللحظات، بل لمساعدتنا على فهم العالم من حولنا والتفاعل معه.
خلف الكواليس، تُمكّن الرؤية الحاسوبية ، وهي مجال فرعي من الذكاء الاصطناعي، من تحقيق ذلك من خلال تمكين الآلات من تفسير البيانات المرئية. فهي تُمكّن الأنظمة من اكتشاف الأشياء والتعرف على الوجوه وتتبع الحركة، مما يلعب دورًا أساسيًا في العديد من التقنيات التي نستخدمها يوميًا.
بفضل التطورات الحديثة في الذكاء الاصطناعي، أصبحت نماذج الرؤية الحاسوبية قادرة على تحليل واستخراج بيانات ورؤى أكثر تعقيدًا. ومن الأمثلة على ذلك تقدير الوضعية ، وهي مهمة رؤية حاسوبية تركز على فهم حركة الإنسان.
يعمل هذا النظام من خلال تحديد نقاط رئيسية في الجسم، مثل الكتفين والمرفقين والركبتين، في الصور أو مقاطع الفيديو. يتيح هذا تحليل حركة الأشخاص، مما يتيح تطبيقات في تتبع اللياقة البدنية والرسوم المتحركة والرعاية الصحية وغيرها.
من بين الأدوات العديدة المُطوّرة لتقدير الوضعيات، يبرز OpenPose كإنجازٍ كبير. طوّره باحثون في مختبر الحوسبة الإدراكية بجامعة كارنيجي ميلون، وكان من أوائل الأنظمة مفتوحة المصدر القادرة على رصد وضعيات الجسم الكاملة، بما في ذلك اليدين والقدمين ونقاط الوجه الرئيسية، لعدة أشخاص في الوقت الفعلي باستخدام كاميرا واحدة فقط (مع ما يصل إلى 135 نقطة رئيسية لكل شخص).
في هذه المقالة، سنستكشف OpenPose، وكيف يعمل، وأهميته كمعلم بارز في مجال الرؤية الحاسوبية.
قبل انتشار الذكاء الاصطناعي على نطاق واسع، كان تتبّع حركة الإنسان في الفيديوهات يتطلب استخدام معدات متخصصة. في صناعات مثل السينما والرسوم المتحركة ، غالبًا ما كان الممثلون يرتدون بدلات بعلامات عاكسة لتتمكن الكاميرات من التقاط حركاتهم في بيئة استوديو مُتحكّم بها.
على الرغم من دقة تقنيات التقاط الحركة القائمة على العلامات، إلا أنها كانت مكلفة ومحدودة بإعدادات محددة. مع تطور الرؤية الحاسوبية، بحث الباحثون عن طرق لتتبع حركة الجسم دون استخدام العلامات. استخدموا الحواف والخطوط والقوالب للعثور على الأشكال البشرية في الصور.
عملت هذه الأنظمة المبكرة في حالات بسيطة ومباشرة، لكنها واجهت صعوبات في التعامل مع سيناريوهات واقعية. وكثيرًا ما كانت تُعطي نتائج ضعيفة عند تحرك الأشخاص بطرق غير متوقعة أو عند ظهور أكثر من شخص واحد في إطار واحد.
في أواخر العقد الأول من القرن الحادي والعشرين، أحدث التعلم العميق نقلة نوعية في تقدير الوضعيات. إذ أصبح من الممكن تدريب نماذج الذكاء الاصطناعي البصري على مجموعات بيانات ضخمة من وضعيات الجسم البشري. وبدلاً من الاعتماد على الحواف والقوالب، تعلمت النماذج التعرف على مفاصل الجسم وبنيته من خلال دراسة آلاف الصور المُصنّفة. وقد جعل هذا تقدير الوضعيات أكثر دقة ومرونة وتأثيرًا في نطاق أوسع من البيئات.
أُطلق OpenPose لأول مرة عام ٢٠١٧، وهو قادر على تقدير وضعيات عدة أشخاص في آنٍ واحد في صورة واحدة. على عكس الأنظمة القديمة، لا يتطلب OpenPose بدلات أو علامات خاصة. يعمل مع الكاميرات القياسية، ويمكنه معالجة الصور والفيديوهات آنيًا. هذه الميزات جعلت تقدير الوضعيات أسهل للمطورين والباحثين.
ساعد الأساس الذي أرساه OpenPose للرؤية الحاسوبية الآخرين على بناء هياكل أحدث لتطبيقات أخرى متنوعة. واليوم، تُقدم نماذج Vision AI، مثل Ultralytics YOLO8 و Ultralytics YOLO11 التي تدعم مهام تقدير الوضعية، نتائج أسرع وزمن وصول أقل.
مع ذلك، يُعد OpenPose نقطة انطلاق رائعة إذا كنت مهتمًا بمعرفة كيفية تطور تقدير الوضعية. فقد طرح أفكارًا أساسية لا تزال العديد من الأنظمة الحديثة تعتمد عليها حتى اليوم.
الآن بعد أن أصبح لدينا فهم أفضل لأهمية OpenPose، دعونا نلقي نظرة عن كثب على ما يمكنه فعله بالفعل.
يعتمد نظام OpenPose على ميزة تُسمى اكتشاف النقاط الرئيسية . النقاط الرئيسية هي معالم محددة على جسم الإنسان، مثل طرف الأنف، ومنتصف الكتفين، والمرفقين، والمعصمين، والوركين، والركبتين، والكاحلين. يستطيع OpenPose اكتشاف ما يصل إلى 135 نقطة لكل شخص، بما في ذلك مناطق مفصلة مثل الأصابع وملامح الوجه.
عند توصيل هذه النقاط، تُشكّل تمثيلًا مُبسّطًا لجسم الإنسان - يُمكن تشبيهه بهيكل عظمي رقمي. لا يُظهر هذا الهيكل العظمي مكان الشخص فحسب، بل يُظهر أيضًا وضعيته: سواءً كان جالسًا، أو واقفًا، أو يُلوّح، أو يبتسم، أو يمشي. تستطيع الحواسيب تفسير حركة الإنسان بصريًا باستخدام هذه الهياكل العظمية، تمامًا كما نفهم غريزيًا لغة جسد شخص ما.
يُعدّ تتبع الهيكل العظمي مفيدًا بشكل خاص لأنه يزيل ضوضاء الخلفية والمشتتات، مما يتيح للنظام التركيز فقط على وضعية الإنسان وحركته. فبدلاً من تحليل كل بكسل، يُركز OpenPose على نقاط مهمة تُبيّن كيفية حركة الشخص أو تفاعله.
ومن خلال استخراج هذه المعلومات المنظمة من الصور أو مقاطع الفيديو اليومية، يجعل OpenPose من الممكن إنشاء تطبيقات تستجيب للإيماءات، أو تراقب النشاط البدني، أو تقيم الإشارات العاطفية، أو حتى تحريك الشخصيات الرقمية.
فيما يلي نظرة عامة حول كيفية اكتشاف OpenPose لنقاط رئيسية على جسم الإنسان وتوصيلها من المدخلات المرئية:
كان OpenPose من أوائل الأدوات المتقدمة التي جعلت تقدير الوضعية عمليًا في العديد من حالات الاستخدام الواقعية. ورغم أنه لا يُستخدم بشكل شائع في حلول الرؤية الحاسوبية في الوقت الفعلي اليوم، إلا أنه لعب دورًا هامًا في صياغة الأعمال المبكرة في مجالات مثل الرياضة والترفيه والتعليم والسلامة.
دعونا نلقي نظرة عن كثب على كيفية مساعدتها في تمهيد الطريق في هذه المجالات.
عندما تشاهد البيسبول، يسهل عليك فهم ما يحدث - يمكنك فورًا تمييز رمية أو ضربة أو قاعدة مسروقة. كبشر، نقرأ حركات الجسم بشكل حدسي ونفهمها دون عناء كبير. أما بالنسبة للآلات، فإن تمييز هذه الحركات أكثر تعقيدًا بكثير. فهي تحتاج إلى معلومات دقيقة حول كيفية حركة كل جزء من الجسم في الفراغ.
كان OpenPose خطوةً مهمةً في مجال الرؤية الحاسوبية. فقد كان أداةً عمليةً لتحليل اللياقة البدنية في بيئات متنوعة.
استخدمت العديد من مشاريع البحث نظام OpenPose لتحليل حركات مثل التأرجح والقفز، بل وتصنيف حركات بيسبول محددة بناءً على حركة اللاعبين. ولأنه يعمل في بيئات مفتوحة مع فيديو قياسي، فقد سمح للباحثين باختبار كيفية عمل هذه الأنظمة في سيناريوهات التدريب أو التدريب الواقعية.
ساعدت هذه الدراسات المبكرة في إرساء الأساس لأدوات تتبع الأداء المستخدمة الآن في تكنولوجيا الرياضة المتقدمة.
وبالمثل، استخدم الباحثون أيضًا OpenPose لاستكشاف كيفية دعم تتبع الوضعيات بالفيديو لمراقبة السلامة. وقد تم اختباره في الكشف عن سلوكيات مثل السقوط، والإيماءات غير المتوقعة، أو أنماط الحركة في الأماكن العامة.
بفضل توافقه مع الكاميرات القياسية، سهّل OpenPose إجراء التجارب المبكرة في بيئات مثل المستشفيات ومراكز النقل. ساهمت هذه الدراسات في تطوير نماذج أحدث تُستخدم الآن في أنظمة المراقبة، وكشف السقوط، والاستجابة للطوارئ.
فيما يلي لمحة عن بعض المزايا التي يقدمها OpenPose:
على الرغم من أن OpenPose كان خطوةً كبيرةً للأمام، إلا أنه يعاني أيضًا من قيود تقنية يجب مراعاتها. فيما يلي بعض التحديات الرئيسية المرتبطة بـ OpenPose:
لعب OpenPose دورًا هامًا في تسهيل تقدير الوضعيات. فقد أظهر إمكانية تتبع حركات الجسم باستخدام كاميرا بسيطة، دون الاعتماد على بدلات أو معدات متخصصة.
لقد أرسى هذا النظام الأساس للعديد من التطبيقات العملية في مجالات الرعاية الصحية والتعليم والترفيه والبحث العلمي. وبينما توفر الطُرز الأحدث الآن سرعات أعلى وأداءً أخف، يظل OpenPose مرجعًا رئيسيًا لفهم كيفية تطور تقدير الوضعية.
انضم إلى مجتمعنا وتفضل بزيارة مستودع GitHub الخاص بنا لمعرفة المزيد عن الذكاء الاصطناعي. إذا كنت ترغب في بناء حلول رؤية حاسوبية خاصة بك، فاستكشف خيارات الترخيص لدينا. تعرّف أيضًا على تأثير رؤية الحاسوب في الرعاية الصحية والذكاء الاصطناعي في الخدمات اللوجستية !