ما هو OpenPose؟ أسس تقدير الوضعية Ultralytics

في الوقت الحاضر، توجد الصور والكاميرات في كل مكان - مدمجة في هواتفنا ومنازلنا وحتى الأماكن العامة. نحن نعتمد عليها ليس فقط لالتقاط اللحظات، ولكن لمساعدتنا على فهم العالم من حولنا والتفاعل معه.

وخلف الكواليس، تجعل الرؤية الحاسوبية، وهي مجال فرعي للذكاء الاصطناعي (AI)، ذلك ممكناً من خلال تمكين الآلات من تفسير البيانات المرئية. فهو يسمح للأنظمة detect الأجسام والتعرف على الوجوه track الحركة، ويلعب دوراً رئيسياً في العديد من التقنيات التي نستخدمها كل يوم.

بفضل التطورات الأخيرة في الذكاء الاصطناعي، يمكن لنماذج رؤية الحاسوب الآن تحليل واستخلاص بيانات ورؤى أكثر تعقيدًا. أحد الأمثلة على ذلك هو تقدير الوضعيات، وهي مهمة في رؤية الحاسوب تركز على فهم حركة الإنسان.

يعمل عن طريق تحديد النقاط الرئيسية على الجسم، مثل الأكتاف والمرفقين والركبتين، في الصور أو الفيديو. وهذا يجعل من الممكن تحليل كيفية تحرك الأشخاص، مما يتيح تطبيقات في تتبع اللياقة البدنية والرسوم المتحركة والرعاية الصحية والمزيد.

من بين العديد من الأدوات التي تم تطويرها لتقدير الوضعية، يبرز OpenPose باعتباره إنجازًا كبيرًا. تم إنشاؤه بواسطة باحثين في مختبر الحوسبة الإدراكية في جامعة كارنيجي ميلون، وكان أحد أوائل أنظمة المصادر المفتوحة القادرة على اكتشاف وضعيات الجسم بالكامل، بما في ذلك اليدين والقدمين والنقاط الرئيسية للوجه، لعدة أشخاص في الوقت الفعلي باستخدام كاميرا فقط (مع ما يصل إلى 135 نقطة رئيسية لكل شخص).

في هذه المقالة، سوف نستكشف OpenPose، وكيفية عمله، وأهميته كعلامة فارقة في مجال الرؤية الحاسوبية.

الشكل 1. تقدير وضعية العديد من الأشخاص باستخدام OpenPose.

‍

نظرة على تاريخ تقدير الوضعية

قبل أن يتم اعتماد الذكاء الاصطناعي على نطاق واسع، كان تتبع حركة الإنسان في مقاطع الفيديو يتضمن استخدام معدات متخصصة. في صناعات مثل الأفلام والرسوم المتحركة، غالبًا ما كان الممثلون يرتدون بدلات مزودة بعلامات عاكسة حتى تتمكن الكاميرات من التقاط حركاتهم في بيئة استوديو خاضعة للرقابة.

في حين أن تقنيات التقاط الحركة القائمة على العلامات كانت دقيقة، إلا أنها كانت مكلفة ومحدودة بإعدادات محددة. مع تقدم الرؤية الحاسوبية، بحث الباحثون عن طرق track حركة الجسم دون استخدام العلامات. استخدموا الحواف والخطوط والقوالب للعثور على الأشكال البشرية في الصور.

عملت هذه الأنظمة المبكرة في حالات بسيطة ومباشرة ولكنها واجهت صعوبة في سيناريوهات العالم الحقيقي. غالبًا ما كانت تعطي نتائج سيئة عندما يتحرك الأشخاص بطرق غير متوقعة أو عندما يظهر أكثر من شخص في الإطار.

في أواخر عام 2010، أحدث التعلم العميق تحولًا كبيرًا في تقدير الوضعية. يمكن تدريب نماذج رؤية الذكاء الاصطناعي على مجموعات بيانات كبيرة من وضعيات الإنسان. بدلاً من الاعتماد على الحواف والقوالب، تعلمت النماذج التعرف على مفاصل الجسم وهيكله من خلال دراسة آلاف الصور المصنفة. وقد جعل هذا تقدير الوضعية أكثر دقة ومرونة وتأثيرًا في نطاق أوسع من الإعدادات.

الشكل 2. تطور نماذج تقدير وضعية الإنسان من عام 2017 إلى عام 2023.

‍

OpenPose: من حيث انطلق تقدير الوضعيات الحديث

تم إصدار OpenPose لأول مرة في عام 2017 وهو قادر على تقدير وضعيات العديد من الأشخاص في وقت واحد في صورة واحدة. على عكس الأنظمة القديمة، لا يتطلب OpenPose بدلات أو علامات خاصة. إنه يعمل مع الكاميرات القياسية ويمكنه معالجة الصور والفيديو في الوقت الفعلي. هذه الميزات جعلت تقدير الوضعيات أكثر سهولة للمطورين والباحثين

ساعد الأساس الذي وضعته OpenPose للرؤية الحاسوبية الآخرين على بناء بنى أحدث لمجموعة متنوعة من التطبيقات الأخرى. اليوم، نماذج الذكاء الاصطناعي للرؤية مثل Ultralytics YOLO8 و Ultralytics YOLO11 التي تدعم مهام تقدير الوضعية تقدم نتائج أسرع ووقت استجابة أقل.

‍

ومع ذلك، يعد OpenPose مكانًا رائعًا للبدء إذا كنت مهتمًا بكيفية تطور تقدير الوضعية. لقد قدم أفكارًا رئيسية لا تزال العديد من الأنظمة الأحدث تعتمد عليها حتى اليوم.

القدرات الرئيسية لـ OpenPose

الآن بعد أن أصبح لدينا فهم أفضل لأهمية OpenPose، دعونا نلقي نظرة فاحصة على ما يمكنه فعله بالفعل.

يقع في قلب قدرات OpenPose شيء يسمى اكتشاف النقاط الرئيسية. النقاط الرئيسية هي معالم محددة على جسم الإنسان، مثل طرف الأنف ومنتصف الكتفين والمرفقين والمعصمين والوركين والركبتين والكاحلين. يمكن ل OpenPose detect ما يصل إلى 135 نقطة من هذه النقاط لكل شخص، بما في ذلك المناطق التفصيلية مثل الأصابع وملامح الوجه.

عندما يتم توصيل هذه النقاط، فإنها تشكل تمثيلًا مبسطًا لجسم الإنسان - يمكنك التفكير في الأمر على أنه هيكل عظمي رقمي. لا يوضح هذا المخطط الهيكلي مكان وجود الشخص فحسب، بل يوضح أيضًا كيفية وضعه: سواء كان جالسًا أو واقفًا أو يلوح أو يبتسم أو يمشي. يمكن لأجهزة الكمبيوتر تفسير حركة الإنسان بصريًا باستخدام هذه الهياكل العظمية، تمامًا كما نفهم غريزيًا لغة جسد شخص ما.

تتبع الهيكل العظمي مفيد بشكل خاص لأنه يزيل ضوضاء الخلفية والمشتتات، مما يسمح للنظام بالتركيز فقط على وضعية الإنسان وحركته. بدلاً من تحليل كل بكسل، يركز OpenPose على النقاط الهامة التي تخبر قصة كيفية تحرك الشخص أو تفاعله.

من خلال استخراج هذه المعلومات المنظمة من الصور أو مقاطع الفيديو اليومية، يجعل OpenPose من الممكن إنشاء تطبيقات تستجيب للإيماءات، أو تراقب النشاط البدني، أو تقيم الإشارات العاطفية، أو حتى تحرك الشخصيات الرقمية.

كيف يعمل OpenPose؟

إليك نظرة عامة حول كيفية اكتشاف OpenPose للنقاط الرئيسية في جسم الإنسان وتوصيلها من المدخلات المرئية:

تبدأ بصورة: يأخذ OpenPose صورة واحدة من صورة أو مقطع فيديو أو كاميرا بث مباشر.
‍
تحديد الأجزاء المهمة من الجسم: يبحث النظام عن نقاط رئيسية في الجسم، مثل الأنف والمرفقين والمعصمين والركبتين والكاحلين. يتم وضع علامة عليها أينما كان النظام واثقًا من وجود جزء من الجسم.
‍
يكتشف الأجزاء التي تتناسب معًا: بعد ذلك، يتحقق OpenPose من كيفية توصيل النقاط الرئيسية. يستخدم العمليات الحسابية الرياضية لتحديد المفاصل التي تنتمي إلى نفس الشخص - على سبيل المثال، مطابقة المعصم بالكوع والكتف الأيمن.
‍
يرسم هيكلًا عظميًا لكل شخص: بعد تجميع النقاط الرئيسية، يربط OpenPose هذه النقاط في "شكل عصا" يوضح وضعية كل شخص. يعمل هذا حتى عندما يظهر عدة أشخاص في نفس الإطار.
‍
إرجاع بيانات الوضعية: وأخيرًا، فإنه يوفر المواضع الدقيقة لجميع النقاط الرئيسية المكتشفة. يمكن استخدام هذه البيانات لتتبع الحركة أو التعرف على الإيماءات أو بناء أدوات تفاعلية - كل ذلك في الوقت الفعلي.

الشكل 4. الكشف عن النقاط الرئيسية في جسم الإنسان وتتبعها باستخدام OpenPose.

‍

تطبيقات تقدير الوضعية في مختلف الصناعات باستخدام OpenPose

كان OpenPose أحد الأدوات المتقدمة الأولى التي جعلت تقدير الوضعيات عمليًا لمجموعة متنوعة من حالات الاستخدام الواقعية. على الرغم من أنه لا يستخدم بشكل شائع في حلول رؤية الحاسوب في الوقت الفعلي اليوم، إلا أنه لعب دورًا مهمًا في تشكيل العمل المبكر في مجالات مثل الرياضة والترفيه والتعليم والسلامة.

دعونا نلقي نظرة فاحصة على كيف ساعد ذلك في تمهيد الطريق في هذه المجالات.

تقدير الوضعية باستخدام OpenPose للياقة البدنية والرياضة

عندما تشاهد لعبة البيسبول، من السهل فهم ما يحدث - يمكنك على الفور التعرف على الرمية، أو التأرجح، أو القاعدة المسروقة. كبشر، نقرأ حركات الجسم بشكل حدسي ونفهمها دون بذل الكثير من الجهد. ولكن بالنسبة للآلات، فإن التعرف على هذه الإجراءات أكثر تعقيدًا. إنها تحتاج إلى معلومات دقيقة حول كيفية تحرك كل جزء من الجسم عبر الفضاء.

كان OpenPose خطوة كبيرة إلى الأمام في هذا المجال من رؤية الحاسوب. لقد كانت أداة عملية لتحليل الشكل الرياضي في مجموعة متنوعة من الإعدادات.

استخدمت العديد من المشاريع البحثية OpenPose لتحليل الحركات مثل التأرجح والقفز، وحتى تصنيف حركات البيسبول المحددة بناءً على طريقة تحرك اللاعبين. نظرًا لأنه يعمل في بيئات مفتوحة باستخدام فيديو قياسي، فقد سمح للباحثين باختبار كيف يمكن لمثل هذه الأنظمة أن تعمل في سيناريوهات التدريب أو التوجيه الواقعية.

ساعدت هذه الدراسات المبكرة في إرساء الأساس لأدوات تتبع الأداء المستخدمة الآن في التكنولوجيا الرياضية المتقدمة.

الشكل 5. نظرة على خط سير عمل لتصنيف حركة البيسبول باستخدام OpenPose.

‍

استخدام OpenPose في أنظمة الأمن والسلامة

وبالمثل، استخدم الباحثون أيضًا OpenPose لاستكشاف كيف يمكن لتتبع الوضع القائم على الفيديو أن يدعم مراقبة السلامة. تم اختباره في اكتشاف السلوكيات مثل السقوط أو الإيماءات غير المتوقعة أو أنماط الحركة في الأماكن العامة.

نظرًا لأنه يعمل مع الكاميرات القياسية، فقد جعل OpenPose التجربة المبكرة أكثر سهولة في بيئات مثل المستشفيات ومراكز النقل. ساعدت هذه الدراسات في دفع تطوير نماذج أحدث تستخدم الآن في المراقبة واكتشاف السقوط وأنظمة الاستجابة للطوارئ.

الشكل 6. الكشف عن السقوط باستخدام OpenPose.

‍

إيجابيات وسلبيات OpenPose

إليك لمحة عن بعض المزايا التي يوفرها OpenPose:

مفيد للبحث والنماذج الأولية: لقد تم استخدامه على نطاق واسع في البحث الأكاديمي، وخاصة في مجالات مثل التفاعل بين الإنسان والحاسوب، والميكانيكا الحيوية، وتحليل السلوك.
‍
دعم عبر الأنظمة الأساسية: يمكن تشغيله على أنظمة Windows و Linux و macOS، مع دعم كل من وحدات المعالجة المركزية (CPUs) و وحدات معالجة الرسومات (GPUs).
‍
إمكانية المعالجة دون اتصال بالإنترنت: يمكن تشغيله في بيئات بدون الوصول إلى الإنترنت، مما يجعله مثاليًا للإعدادات الحساسة للخصوصية مثل الرعاية الصحية أو التعليم.

على الرغم من أن OpenPose كانت خطوة كبيرة إلى الأمام، إلا أنها تحتوي أيضًا على قيود فنية مهمة يجب وضعها في الاعتبار. فيما يلي بعض التحديات الرئيسية المرتبطة بـ OpenPose:

متطلبات معالجة عالية: يتطلب تشغيل OpenPose في الوقت الفعلي GPU قوية وموارد حوسبة كبيرة.
‍
حساس للبيئة: قد ينخفض الأداء في الإضاءة المنخفضة أو الأماكن المزدحمة أو عندما لا تكون زوايا الكاميرا مثالية.
‍
ثقيل مقارنة بالنماذج الأحدث: بالمقارنة مع نماذج تقدير الوضعية الأحدث، فإن OpenPose كبير وبطيء نسبيًا. إنه غير مناسب تمامًا للنشر على الأجهزة محدودة الموارد مثل الهواتف الذكية أو الأجهزة اللوحية أو الأنظمة المدمجة.

النقاط الرئيسية

لعب OpenPose دورًا مهمًا في جعل تقدير الوضعيات أكثر سهولة. وأظهر أن تتبع حركات الجسم يمكن أن يتم باستخدام كاميرا بسيطة، دون الاعتماد على بدلات أو معدات متخصصة.

لقد أرست الأساس للعديد من التطبيقات العملية في مجالات الرعاية الصحية والتعليم والترفيه والبحث. في حين أن النماذج الأحدث تقدم الآن سرعات أعلى وأداءً أخف، يظل OpenPose نقطة مرجعية أساسية لفهم كيفية تطور تقدير الوضعية.

انضم إلى مجتمعنا وقم بزيارة مستودع GitHub الخاص بنا لمعرفة المزيد حول الذكاء الاصطناعي. إذا كنت تتطلع إلى بناء حلول رؤية الحاسوب الخاصة بك، فاستكشف خيارات الترخيص لدينا. أيضًا، تحقق من كيف تحدث رؤية الحاسوب في الرعاية الصحية والذكاء الاصطناعي في مجال الخدمات اللوجستية تأثيرًا!

ما هو OpenPose؟ استكشاف معلم بارز في تقدير الوضعية

نظرة على تاريخ تقدير الوضعية

OpenPose: من حيث انطلق تقدير الوضعيات الحديث

القدرات الرئيسية لـ OpenPose

كيف يعمل OpenPose؟

تطبيقات تقدير الوضعية في مختلف الصناعات باستخدام OpenPose

تقدير الوضعية باستخدام OpenPose للياقة البدنية والرياضة

استخدام OpenPose في أنظمة الأمن والسلامة

إيجابيات وسلبيات OpenPose

النقاط الرئيسية

اقرأ المزيد في هذه الفئة

ما هو تقدير العمق الأحادي العين؟ نظرة عامة

ما هو حساب الصور؟ مقدمة سريعة

ما هو مطابقة القوالب؟ دليل سريع

لنبنِ مستقبل
الذكاء الاصطناعي معًا!

ما هو OpenPose؟ استكشاف معلم بارز في تقدير الوضعية

نظرة على تاريخ تقدير الوضعية

OpenPose: من حيث انطلق تقدير الوضعيات الحديث

القدرات الرئيسية لـ OpenPose

كيف يعمل OpenPose؟

تطبيقات تقدير الوضعية في مختلف الصناعات باستخدام OpenPose

تقدير الوضعية باستخدام OpenPose للياقة البدنية والرياضة

استخدام OpenPose في أنظمة الأمن والسلامة

إيجابيات وسلبيات OpenPose

النقاط الرئيسية

اقرأ المزيد في هذه الفئة

ما هو تقدير العمق الأحادي العين؟ نظرة عامة

ما هو حساب الصور؟ مقدمة سريعة

ما هو مطابقة القوالب؟ دليل سريع

لنبنِ مستقبل الذكاء الاصطناعي معًا!

لنبنِ مستقبل
الذكاء الاصطناعي معًا!