اكتشف كيف يمكن استخدام OpenPose لتقدير الوضع في تطبيقات رؤية الكمبيوتر. تعرف على ميزاته وأهميته في Vision AI.

اكتشف كيف يمكن استخدام OpenPose لتقدير الوضع في تطبيقات رؤية الكمبيوتر. تعرف على ميزاته وأهميته في Vision AI.
في الوقت الحاضر، توجد الصور والكاميرات في كل مكان - مدمجة في هواتفنا ومنازلنا وحتى الأماكن العامة. نحن نعتمد عليها ليس فقط لالتقاط اللحظات، ولكن لمساعدتنا على فهم العالم من حولنا والتفاعل معه.
خلف الكواليس، رؤية الكمبيوتر، وهو حقل فرعي من الذكاء الاصطناعي (AI)، يجعل هذا ممكنًا من خلال تمكين الآلات من تفسير البيانات المرئية. فهو يسمح للأنظمة باكتشاف الأشياء والتعرف على الوجوه وتتبع الحركة، ويلعب دورًا رئيسيًا في العديد من التقنيات التي نستخدمها كل يوم.
بفضل التطورات الأخيرة في الذكاء الاصطناعي، يمكن لنماذج رؤية الحاسوب الآن تحليل واستخلاص بيانات ورؤى أكثر تعقيدًا. أحد الأمثلة على ذلك هو تقدير الوضعيات، وهي مهمة في رؤية الحاسوب تركز على فهم حركة الإنسان.
يعمل عن طريق تحديد النقاط الرئيسية على الجسم، مثل الأكتاف والمرفقين والركبتين، في الصور أو الفيديو. وهذا يجعل من الممكن تحليل كيفية تحرك الأشخاص، مما يتيح تطبيقات في تتبع اللياقة البدنية والرسوم المتحركة والرعاية الصحية والمزيد.
من بين العديد من الأدوات التي تم تطويرها لتقدير الوضعية، يبرز OpenPose باعتباره إنجازًا كبيرًا. تم إنشاؤه بواسطة باحثين في مختبر الحوسبة الإدراكية في جامعة كارنيجي ميلون، وكان أحد أوائل أنظمة المصادر المفتوحة القادرة على اكتشاف وضعيات الجسم بالكامل، بما في ذلك اليدين والقدمين والنقاط الرئيسية للوجه، لعدة أشخاص في الوقت الفعلي باستخدام كاميرا فقط (مع ما يصل إلى 135 نقطة رئيسية لكل شخص).
في هذه المقالة، سوف نستكشف OpenPose، وكيفية عمله، وأهميته كعلامة فارقة في مجال الرؤية الحاسوبية.
قبل أن يتم اعتماد الذكاء الاصطناعي على نطاق واسع، كان تتبع حركة الإنسان في مقاطع الفيديو يتضمن استخدام معدات متخصصة. في صناعات مثل الأفلام والرسوم المتحركة، غالبًا ما كان الممثلون يرتدون بدلات مزودة بعلامات عاكسة حتى تتمكن الكاميرات من التقاط حركاتهم في بيئة استوديو خاضعة للرقابة.
في حين أن تقنيات التقاط الحركة القائمة على العلامات كانت دقيقة، إلا أنها كانت أيضًا باهظة الثمن ومقتصرة على إعدادات محددة. مع تقدم الرؤية الحاسوبية، بحث الباحثون عن طرق لتتبع حركة الجسم دون استخدام علامات. استخدموا الحواف والخطوط الكنتورية والقوالب للعثور على الأشكال البشرية في الصور.
عملت هذه الأنظمة المبكرة في حالات بسيطة ومباشرة ولكنها واجهت صعوبة في سيناريوهات العالم الحقيقي. غالبًا ما كانت تعطي نتائج سيئة عندما يتحرك الأشخاص بطرق غير متوقعة أو عندما يظهر أكثر من شخص في الإطار.
في أواخر عام 2010، أحدث التعلم العميق تحولًا كبيرًا في تقدير الوضعية. يمكن تدريب نماذج رؤية الذكاء الاصطناعي على مجموعات بيانات كبيرة من وضعيات الإنسان. بدلاً من الاعتماد على الحواف والقوالب، تعلمت النماذج التعرف على مفاصل الجسم وهيكله من خلال دراسة آلاف الصور المصنفة. وقد جعل هذا تقدير الوضعية أكثر دقة ومرونة وتأثيرًا في نطاق أوسع من الإعدادات.
تم إصدار OpenPose لأول مرة في عام 2017 وهو قادر على تقدير وضعيات العديد من الأشخاص في وقت واحد في صورة واحدة. على عكس الأنظمة القديمة، لا يتطلب OpenPose بدلات أو علامات خاصة. إنه يعمل مع الكاميرات القياسية ويمكنه معالجة الصور والفيديو في الوقت الفعلي. هذه الميزات جعلت تقدير الوضعيات أكثر سهولة للمطورين والباحثين
ساعد الأساس الذي وضعه OpenPose لرؤية الكمبيوتر الآخرين على بناء Architectures أحدث لمجموعة متنوعة من التطبيقات الأخرى. تقدم اليوم نماذج رؤية الذكاء الاصطناعي مثل Ultralytics YOLO8 و Ultralytics YOLO11 التي تدعم مهام تقدير الوضع نتائج أسرع ووقت انتقال أقل.
ومع ذلك، يعد OpenPose مكانًا رائعًا للبدء إذا كنت مهتمًا بكيفية تطور تقدير الوضعية. لقد قدم أفكارًا رئيسية لا تزال العديد من الأنظمة الأحدث تعتمد عليها حتى اليوم.
الآن بعد أن أصبح لدينا فهم أفضل لأهمية OpenPose، دعونا نلقي نظرة فاحصة على ما يمكنه فعله بالفعل.
في قلب قدرات OpenPose يوجد شيء يسمى اكتشاف النقاط الرئيسية. النقاط الرئيسية هي معالم محددة على جسم الإنسان، مثل طرف الأنف ومركز الكتفين والمرفقين والمعصمين والوركين والركبتين والكاحلين. يمكن لـ OpenPose اكتشاف ما يصل إلى 135 من هذه النقاط لكل شخص، بما في ذلك المناطق التفصيلية مثل الأصابع وملامح الوجه.
عندما يتم توصيل هذه النقاط، فإنها تشكل تمثيلًا مبسطًا لجسم الإنسان - يمكنك التفكير في الأمر على أنه هيكل عظمي رقمي. لا يوضح هذا المخطط الهيكلي مكان وجود الشخص فحسب، بل يوضح أيضًا كيفية وضعه: سواء كان جالسًا أو واقفًا أو يلوح أو يبتسم أو يمشي. يمكن لأجهزة الكمبيوتر تفسير حركة الإنسان بصريًا باستخدام هذه الهياكل العظمية، تمامًا كما نفهم غريزيًا لغة جسد شخص ما.
تتبع الهيكل العظمي مفيد بشكل خاص لأنه يزيل ضوضاء الخلفية والمشتتات، مما يسمح للنظام بالتركيز فقط على وضعية الإنسان وحركته. بدلاً من تحليل كل بكسل، يركز OpenPose على النقاط الهامة التي تخبر قصة كيفية تحرك الشخص أو تفاعله.
من خلال استخراج هذه المعلومات المنظمة من الصور أو مقاطع الفيديو اليومية، يجعل OpenPose من الممكن إنشاء تطبيقات تستجيب للإيماءات، أو تراقب النشاط البدني، أو تقيم الإشارات العاطفية، أو حتى تحرك الشخصيات الرقمية.
إليك نظرة عامة حول كيفية اكتشاف OpenPose للنقاط الرئيسية في جسم الإنسان وتوصيلها من المدخلات المرئية:
كان OpenPose أحد الأدوات المتقدمة الأولى التي جعلت تقدير الوضعيات عمليًا لمجموعة متنوعة من حالات الاستخدام الواقعية. على الرغم من أنه لا يستخدم بشكل شائع في حلول رؤية الحاسوب في الوقت الفعلي اليوم، إلا أنه لعب دورًا مهمًا في تشكيل العمل المبكر في مجالات مثل الرياضة والترفيه والتعليم والسلامة.
دعونا نلقي نظرة فاحصة على كيف ساعد ذلك في تمهيد الطريق في هذه المجالات.
عندما تشاهد لعبة البيسبول، من السهل فهم ما يحدث - يمكنك على الفور التعرف على الرمية، أو التأرجح، أو القاعدة المسروقة. كبشر، نقرأ حركات الجسم بشكل حدسي ونفهمها دون بذل الكثير من الجهد. ولكن بالنسبة للآلات، فإن التعرف على هذه الإجراءات أكثر تعقيدًا. إنها تحتاج إلى معلومات دقيقة حول كيفية تحرك كل جزء من الجسم عبر الفضاء.
كان OpenPose خطوة كبيرة إلى الأمام في هذا المجال من رؤية الحاسوب. لقد كانت أداة عملية لتحليل الشكل الرياضي في مجموعة متنوعة من الإعدادات.
استخدمت العديد من المشاريع البحثية OpenPose لتحليل الحركات مثل التأرجح والقفز، وحتى تصنيف حركات البيسبول المحددة بناءً على طريقة تحرك اللاعبين. نظرًا لأنه يعمل في بيئات مفتوحة باستخدام فيديو قياسي، فقد سمح للباحثين باختبار كيف يمكن لمثل هذه الأنظمة أن تعمل في سيناريوهات التدريب أو التوجيه الواقعية.
ساعدت هذه الدراسات المبكرة في إرساء الأساس لأدوات تتبع الأداء المستخدمة الآن في التكنولوجيا الرياضية المتقدمة.
وبالمثل، استخدم الباحثون أيضًا OpenPose لاستكشاف كيف يمكن لتتبع الوضع القائم على الفيديو أن يدعم مراقبة السلامة. تم اختباره في اكتشاف السلوكيات مثل السقوط أو الإيماءات غير المتوقعة أو أنماط الحركة في الأماكن العامة.
نظرًا لأنه يعمل مع الكاميرات القياسية، فقد جعل OpenPose التجربة المبكرة أكثر سهولة في بيئات مثل المستشفيات ومراكز النقل. ساعدت هذه الدراسات في دفع تطوير نماذج أحدث تستخدم الآن في المراقبة واكتشاف السقوط وأنظمة الاستجابة للطوارئ.
إليك لمحة عن بعض المزايا التي يوفرها OpenPose:
على الرغم من أن OpenPose كانت خطوة كبيرة إلى الأمام، إلا أنها تحتوي أيضًا على قيود فنية مهمة يجب وضعها في الاعتبار. فيما يلي بعض التحديات الرئيسية المرتبطة بـ OpenPose:
لعب OpenPose دورًا مهمًا في جعل تقدير الوضعيات أكثر سهولة. وأظهر أن تتبع حركات الجسم يمكن أن يتم باستخدام كاميرا بسيطة، دون الاعتماد على بدلات أو معدات متخصصة.
لقد أرست الأساس للعديد من التطبيقات العملية في مجالات الرعاية الصحية والتعليم والترفيه والبحث. في حين أن النماذج الأحدث تقدم الآن سرعات أعلى وأداءً أخف، يظل OpenPose نقطة مرجعية أساسية لفهم كيفية تطور تقدير الوضعية.
انضم إلى مجتمعنا وقم بزيارة مستودع GitHub الخاص بنا لمعرفة المزيد حول الذكاء الاصطناعي. إذا كنت تتطلع إلى بناء حلول رؤية الحاسوب الخاصة بك، فاستكشف خيارات الترخيص لدينا. أيضًا، تحقق من كيف تحدث رؤية الحاسوب في الرعاية الصحية والذكاء الاصطناعي في مجال الخدمات اللوجستية تأثيرًا!