استعدوا لـ YOLO Vision 2025!
25 سبتمبر، 2025
10:00 — 18:00 بتوقيت بريطانيا الصيفي
حدث هجين
مؤتمر Yolo Vision 2024

تحسين تقدير النقاط المفتاحية لليد باستخدام Ultralytics YOLO11

أبيرامي فينا

6 دقائق قراءة

5 مارس، 2025

استكشف تقدير النقاط المفتاحية لليد المدعوم بالذكاء الاصطناعي مع دعم Ultralytics YOLO11 لتقدير الوضعية في تطبيقات مثل التعرف على الإيماءات في الوقت الفعلي.

في الآونة الأخيرة، اكتسب مترجمو لغة الإشارة في Super Bowl الكثير من الاهتمام. عندما تشاهدهم يغنون أغنية الفنان المفضل لديك على شاشة التلفزيون، يمكنك فهمهم إذا كنت تعرف لغة الإشارة لأن دماغك يعالج حركات أيديهم. ولكن ماذا لو كان بإمكان جهاز الكمبيوتر فعل الشيء نفسه؟ بفضل حلول تتبع اليد المدعومة بالذكاء الاصطناعي، أصبح من الممكن للآلات تتبع حركات اليد وتفسيرها بدقة مذهلة.

في صميم هذه الحلول يكمن رؤية الكمبيوتر، وهو حقل فرعي من الذكاء الاصطناعي يمكّن الآلات من معالجة المعلومات المرئية وفهمها. من خلال تحليل الصور ومقاطع الفيديو، تساعد رؤية الذكاء الاصطناعي هذه الآلات على اكتشاف الكائنات وتتبع الحركات والتعرف على الإيماءات المعقدة بدقة ملحوظة.

على سبيل المثال، يمكن تدريب نماذج رؤية الكمبيوتر مثل Ultralytics YOLO11 لاكتشاف وتحليل النقاط المفتاحية لليد في الوقت الفعلي باستخدام تقدير الوضعية. من خلال القيام بذلك، يمكن استخدام هذه النماذج لتطبيقات مثل التعرف على الإيماءات وترجمة لغة الإشارة وتفاعلات الواقع المعزز / الواقع الافتراضي. 

في هذه المقالة، سوف نستكشف كيف يمكّن YOLO11 تتبع اليد بالاعتماد على الذكاء الاصطناعي، ومجموعات البيانات المستخدمة للتدريب، وكيفية تدريب مخصص لنموذج لتقدير وضع اليد. وسنلقي نظرة أيضًا على التطبيقات الواقعية. هيا بنا نبدأ!

فهم الكشف عن النقاط الرئيسية لليد بالاعتماد على الذكاء الاصطناعي

يمكن استخدام الذكاء الاصطناعي للتعرف على حركات اليد وتتبعها في البيانات المرئية عن طريق تحديد النقاط الرئيسية مثل الرسغ وأطراف الأصابع ومفاصل الأصابع. أحد الأساليب، المعروف باسم تقدير الوضع، يساعد أجهزة الكمبيوتر على فهم الحركة البشرية عن طريق رسم خرائط للنقاط الرئيسية وتحليل كيفية تغيرها بمرور الوقت. يتيح ذلك لأنظمة الذكاء الاصطناعي تفسير وضع الجسم والإيماءات وأنماط الحركة بدقة عالية.

تُجري نماذج رؤية الكمبيوتر ذلك عن طريق تحليل الصور أو مقاطع الفيديو لتحديد النقاط الرئيسية على اليد وتتبع حركتها. بمجرد تعيين هذه النقاط، يمكن للذكاء الاصطناعي التعرف على الإيماءات عن طريق تحليل العلاقات المكانية بين النقاط الرئيسية وكيفية تغيرها بمرور الوقت. 

على سبيل المثال، إذا انخفضت المسافة بين الإبهام والسبابة، يمكن للذكاء الاصطناعي تفسير ذلك على أنه حركة قرص. وبالمثل، يساعد تتبع كيفية تحرك النقاط الرئيسية في التسلسل على تحديد إيماءات اليد المعقدة وحتى التنبؤ بالحركات المستقبلية.

__wf_reserved_inherit
الشكل 1. مثال على التعرف على النقاط الرئيسية في اليد باستخدام رؤية الكمبيوتر.

ومن المثير للاهتمام أن تقدير الوضع لتتبع اليد قد فتح إمكانيات مثيرة، بدءًا من التحكم بدون استخدام اليدين في الأجهزة الذكية وحتى تحسين الدقة الروبوتية والمساعدة في تطبيقات الرعاية الصحية. مع استمرار تطور الذكاء الاصطناعي ورؤية الكمبيوتر، من المحتمل أن يلعب تتبع اليد دورًا أكبر في جعل التكنولوجيا أكثر تفاعلية وسهولة الوصول إليها وبديهية في الحياة اليومية.

استكشاف YOLO11 لتقدير الوضع

قبل أن نتعمق في كيفية إنشاء حل لتتبع اليد بالاعتماد على الذكاء الاصطناعي، دعنا نلقي نظرة فاحصة على تقدير الوضع وكيف يدعم YOLO11 مهمة رؤية الكمبيوتر هذه. على عكس الكشف القياسي عن الكائنات، الذي يحدد الكائنات بأكملها، يركز تقدير الوضع على اكتشاف المعالم الرئيسية - مثل المفاصل أو الأطراف أو الحواف - لتحليل الحركة والوضع. 

على وجه التحديد، تم تصميم Ultralytics YOLO11 لتقدير الوضع في الوقت الفعلي. من خلال الاستفادة من كل من الأساليب التصاعدية والتنازلية، فإنه يكتشف الأشخاص ويقدر النقاط الرئيسية بكفاءة في خطوة واحدة، متفوقًا على النماذج السابقة في السرعة والدقة.

بشكلٍ جاهز للاستخدام، يأتي YOLO11 مدربًا مسبقًا على مجموعة بيانات COCO-Pose ويمكنه التعرف على النقاط الرئيسية في جسم الإنسان، بما في ذلك الرأس والكتفين والمرفقين والمعصمين والوركين والركبتين والكاحلين. 

__wf_reserved_inherit
الشكل 2. استخدام YOLO11 لتقدير وضع الإنسان.

بالإضافة إلى تقدير وضع الإنسان، يمكن تدريب YOLO11 بشكل مخصص لاكتشاف النقاط الرئيسية في مجموعة متنوعة من الكائنات، سواء كانت حية أو غير حية. هذه المرونة تجعل YOLO11 خيارًا رائعًا لمجموعة واسعة من التطبيقات.

نظرة عامة على مجموعة بيانات النقاط الرئيسية لليد

الخطوة الأولى في التدريب المخصص للنموذج هي جمع البيانات وتصنيفها أو العثور على مجموعة بيانات موجودة تناسب احتياجات المشروع. على سبيل المثال، تُعد مجموعة بيانات النقاط الرئيسية لليد نقطة انطلاق جيدة لتدريب نماذج رؤية الذكاء الاصطناعي لتتبع اليد وتقدير الوضع. مع 26,768 صورة مصنفة، فإنها تلغي الحاجة إلى التصنيف اليدوي. 

يمكن استخدامه لتدريب نماذج مثل Ultralytics YOLO11 لتعلم كيفية اكتشاف وتتبع حركات اليد بسرعة. تتضمن مجموعة البيانات 21 نقطة رئيسية لكل يد، تغطي الرسغ والأصابع والمفاصل. أيضًا، تم إنشاء تصنيفات مجموعة البيانات باستخدام Google MediaPipe، وهي أداة لتطوير حلول مدعومة بالذكاء الاصطناعي لمعالجة الوسائط في الوقت الفعلي، مما يضمن اكتشافًا دقيقًا وموثوقًا للنقاط الرئيسية. 

__wf_reserved_inherit
الشكل 3. النقاط الرئيسية الـ 21 المضمنة في مجموعة بيانات النقاط الرئيسية لليد.

يؤدي استخدام مجموعة بيانات منظمة مثل هذه إلى توفير الوقت ويتيح للمطورين التركيز على تدريب نماذجهم وضبطها بدلاً من جمع البيانات وتصنيفها. في الواقع، تم بالفعل تقسيم مجموعة البيانات إلى مجموعات فرعية للتدريب (18,776 صورة) والتحقق (7,992 صورة)، مما يسهل تقييم أداء النموذج. 

كيفية تدريب YOLO11 لتقدير وضع اليد

يعد تدريب YOLO11 لتقدير وضع اليد عملية مباشرة، خاصة مع حزمة Ultralytics Python، مما يجعل إعداد النموذج وتدريبه أسهل. نظرًا لأن مجموعة بيانات النقاط الرئيسية لليد مدعومة بالفعل في مسار التدريب، فيمكن استخدامها على الفور دون تنسيق إضافي، مما يوفر الوقت والجهد.

إليك كيفية عمل عملية التدريب:

  • إعداد البيئة: الخطوة الأولى هي تثبيت حزمة Ultralytics Python.
  • تحميل مجموعة بيانات النقاط الرئيسية لليد: يدعم YOLO11 مجموعة البيانات هذه أصلاً، لذلك يمكن تنزيلها وإعدادها تلقائيًا.
  • استخدام نموذج مُدرَّب مسبقًا: يمكنك البدء بنموذج تقدير وضع YOLO11 مُدرَّب مسبقًا، مما يساعد على تحسين الدقة وتسريع عملية التدريب.
  • تدريب النموذج: يتعلم النموذج اكتشاف وتتبع النقاط الرئيسية لليد من خلال المرور بدورات تدريب متعددة.
  • مراقبة الأداء: توفر حزمة Ultralytics أيضًا أدوات مدمجة لتتبع المقاييس الرئيسية مثل الدقة والخسارة، مما يساعد على ضمان تحسن النموذج بمرور الوقت.
  • الحفظ والنشر: بمجرد التدريب، يمكن تصدير النموذج واستخدامه لتطبيقات تتبع اليد في الوقت الفعلي.

تقييم النموذج الذي تم تدريبه خصيصًا

عند المرور بخطوات إنشاء نموذج مخصص، ستلاحظ أن مراقبة الأداء أمر ضروري. بالإضافة إلى تتبع التقدم المحرز أثناء التدريب، يعد تقييم النموذج بعد ذلك أمرًا بالغ الأهمية للتأكد من أنه يكتشف ويتتبع نقاط مفاتيح اليد بدقة. 

تساعد مقاييس الأداء الرئيسية مثل الدقة وقيم الخسارة ومتوسط الدقة (mAP) في تقييم مدى جودة أداء النموذج. توفر حزمة Ultralytics Python أدوات مدمجة لتصور النتائج ومقارنة التنبؤات بالتعليقات التوضيحية الحقيقية، مما يسهل تحديد مجالات التحسين.

لفهم أداء النموذج بشكل أفضل، يمكنك التحقق من رسوم بيانية للتقييم مثل منحنيات الخسارة ورسوم بيانية للدقة والاسترجاع ومصفوفات الالتباس، والتي يتم إنشاؤها تلقائيًا في سجلات التدريب. 

تساعد هذه الرسوم البيانية في تحديد مشكلات مثل التجاوز (عندما يحفظ النموذج بيانات التدريب ولكنه يواجه صعوبة في التعامل مع البيانات الجديدة) أو النقص (عندما يفشل النموذج في تعلم الأنماط بشكل جيد بما يكفي لتحقيق أداء دقيق) وتوجيه التعديلات لتحسين الدقة. أيضًا، يعد اختبار النموذج على صور أو مقاطع فيديو جديدة أمرًا مهمًا لمعرفة مدى جودة عمله في سيناريوهات العالم الحقيقي.

تطبيقات حلول تتبع اليد المدعومة بالذكاء الاصطناعي

بعد ذلك، لنتناول بعضًا من أهم تطبيقات تقدير النقاط الرئيسية لليد باستخدام Ultralytics YOLO11.

التعرف على الإيماءات في الوقت الفعلي باستخدام YOLO11

لنفترض أنه يمكنك ضبط مستوى الصوت في التلفزيون الخاص بك ببساطة عن طريق التلويح بيدك أو التنقل في نظام المنزل الذكي بتمريرة بسيطة في الهواء. التعرف على الإيماءات في الوقت الفعلي المدعوم من YOLO11 يجعل هذه التفاعلات بدون لمس ممكنة عن طريق الكشف بدقة عن حركات اليد في الوقت الفعلي. 

يعمل هذا باستخدام كاميرات الذكاء الاصطناعي لتتبع النقاط الرئيسية في يدك وتفسير الإيماءات كأوامر. تلتقط الكاميرات التي تستشعر العمق أو مستشعرات الأشعة تحت الحمراء أو حتى كاميرات الويب العادية حركات اليد، بينما يمكن لـ YOLO11 معالجة البيانات للتعرف على الإيماءات المختلفة. على سبيل المثال، يمكن لمثل هذا النظام أن يفرق بين التمرير لتغيير أغنية أو الضغط للتكبير أو الحركة الدائرية لضبط مستوى الصوت.

اكتشاف النقاط الرئيسية لليد القائم على الذكاء الاصطناعي للتعرف على لغة الإشارة

يمكن لحلول الذكاء الاصطناعي لتتبع اليد أن تدعم التواصل السلس بين الشخص الأصم وشخص لا يعرف لغة الإشارة. على سبيل المثال، يمكن استخدام الأجهزة الذكية المدمجة بالكاميرات و YOLO11 لترجمة لغة الإشارة على الفور إلى نص أو كلام. 

بفضل التطورات مثل YOLO11، أصبحت أدوات ترجمة لغة الإشارة أكثر دقة وسهولة في الوصول إليها. يؤثر هذا على تطبيقات مثل التكنولوجيا المساعدة وخدمات الترجمة الحية والمنصات التعليمية. يمكن للذكاء الاصطناعي أن يساعد في سد فجوات التواصل وتعزيز الشمولية في أماكن العمل والمدارس والأماكن العامة.

الرؤية الحاسوبية لتتبع اليد: تحسين تجارب الواقع المعزز والواقع الافتراضي

هل سبق لك أن لعبت لعبة واقع افتراضي (VR) حيث يمكنك الإمساك بالأشياء دون استخدام وحدة تحكم؟ تتبع اليد المدعوم بالرؤية الحاسوبية يجعل هذا ممكنًا من خلال السماح للمستخدمين بالتفاعل بشكل طبيعي في بيئات الواقع المعزز (AR) والواقع الافتراضي. 

__wf_reserved_inherit
الشكل 4. تتبع اليد هو جزء أساسي من تطبيقات الواقع المعزز والواقع الافتراضي.

من خلال تقدير النقاط الرئيسية لليد باستخدام نماذج مثل Ultralytics YOLO11، يتتبع الذكاء الاصطناعي الحركات في الوقت الفعلي، مما يتيح إيماءات مثل القرص والإمساك والتمرير. يعزز هذا الألعاب والتدريب الافتراضي والتعاون عن بُعد، مما يجعل التفاعلات أكثر سهولة. مع تحسن تكنولوجيا تتبع اليد، سيصبح الواقع المعزز والواقع الافتراضي أكثر غامرة وواقعية. 

النقاط الرئيسية

تقدير النقاط الرئيسية لليد باستخدام Ultralytics YOLO11 يجعل حلول تتبع اليد المدعومة بالذكاء الاصطناعي أكثر سهولة وموثوقية. من التعرف على الإيماءات في الوقت الفعلي إلى تفسير لغة الإشارة وتطبيقات الواقع المعزز/الواقع الافتراضي، تفتح الرؤية الحاسوبية إمكانيات جديدة في التفاعل بين الإنسان والحاسوب.

أيضًا، تساعد عمليات التدريب المخصص والضبط الدقيق المبسطة المطورين على بناء نماذج فعالة لمختلف الاستخدامات الواقعية. مع تطور تكنولوجيا الرؤية الحاسوبية، يمكننا أن نتوقع المزيد من الابتكارات في مجالات مثل الرعاية الصحية والروبوتات والألعاب والأمن.

تفاعل مع مجتمعنا واستكشف تطورات الذكاء الاصطناعي في مستودع GitHub الخاص بنا. اكتشف تأثير الذكاء الاصطناعي في التصنيع و الرؤية الحاسوبية في الرعاية الصحية من خلال صفحات الحلول الخاصة بنا. استكشف خطط الترخيص الخاصة بنا وابدأ رحلتك في عالم الذكاء الاصطناعي اليوم!

لنبنِ مستقبل
الذكاء الاصطناعي معًا!

ابدأ رحلتك مع مستقبل تعلم الآلة

ابدأ مجانًا
تم نسخ الرابط إلى الحافظة