تعزيز تقدير النقاط الرئيسية لليد باستخدام Ultralytics YOLO11
استكشف تقدير النقاط الرئيسية لليد المدعوم بالذكاء الاصطناعي مع دعم Ultralytics YOLO11 لتقدير الوضع في تطبيقات مثل التعرف على الإيماءات في الوقت الفعلي.

في الآونة الأخيرة، حظي مترجمو لغة الإشارة في مباراة Super Bowl باهتمام كبير. عندما تشاهدهم يغنون أغنية فنانك المفضل على التلفاز، يمكنك فهمهم إذا كنت تعرف لغة الإشارة لأن عقلك يعالج حركات أيديهم. ولكن ماذا لو تمكن الكمبيوتر من فعل الشيء نفسه؟ بفضل حلول تتبع اليد القائمة على الذكاء الاصطناعي، أصبح بإمكان الآلات تتبع وتفسير حركات اليد بدقة مذهلة.
في جوهر هذه الحلول يكمن الرؤية الحاسوبية، وهو مجال فرعي من الذكاء الاصطناعي يمكّن الآلات من معالجة وفهم المعلومات المرئية. من خلال تحليل الصور ومقاطع الفيديو، تساعد رؤية الذكاء الاصطناعي الآلات على اكتشاف الأشياء، وتتبع الحركات، والتعرف على الإيماءات المعقدة بدقة ملحوظة.
على سبيل المثال، يمكن تدريب نماذج الرؤية الحاسوبية مثل Ultralytics YOLO11 لاكتشاف وتحليل النقاط الرئيسية لليد في الوقت الفعلي باستخدام تقدير الوضعية (pose estimation). من خلال القيام بذلك، يمكن استخدام هذه النماذج في تطبيقات مثل التعرف على الإيماءات، وترجمة لغة الإشارة، وتفاعلات الواقع المعزز/الافتراضي (AR/VR).
في هذه المقالة، سوف نستكشف كيف يُمكّن YOLO11 تتبع اليد المستند إلى الذكاء الاصطناعي، ومجموعات البيانات المستخدمة للتدريب، وكيفية التدريب المخصص لنموذج تقدير وضعية اليد. سنلقي نظرة أيضاً على تطبيقات العالم الحقيقي. لنبدأ!
Link to this sectionفهم الكشف عن النقاط الرئيسية لليد باستخدام الذكاء الاصطناعي#
يمكن استخدام الذكاء الاصطناعي للتعرف على حركات اليد وتتبعها في البيانات المرئية من خلال تحديد النقاط الرئيسية مثل المعصم، وأطراف الأصابع، ومفاصل الأصابع. أحد الأساليب، المعروف باسم تقدير الوضعية، يساعد أجهزة الكمبيوتر على فهم حركة الإنسان من خلال تعيين النقاط الرئيسية وتحليل كيفية تغيرها بمرور الوقت. يسمح هذا لأنظمة الذكاء الاصطناعي بتفسير وضعية الجسم، والإيماءات، وأنماط الحركة بدقة عالية.
تجعل نماذج الرؤية الحاسوبية هذا ممكناً عن طريق تحليل الصور أو مقاطع الفيديو لتحديد النقاط الرئيسية على اليد وتتبع حركتها. بمجرد تعيين هذه النقاط، يمكن للذكاء الاصطناعي التعرف على الإيماءات من خلال تحليل العلاقات المكانية بين النقاط الرئيسية وكيفية تغيرها بمرور الوقت.
على سبيل المثال، إذا انخفضت المسافة بين الإبهام والسبابة، يمكن للذكاء الاصطناعي تفسير ذلك كحركة قرص. وبالمثل، يساعد تتبع كيفية تحرك النقاط الرئيسية في تسلسلات على تحديد إيماءات اليد المعقدة وحتى التنبؤ بالحركات المستقبلية.

الشكل 1. مثال على التعرف على النقاط الرئيسية في اليد باستخدام الرؤية الحاسوبية.
من المثير للاهتمام أن تقدير الوضعية لتتبع اليد قد فتح إمكانيات مثيرة، بدءاً من التحكم بدون استخدام اليدين في الأجهزة الذكية وصولاً إلى تحسين الدقة الروبوتية والمساعدة في تطبيقات الرعاية الصحية. مع استمرار تطور الذكاء الاصطناعي والرؤية الحاسوبية، من المرجح أن يلعب تتبع اليد دوراً أكبر في جعل التكنولوجيا أكثر تفاعلية، وسهولة في الوصول، وبديهية في الحياة اليومية.
Link to this sectionاستكشاف YOLO11 لتقدير الوضعية#
قبل أن نتعمق في كيفية إنشاء حل لتتبع اليد القائم على الذكاء الاصطناعي، دعونا نلقي نظرة فاحصة على تقدير الوضعية وكيف يدعم YOLO11 هذه مهمة الرؤية الحاسوبية. على عكس اكتشاف الكائنات القياسي، الذي يحدد الكائنات بأكملها، يركز تقدير الوضعية على اكتشاف المعالم الرئيسية - مثل المفاصل، أو الأطراف، أو الحواف - لتحليل الحركة والوضعية.
على وجه التحديد، تم تصميم Ultralytics YOLO11 لتقدير الوضعية في الوقت الفعلي. من خلال الاستفادة من كل من الأساليب من أعلى إلى أسفل ومن أسفل إلى أعلى، فإنه يكتشف الأشخاص ويقدر النقاط الرئيسية بكفاءة في خطوة واحدة، متفوقاً على النماذج السابقة في السرعة والدقة.
يأتي YOLO11 جاهزاً ومدرباً مسبقاً على مجموعة بيانات COCO-Pose ويمكنه التعرف على النقاط الرئيسية على جسم الإنسان، بما في ذلك الرأس، والكتفين، والمرفقين، والمعصمين، والوركين، والركبتين، والكاحلين.

الشكل 2. استخدام YOLO11 لتقدير وضعية الإنسان.
بالإضافة إلى تقدير وضعية الإنسان، يمكن تدريب YOLO11 بشكل مخصص لاكتشاف النقاط الرئيسية على مجموعة متنوعة من الكائنات، سواء كانت حية أو غير حية. تجعل هذه المرونة من YOLO11 خياراً رائعاً لمجموعة واسعة من التطبيقات.
Link to this sectionنظرة عامة على مجموعة بيانات النقاط الرئيسية لليد (Hand Keypoints)#
الخطوة الأولى في التدريب المخصص للنموذج هي جمع البيانات وتصنيفها أو العثور على مجموعة بيانات موجودة تناسب احتياجات المشروع. على سبيل المثال، تعد مجموعة بيانات Hand Keypoints نقطة انطلاق جيدة لتدريب نماذج رؤية الذكاء الاصطناعي لتتبع اليد وتقدير الوضعية. مع وجود 26,768 صورة مشروحة، فإنها تلغي الحاجة إلى التصنيف اليدوي.
يمكن استخدامها لتدريب نماذج مثل Ultralytics YOLO11 للتعلم بسرعة كيفية اكتشاف وتتبع حركات اليد. تتضمن مجموعة البيانات 21 نقطة رئيسية لكل يد، تغطي المعصم، والأصابع، والمفاصل. أيضاً، تم إنشاء تعليقات مجموعة البيانات باستخدام Google MediaPipe، وهي أداة لتطوير الحلول القائمة على الذكاء الاصطناعي لمعالجة الوسائط في الوقت الفعلي، مما يضمن كشفاً دقيقاً وموثوقاً للنقاط الرئيسية.

الشكل 3. النقاط الـ 21 الرئيسية المضمنة في مجموعة بيانات Hand Keypoints.
يوفر استخدام مجموعة بيانات منظمة كهذه الوقت ويسمح للمطورين بالتركيز على تدريب نماذجهم وضبطها بدلاً من جمع البيانات وتصنيفها. في الواقع، مجموعة البيانات مقسمة بالفعل إلى مجموعات فرعية للتدريب (18,776 صورة) والتحقق (7,992 صورة)، مما يسهل تقييم أداء النموذج.
Link to this sectionكيفية تدريب YOLO11 لتقدير وضعية اليد#
يعتبر تدريب YOLO11 لتقدير وضعية اليد عملية مباشرة، خاصة مع حزمة Ultralytics Python، التي تجعل إعداد النموذج وتدريبه أسهل. نظراً لأن مجموعة بيانات Hand Keypoints مدعومة بالفعل في خط أنابيب التدريب، فيمكن استخدامها على الفور دون تنسيق إضافي، مما يوفر الوقت والجهد.
إليك كيفية عمل عملية التدريب:
- إعداد البيئة: الخطوة الأولى هي تثبيت حزمة Ultralytics Python.
- تحميل مجموعة بيانات Hand Keypoints: يدعم YOLO11 مجموعة البيانات هذه بشكل أصلي، لذا يمكن تنزيلها وتجهيزها تلقائياً.
- استخدام نموذج مدرب مسبقاً: يمكنك البدء بنموذج تقدير وضعية YOLO11 مدرب مسبقاً، مما يساعد على تحسين الدقة وتسريع عملية التدريب.
- تدريب النموذج: يتعلم النموذج اكتشاف وتتبع النقاط الرئيسية لليد من خلال المرور بدورات تدريبية متعددة.
- مراقبة الأداء: توفر حزمة Ultralytics أيضاً أدوات مدمجة لتتبع المقاييس الرئيسية مثل الدقة والخسارة، مما يساعد على ضمان تحسن النموذج بمرور الوقت.
- الحفظ والنشر: بمجرد التدريب، يمكن تصدير النموذج واستخدامه في تطبيقات تتبع اليد في الوقت الفعلي.
Link to this sectionتقييم نموذجك المدرب مخصصاً#
من خلال خطوات إنشاء نموذج مخصص، ستلاحظ أن مراقبة الأداء ضرورية. بالإضافة إلى تتبع التقدم أثناء التدريب، يعد تقييم النموذج بعد ذلك أمراً بالغ الأهمية للتأكد من أنه يكتشف ويتبع النقاط الرئيسية لليد بدقة.
تساعد مقاييس الأداء الرئيسية مثل الدقة، وقيم الخسارة، ومتوسط دقة الدقة (mAP) في تقييم مدى جودة أداء النموذج. توفر حزمة Ultralytics Python أدوات مدمجة لتصور النتائج ومقارنة التوقعات بالتعليقات التوضيحية الحقيقية، مما يسهل تحديد مجالات التحسين.
لفهم أداء النموذج بشكل أفضل، يمكنك التحقق من رسوم التقييم البيانية مثل منحنيات الخسارة، ورسوم الدقة والاستدعاء، ومصفوفات الارتباك، والتي يتم إنشاؤها تلقائياً في سجلات التدريب.
تساعد هذه الرسوم البيانية في تحديد مشكلات مثل الإفراط في التجهيز (عندما يحفظ النموذج بيانات التدريب ولكنه يواجه صعوبة مع بيانات جديدة) أو نقص التجهيز (عندما يفشل النموذج في تعلم الأنماط جيداً بما يكفي لأداء بدقة) وتوجيه التعديلات لتحسين الدقة. أيضاً، يعد اختبار النموذج على صور أو مقاطع فيديو جديدة أمراً مهماً لمعرفة مدى جودة عمله في سيناريوهات العالم الحقيقي.
Link to this sectionتطبيقات حلول تتبع اليد القائمة على الذكاء الاصطناعي#
بعد ذلك، دعونا نمر عبر بعض أكثر التطبيقات تأثيراً لـ تقدير النقاط الرئيسية لليد باستخدام Ultralytics YOLO11.
Link to this sectionالتعرف على الإيماءات في الوقت الفعلي باستخدام YOLO11#
لنفترض أنه يمكنك ضبط مستوى الصوت على تلفازك بمجرد التلويح بيدك أو التنقل في نظام المنزل الذكي بتمريرة بسيطة في الهواء. يجعل التعرف على الإيماءات في الوقت الفعلي المدعوم بـ YOLO11 هذه التفاعلات بدون لمس ممكنة من خلال اكتشاف حركات اليد بدقة في الوقت الفعلي.
يعمل هذا باستخدام كاميرات الذكاء الاصطناعي لتتبع النقاط الرئيسية على يدك وتفسير الإيماءات كأوامر. تلتقط كاميرات استشعار العمق، أو مستشعرات الأشعة تحت الحمراء، أو حتى كاميرات الويب العادية حركات اليد، بينما يمكن لـ YOLO11 معالجة البيانات للتعرف على إيماءات مختلفة. على سبيل المثال، يمكن لنظام كهذا التمييز بين تمريرة لتغيير أغنية، أو قرصة للتكبير، أو حركة دائرية لضبط مستوى الصوت.
Link to this sectionالكشف عن النقاط الرئيسية لليد باستخدام الذكاء الاصطناعي للتعرف على لغة الإشارة#
يمكن لحلول الذكاء الاصطناعي لتتبع اليد دعم التواصل السلس بين شخص أصم وشخص لا يعرف لغة الإشارة. على سبيل المثال، يمكن استخدام الأجهزة الذكية المدمجة بكاميرات وYOLO11 لترجمة لغة الإشارة فورياً إلى نص أو صوت.
بفضل التطورات مثل YOLO11، أصبحت أدوات ترجمة لغة الإشارة أكثر دقة وسهولة في الوصول إليها. يؤثر هذا على تطبيقات مثل التكنولوجيا المساعدة، وخدمات الترجمة الحية، والمنصات التعليمية. يمكن للذكاء الاصطناعي المساعدة في سد فجوات التواصل وتعزيز الشمولية في أماكن العمل، والمدارس، والأماكن العامة.
Link to this sectionالرؤية الحاسوبية لتتبع اليد: تحسين تجارب الواقع المعزز والواقع الافتراضي#
هل سبق لك لعب لعبة واقع افتراضي (VR) حيث يمكنك التقاط الأشياء دون استخدام وحدة تحكم؟ يجعل تتبع اليد المدعوم بالرؤية الحاسوبية هذا ممكناً من خلال السماح للمستخدمين بالتفاعل بشكل طبيعي في بيئات الواقع المعزز (AR) والواقع الافتراضي.

الشكل 4. يعد تتبع اليد جزءاً رئيسياً من تطبيقات الواقع المعزز والواقع الافتراضي.
مع تقدير النقاط الرئيسية لليد باستخدام نماذج مثل Ultralytics YOLO11، يتتبع الذكاء الاصطناعي الحركات في الوقت الفعلي، مما يتيح إيماءات مثل القرص، والالتقاط، والتمرير. هذا يعزز الألعاب، والتدريب الافتراضي، والتعاون عن بُعد، مما يجعل التفاعلات أكثر بديهية. مع تحسن تكنولوجيا تتبع اليد، ستصبح تجارب الواقع المعزز والواقع الافتراضي أكثر انغماساً وواقعية.
Link to this sectionأبرز النقاط#
يجعل تقدير النقاط الرئيسية لليد باستخدام Ultralytics YOLO11 حلول تتبع اليد القائمة على الذكاء الاصطناعي أكثر سهولة وموثوقية. من التعرف على الإيماءات في الوقت الفعلي إلى ترجمة لغة الإشارة وتطبيقات الواقع المعزز والواقع الافتراضي، تفتح الرؤية الحاسوبية إمكانيات جديدة في التفاعل بين الإنسان والكمبيوتر.
أيضاً، تساعد عمليات التدريب المخصص والضبط المبسطة المطورين على بناء نماذج فعالة لمختلف استخدامات العالم الحقيقي. مع تطور تكنولوجيا الرؤية الحاسوبية، يمكننا توقع المزيد من الابتكارات في مجالات مثل الرعاية الصحية، والروبوتات، والألعاب، والأمن.
تفاعل مع مجتمعنا واستكشف تطورات الذكاء الاصطناعي على مستودع GitHub الخاص بنا. اكتشف تأثير الذكاء الاصطناعي في التصنيع والرؤية الحاسوبية في الرعاية الصحية من خلال صفحات الحلول الخاصة بنا. استكشف خطط الترخيص الخاصة بنا وابدأ رحلتك في الذكاء الاصطناعي اليوم!






