اكتشف النقاط الرئيسية في الرؤية الحاسوبية: تقدير الوضعية باستخدام Ultralytics YOLO11 للياقة البدنية والتعرف على الإيماءات والتتبع السريع والدقيق.
في الرؤية الحاسوبية، النقاط الرئيسية هي نقاط اهتمام محددة في الصورة تكون مميزة وقابلة للتكرار. تعمل هذه النقاط كمعالم هيكلية مدمجة تمثل كائنًا أو مشهدًا، مما يمكّن الآلات من فهم المحتوى المرئي وتحليله بمزيد من التفاصيل. فبدلاً من معالجة كل بكسل، تركز الخوارزميات على هذه النقاط الرئيسية - مثل الزوايا أو الحواف أو مفاصل جسم الإنسان - لأداء مهام معقدة مثل تتبع الحركة والتعرف على الأشياء وإعادة بناء المشاهد ثلاثية الأبعاد. من خلال التركيز على هذه النقاط المفيدة، يمكن لنماذج الرؤية الحاسوبية تحقيق كفاءة ودقة عالية.
يتمثل التطبيق الأساسي لنقاط المفتاح في تقدير الوضعية، وهي مهمة رؤية حاسوبية تركز على تحديد موضع واتجاه جسم أو شخص ما. في تقدير الوضعية البشرية، تتوافق النقاط الرئيسية مع مفاصل الجسم الرئيسية مثل الكتفين والمرفقين والركبتين والمعصمين. ومن خلال اكتشاف هذه النقاط في صورة أو مقطع فيديو، يمكن للنموذج بناء تمثيل هيكلي لجسم الإنسان. يسمح هذا "الهيكل العظمي الرقمي" لنظام الذكاء الاصطناعي بتحليل وضعية الجسم والإيماءات والحركات دون الحاجة إلى فهم مظهر الشخص أو ملابسه أو البيئة المحيطة به.
يتم تدريب نماذج التعلُّم العميق المتقدمة، مثل Ultralytics YOLO11، على مجموعات بيانات كبيرة ومشروحة مثل COCO للتنبؤ بدقة بمواقع هذه النقاط الرئيسية في الوقت الفعلي. وقد مهدت الأنظمة المبكرة مثل OpenPose الطريق من خلال إظهار القدرة على اكتشاف النقاط الرئيسية لكامل الجسم واليد والوجه لعدة أشخاص في وقت واحد. وقد بنيت البنى الحديثة على هذه الأسس لتقديم نتائج أسرع وأكثر دقة لمجموعة واسعة من التطبيقات.
من المهم التفريق بين اكتشاف النقاط الرئيسية والمهام الأخرى ذات الصلة في الرؤية الحاسوبية:
مكنت القدرة على اكتشاف وتتبع النقاط الرئيسية من تحقيق تقدم كبير في مختلف الصناعات. وفيما يلي مثالان بارزان:
وتشمل التطبيقات الأخرى الكشف عن معالم الوجه لتحليل المشاعر ومرشحات الواقع المعزز، وتقدير وضع الحيوانات للدراسات السلوكية في مجال الحفاظ على الحياة البرية، والروبوتات لمساعدة الآلات على التنقل والتفاعل مع بيئتها.