Yolo فيجن شنتشن
شنتشن
انضم الآن
مسرد المصطلحات

تقدير الوضعية

اكتشف تقدير الوضعية: كيفية عمل نماذج النقاط الرئيسية (من أعلى إلى أسفل مقابل من أسفل إلى أعلى)، والاستخدامات الواقعية من الرعاية الصحية إلى الرياضة، بالإضافة إلى الفوائد والتحديات الرئيسية.

تقدير الوضع هو تقنية رؤية حاسوبية محورية تتجاوز مجرد اكتشاف الأشياء إلى فهم هيكلها الهندسي واتجاهها في الفضاء. على عكس طرق الاكتشاف القياسية التي تحيط بالشيء في صندوق، يحدد تقدير الوضع نقاطًا دلالية محددة، تُعرف باسم النقاط الرئيسية، مثل المفاصل في جسم الإنسان أو الزوايا في المركبة. من خلال تعيين هذه المعالم، يمكن لنماذج التعلم الآلي إعادة بناء تمثيل هيكلي للموضوع، مما يمكّن الأنظمة من تفسير لغة الجسد وديناميكيات الحركة وتحديد الموقع بدقة. هذه القدرة تسد الفجوة بين رؤية الجسم وفهم سلوكه الفيزيائي.

الآليات الأساسية: من أعلى إلى أسفل مقابل من أسفل إلى أعلى

يعتمد تقدير الوضع الحديث بشكل كبير على بنى التعلم العميق، وتحديداً الشبكات العصبية التلافيفية (CNNs)، لمعالجة البيانات البصرية. تتبع الخوارزميات عموماً إحدى استراتيجيتين أساسيتين:

  • المنهجيات التنازلية: تستخدم هذه الطريقة أولاً نموذجًا لاكتشاف الكائنات لتحديد مواقع الحالات الفردية داخل المربعات المحيطة. بمجرد قص شخص أو كائن، يتنبأ مقدر الوضع بالنقاط الرئيسية داخل تلك المنطقة المحددة. غالبًا ما تكون هذه الطريقة عالية الدقة، ولكنها قد تعاني من تأخر الاستدلال مع زيادة عدد العناصر في الإطار.
  • النهج التصاعدي: على العكس من ذلك، تكتشف هذه الاستراتيجية جميع النقاط الرئيسية المحتملة في الصورة بأكملها في وقت واحد (على سبيل المثال، العثور على كل "ركبة يسرى" في حشد من الناس) ثم تجمعها في هياكل عظمية فردية. يُفضل استخدام هذه الطريقة عمومًا للاستدلال في الوقت الفعلي في المشاهد المزدحمة لأن التكلفة الحسابية ثابتة نسبيًا بغض النظر عن عدد الأشخاص الموجودين.

تستخدم النماذج الحديثة مثل YOLO26 بنى متطورة لتحقيق التوازن بين هذه الاحتياجات، مما يوفر تقديرًا عالي السرعة وشاملًا للوضع المناسب للنشر على أجهزة الذكاء الاصطناعي المتطورة.

تمييز المصطلحات ذات الصلة بالرؤية الحاسوبية

من المفيد التمييز بين تقدير الوضع ومهام التعرف البصري الأخرى لفهم قيمته الفريدة:

  • كشف الأجسام: يركز على تحديد ماهية الكائن ومكانه، ويقوم بإخراج مربع مستطيل. يعامل الموضوع ككائن صلب دون فهم مفصلاته الداخلية.
  • تقسيم المثيل: تولد قناعًا دقيقًا للبكسل يحدد شكل الكائن. في حين أن التقسيم يوفر حدودًا، إلا أنه لا يحدد بشكل صريح المفاصل أو الروابط الهيكلية اللازمة للتحليل الحركي.
  • تقدير الوضع: يستهدف بشكل خاص الهيكل الداخلي، ويرسم خريطة للوصلات بين المعالم المحددة مسبقًا (مثل المرفق إلى الرسغ) لتحليل الوضع والحركة.

تطبيقات واقعية

أدت القدرة على رقمنة حركة الإنسان إلى تطبيقات تحويلية في مختلف الصناعات.

الرعاية الصحية وإعادة التأهيل

في المجال الطبي، تستخدم الذكاء الاصطناعي في الرعاية الصحية تقدير الوضع لمراقبة إعادة تأهيل المرضى. من خلال تتبع زوايا المفاصل ونطاق الحركة، يمكن للأنظمة الآلية ضمان قيام المرضى بتمارين العلاج الطبيعي بشكل صحيح في المنزل. وهذا يقلل من خطر إعادة الإصابة ويسمح للأطباء track تقدم track عن بُعد باستخدام كاميرات الويب القياسية .

التحليلات الرياضية

يستفيد المدربون والرياضيون من تحليلات الرياضة لتحسين الأداء. يمكن لنماذج تقدير الوضع تحليل مستوى ضربة لاعب الجولف، وطول خطوة العداء، أو آليات عمل الرامي دون الحاجة إلى بدلات العلامات المزعجة المستخدمة في التقاط الحركة التقليدي. وهذا يوفر ردود فعل فورية قائمة على البيانات لتحسين التقنية ومنع الإصابات الناتجة عن الإفراط في الاستخدام.

تحليل السلوك والتجزئة

في بيئات البيع بالتجزئة، تستخدم أنظمة الذكاء الاصطناعي في البيع بالتجزئة خاصية الكشف عن الوضع لفهم سلوك العملاء، مثل الوصول إلى المنتجات الموجودة على الرفوف العالية أو التوقف في ممرات معينة . تساعد هذه البيانات على تحسين تصميم المتاجر وتحسين إدارة المخزون.

مثال على الكود: تقدير الوضعية باستخدام YOLO26

تنفيذ تقدير الوضع أمر سهل مع الأطر الحديثة. ما يلي Python يوضح المثال كيفية استخدام ultralytics حزمة لتحميل نموذج مدرب مسبقًا يولو26 نموذج detect في الصورة.

from ultralytics import YOLO

# Load the YOLO26 pose model (nano version for speed)
model = YOLO("yolo26n-pose.pt")

# Perform inference on an image source
# The model identifies bounding boxes and specific keypoints (joints)
results = model("https://ultralytics.com/images/bus.jpg")

# Visualize the skeletal results directly
results[0].show()

التحديات وبيانات التدريب

يتطلب تطوير نماذج تقدير الوضع القوية مجموعات بيانات عالية الجودة مشروحة. توفر المعايير الشائعة مثل مجموعة بياناتCOCO آلاف الأشكال البشرية الموسومة مع شروحات النقاط الرئيسية.

ومع ذلك، لا تزال هناك تحديات في السيناريوهات الواقعية. يحدث الانسداد عندما تكون أجزاء الجسم مخفية خلف أشياء أخرى، ويحدث الانسداد الذاتي عندما يحجب جسم الشخص رؤية الكاميرا لأحد الأطراف. للتخفيف من ذلك، يستخدم المهندسون تقنيات زيادة البيانات أثناء التدريب، مثل الدوران العشوائي والقص، لمساعدة النموذج على تعلم استنتاج المعلومات المفقودة.

بالنسبة للمستخدمين الذين يرغبون في تدريب نماذج الوضع المخصصة — على سبيل المثال، track حركات track باستخدام مجموعة بيانات Tiger-Pose— توفر Ultralytics بيئة مبسطة لتعليق البيانات وإدارة التجارب ونشر النماذج المحسنة على السحابة أو الأجهزة الطرفية. وهذا يبسط سير العمل المعقد لتدريب النماذج و التحقق من صحتها.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن