Point Tracking
استكشف أساسيات تتبع النقاط في رؤية الكمبيوتر. تعلم كيف يتتبع Ultralytics YOLO26 ونماذج الذكاء الاصطناعي المتقدمة الحركة الدقيقة للروبوتات والمؤثرات البصرية (VFX).
يعد تتبع النقاط مهمة أساسية في رؤية الحاسوب تتضمن تقدير وتتبع حركة نقاط محددة وموضعية (مثل البكسلات أو السمات المميزة) عبر إطارات متتالية في تسلسل فيديو بمرور الوقت. على عكس تتبع الكائنات، الذي يراقب الموضع العام للكيانات بأكملها باستخدام صناديق التحديد أو أقنعة التجزئة، يركز تتبع النقاط على مستوى أدق بكثير من التفاصيل على مستوى البكسل الفرعي. من خلال تحديد الحفاظ على المراسلات بين هذه المواقع الدقيقة، يمكن لأنظمة الذكاء الاصطناعي (AI) إنجاز مهام متقدمة في فهم الفيديو تتطلب تحليلاً معقداً للحركة.
Link to this sectionفهم تتبع النقاط#
يعد تتبع النقاط بدقة في مشهد ديناميكي أمراً صعباً للغاية. غالباً ما تعاني النقاط المتتبعة من الانسدادات—حيث تحجب الكائنات رؤية الكاميرا مؤقتاً—أو قد تغادر مجال الرؤية تماماً. بالإضافة إلى ذلك، يمكن أن تؤدي الاختلافات في الإضاءة، وتحولات المنظور، والحركات السريعة إلى تغيير المظهر البصري للنقطة بشكل جذري.
تاريخياً، تعاملت الخوارزميات الكلاسيكية مثل تدفق Lucas-Kanade البصري مع هذه المهام. ومع ذلك، تستخدم الأساليب الحديثة بنيات التعلم العميق القوية. أحدثت الابتكارات الأخيرة من مؤسسات بحثية كبرى، مثل TAPIR من Google DeepMind (تتبع أي نقطة مع التهيئة والصقل) و CoTracker3 من Meta AI، ثورة في هذا المجال. على عكس الطرق القديمة التي تتبع النقاط بشكل مستقل، تستخدم نماذج مثل CoTracker3 المحولات لإجراء تتبع مشترك لنقاط متعددة، مستفيدة من التبعيات الفيزيائية بين النقاط التي تنتمي إلى نفس الكائن. تستخدم هذه النماذج الحديثة أيضاً التسمية الزائفة على مقاطع فيديو واقعية لتدريب أنظمة عالية الدقة مع متطلبات بيانات مخفضة بشكل كبير.
Link to this sectionتتبع النقاط مقابل المهام ذات الصلة#
على الرغم من ارتباطها الوثيق، يختلف تتبع النقاط بشكل كبير عن مهام رؤية الحاسوب الأخرى:
- تتبع الكائنات: يخصص معرفات فريدة للكائنات بأكملها (مثل شخص أو سيارة) ويقوم بتتبعها. يعتمد بشكل كبير على نماذج اكتشاف الكائنات مثل Ultralytics YOLO26.
- تقدير الوضعية: يتتبع نقاطاً دلالية محددة (مثل مفاصل الإنسان) بدلاً من البكسلات العشوائية. بينما يشترك في أوجه تشابه مع تتبع النقاط، يتطلب تقدير الوضعية فهماً دلالياً للإطار الهيكلي للكائن.
Link to this sectionتطبيقات العالم الحقيقي#
يعد تتبع النقاط عاملاً حاسماً للعديد من التطبيقات المتقدمة:
- إعادة البناء ثلاثي الأبعاد والهيكل من الحركة (SfM): من خلال تتبع سمات محددة عبر زوايا كاميرا مختلفة أو إطارات فيديو، يمكن للأنظمة استنتاج العمق وبناء عمليات إعادة بناء ثلاثية الأبعاد دقيقة للبيئات، وهو أمر ضروري لخرائط الواقع المعزز (AR).
- الروبوتات والملاحة المستقلة: تستخدم المركبات المستقلة والروبوتات تتبع النقاط (غالباً عبر قياس المسافة البصري) لفهم حركتها بالنسبة لمحيطها، وحساب المسارات، والتنقل بأمان عبر البيئات الديناميكية المعقدة.
- تحرير الفيديو والمؤثرات الخاصة: تعتمد برامج المؤثرات البصرية الاحترافية (VFX) بشكل كبير على تتبع النقاط لتثبيت اللقطات المهتزة أو ربط الصور المولدة بالحاسوب (CGI) بسلاسة بكائنات متحركة في مشهد مادي.
Link to this sectionتتبع النقاط الرئيسية باستخدام Ultralytics#
بينما تتبع متتبعات النقاط العامة بكسلات بصرية عشوائية، يمكنك تتبع نقاط رئيسية هيكلية محددة (مثل عيون الشخص أو كتفيه أو معصميه) باستخدام قدرات تتبع الوضعية في حزمة ultralytics. يوفر نموذج YOLO26 الموصى به تتبعاً عالي السرعة وشاملاً للنقاط الرئيسية، وهو مثالي لتحليل الحركة.
from ultralytics import YOLO
# Load the recommended YOLO26 pose model for keypoint tracking
model = YOLO("yolo26n-pose.pt")
# Perform pose tracking on a video stream to follow human keypoints over time
results = model.track(source="video.mp4", stream=True)
# Iterate through the stream to process temporal keypoint tracking data
for frame_result in results:
# Each keypoint maintains its association across frames
print(f"Tracked {len(frame_result.keypoints)} human skeletons in current frame.")عند نشر سير عمل رؤية الحاسوب على نطاق واسع، توفر منصة Ultralytics حلاً مبسطاً لـ تعليق البيانات، وتدريب النماذج، والنشر السلس، مما يضمن أداءً موثوقاً عبر بيئات الحافة والسحاب المتنوعة.






