Visual SLAM (Simultaneous Localization and Mapping)

اكتشف كيف يمكّن Visual SLAM رسم الخرائط الذاتي. تعرّف على كيفية تعزيز الدقة باستخدام Ultralytics YOLO26 ونشر الحلول عبر منصة Ultralytics.

يعد Visual SLAM (التوطين ورسم الخرائط المتزامن) تقنية أساسية في رؤية الكمبيوتر تمكّن الوكيل، مثل الروبوت أو الجهاز المحمول، من رسم خريطة لبيئة غير معروفة وتحديد موقعه الخاص داخل تلك المساحة في وقت واحد باستخدام مدخلات الكاميرا فقط. وخلافاً لأنظمة SLAM التقليدية التي تعتمد على مستشعرات ليزر باهظة الثمن، تستفيد تقنية Visual SLAM من الكاميرات القياسية أحادية العدسة (monocular) أو ستيريو أو كاميرات RGB-D. ومن خلال استخراج وتتبع السمات البصرية عبر إطارات الصور المتتالية، يقوم النظام بحساب مسار الكاميرا أثناء بناء سحابة نقاط ثلاثية الأبعاد أو خريطة كثيفة للمحيط بشكل تدريجي. تُعد هذه التكنولوجيا حجر الأساس لتمكين التنقل الذاتي والوعي المكاني في الآلات.

Link to this sectionكيف يعمل Visual SLAM#

يتكون خط أنابيب Visual SLAM النموذجي من مكونين رئيسيين: الواجهة الأمامية والواجهة الخلفية. تتعامل الواجهة الأمامية مع بيانات المستشعر، حيث تقوم باستخراج السمات البصرية (تحديد الزوايا أو الحواف المميزة) ومطابقة هذه السمات بين الإطارات لتقدير حركة الكاميرا بمرور الوقت. تأخذ الواجهة الخلفية بيانات قياس المسافة (odometry) هذه وتنفذ خوارزميات تحسين مثل تصحيح الحزمة لتصحيح الانحراف وتحسين كل من خريطة البيئة ووضعية الكاميرا المقدرة.

أدت الاختراقات الأخيرة في عامي 2024 و 2025 إلى تحويل النموذج من السمات اليدوية التقليدية - مثل تلك المستخدمة في الأطر القديمة مثل ORB-SLAM3 - إلى نهج التعلم العميق. تستخدم الأنظمة الحديثة الآن شبكات عصبية للتدفق البصري الكثيف ومطابقة السمات، مما يجعلها مرنة للغاية تجاه ضبابية الحركة والبيئات ذات الملمس المنخفض. بالإضافة إلى ذلك، تتيح تقنيات العرض الجديدة التي تدمج 3D Gaussian Splatting و حقول الإشعاع العصبية (NeRFs) رسم خرائط كثيفة وواقعية في الوقت الفعلي، والتي تلتقط تفاصيل هندسية معقدة بشكل أفضل بكثير من سحب النقاط القياسية.

Link to this sectionVisual SLAM مقابل LiDAR SLAM مقابل تتبع الكائنات#

يعد فهم الاختلافات بين تقنيات رسم الخرائط والتتبع أمراً ضرورياً لنشر الحل الصحيح:

Visual SLAM مقابل LiDAR SLAM: بينما يعتمد Visual SLAM على مستشعرات كاميرا غير مكلفة لإدراك القوام البصري الغني، يستخدم LiDAR SLAM أشعة الليزر لقياس المسافات المادية بدقة. يتميز LiDAR بالدقة العالية ولكنه مكلف ويستهلك الكثير من الطاقة، في حين أن Visual SLAM فعال من حيث التكلفة ويوفر معلومات ملونة ولكنه قد يواجه صعوبات في ظروف الإضاءة الضعيفة.
Visual SLAM مقابل تتبع الكائنات: يعمل تتبع الكائنات على عزل ومتابعة حركة كيانات محددة عبر إطارات الفيديو. من ناحية أخرى، يتتبع Visual SLAM حركة الكاميرا بالنسبة للبيئة الثابتة لبناء خريطة. ومع ذلك، يندمج المفهومان في Semantic SLAM، حيث تحدد نماذج اكتشاف الكائنات الكائنات الديناميكية لاستبعادها عمداً من الخريطة الثابتة.

Link to this sectionتطبيقات العالم الحقيقي#

يتم دمج Visual SLAM بشكل عميق في وكلاء الذكاء الاصطناعي الحديثة وأنظمة الحوسبة المكانية.

الروبوتات والطائرات بدون طيار المستقلة: تستخدم روبوتات التوصيل والطائرات بدون طيار تقنية Visual SLAM للتنقل في البيئات التي لا يتوفر فيها GPS مثل المستودعات أو الأخاديد الحضرية الكثيفة. من خلال بناء خرائط في الوقت الفعلي، يمكنها التخطيط للمسار وتجنب العقبات بشكل مستقل.
الواقع المعزز (AR) والواقع الافتراضي (VR): تعتمد النظارات الذكية التجارية بشكل كبير على Visual SLAM لفهم هندسة الغرفة. وهذا يسمح لأنظمة AR بتثبيت الكائنات الرقمية، مثل شاشة افتراضية، بدقة على الأسطح المادية بحيث تظل مستقرة أثناء تحرك المستخدم.
أنظمة الملاحة المساعدة: يتم استخدام التطورات الأخيرة في Semantic SLAM القائم على التعلم العميق لإنشاء مساعدات تنقل قابلة للارتداء للأفراد ضعاف البصر، مما يضمن توجيهاً آمناً في الوقت الفعلي حول العقبات المادية الديناميكية.

Link to this sectionتكامل Semantic SLAM و YOLO26#

أحد أكبر التحديات في Visual SLAM هو التعامل مع البيئات الديناميكية حيث تفسد الكائنات المتحركة الخريطة. يحل Semantic SLAM هذه المشكلة عن طريق إقران خط أنابيب SLAM التقليدي بنماذج رؤية عالية السرعة. باستخدام Ultralytics YOLO26 لـ تقسيم المثيلات أو الاكتشاف، يمكن للنظام تصنيف المشهد دلالياً وتصفية الكائنات المتحركة، مما يحسن دقة التوطين بشكل كبير.

يوضح كتلة الكود أدناه كيفية استخدام YOLO26 لتحديد إحداثيات الكائنات الديناميكية (مثل الأشخاص والسيارات) بحيث يمكن لمحرك مطابقة سمات SLAM تجاهلها صراحةً:

from ultralytics import YOLO

# Load Ultralytics YOLO26 to detect dynamic objects in the scene
model = YOLO("yolo26n.pt")
results = model("robot_camera_view.jpg")

# Extract bounding boxes of dynamic objects to exclude them from SLAM maps
for box in results[0].boxes:
    if int(box.cls) in [0, 2]:  # Example: Class 0 is person, Class 2 is car
        print(f"Ignore dynamic feature region at coordinates: {box.xyxy[0]}")

من خلال الاستفادة من أجهزة الذكاء الاصطناعي الطرفي الحديثة مثل NVIDIA Jetson ودمج النماذج من خلال منصة Ultralytics، يمكن للمطورين تدريب ونشر خوارزميات رؤية خفيفة الوزن مباشرة إلى جانب خطوط أنابيب SLAM. لمزيد من الاستكشاف حول بنيات رسم الخرائط المستقلة، راجع الأدبيات الحديثة على IEEE Xplore أو arXiv، واكتشف كيفية تحسين خطوط أنابيب الرؤية المستمرة في توثيق Ultralytics.

Visual SLAM (Simultaneous Localization and Mapping)

Link to this sectionكيف يعمل Visual SLAM#

Link to this sectionVisual SLAM مقابل LiDAR SLAM مقابل تتبع الكائنات#

Link to this sectionتطبيقات العالم الحقيقي#

Link to this sectionتكامل Semantic SLAM و YOLO26#

Explore solutions

الذكاء الاصطناعي في الروبوتات

الذكاء الاصطناعي في الخدمات اللوجستية

الذكاء الاصطناعي في التجزئة

الذكاء الاصطناعي في الرعاية الصحية

الذكاء الاصطناعي في التصنيع

الذكاء الاصطناعي في مجال السيارات

الذكاء الاصطناعي في الزراعة

الذكاء الاصطناعي في الروبوتات

الذكاء الاصطناعي في الخدمات اللوجستية

الذكاء الاصطناعي في التجزئة

الذكاء الاصطناعي في الرعاية الصحية

الذكاء الاصطناعي في التصنيع

الذكاء الاصطناعي في مجال السيارات

الذكاء الاصطناعي في الزراعة

الذكاء الاصطناعي في الروبوتات

الذكاء الاصطناعي في الخدمات اللوجستية

الذكاء الاصطناعي في التجزئة

الذكاء الاصطناعي في الرعاية الصحية

الذكاء الاصطناعي في التصنيع

الذكاء الاصطناعي في مجال السيارات

الذكاء الاصطناعي في الزراعة

لنبنِ مستقبل الذكاء الاصطناعي معاً!