الرؤية الحاسوبية في الملاحة Ultralytics

في الوقت الحاضر، يبدو إخراج هاتفك وكتابة وجهة واتباع التوجيهات خطوة بخطوة للوصول إلى هناك أمرًا سهلاً. إنه شيء يستغرق بضع ثوانٍ فقط. لكن هذه الراحة اليومية هي نتيجة سنوات من التقدم التكنولوجي. لقد قطعت الملاحة شوطًا طويلاً، من الخرائط الورقية والبوصلات إلى الأنظمة الذكية التي يمكنها فهم العالم والاستجابة له في الوقت الفعلي.

إحدى التقنيات الكامنة وراء هذا التحول هي الرؤية الحاسوبية، وهي فرع من فروع الذكاء الاصطناعي (AI) الذي يسمح للآلات بتفسير المعلومات المرئية كما يفعل البشر. تستخدم أدوات الملاحة المتطورة الآن صورًا في الوقت الفعلي من الأقمار الصناعية وكاميرات لوحة القيادة وأجهزة الاستشعار على مستوى الشارع لتحسين دقة الخرائط ومراقبة ظروف الطريق وتوجيه المستخدمين عبر البيئات المعقدة.

في هذه المقالة، سوف نستكشف كيف يعزز مجال رؤية الحاسوب (computer vision) الملاحة من خلال تحسين خرائط نظام تحديد المواقع العالمي (GPS)، وتقديم تحديثات مرورية في الوقت الفعلي، ودعم تقنيات مثل الملاحة بالواقع المعزز والمركبات ذاتية القيادة.

أنظمة الملاحة بالذكاء الاصطناعي مع خرائط ثلاثية الأبعاد غامرة

أصبح استخدام أدوات مثل "خرائط Google " للتنقل في الحياة اليومية أمراً شائعاً للغاية، سواء كنت متجهاً إلى مكان ما في المدينة أو تبحث عن مقهى قريب. ومع انتشار استخدام تقنيات الذكاء الاصطناعي على نطاق واسع، أصبحنا نشهد ميزات متقدمة بشكل متزايد مثل ميزة "العرض الغامر" التي طرحتها خرائط Google في عام 2023، والتي تتيح للمستخدمين معاينة أجزاء من رحلتهم في بيئة ثلاثية الأبعاد. وقد أصبح ذلك ممكناً من خلال مزيج من الذكاء الاصطناعي والمسح التصويري والرؤية الحاسوبية.

‍

يبدأ كل شيء بمليارات الصور عالية الدقة التي تم التقاطها بواسطة مجموعة من المعدات المتخصصة. ويشمل ذلك سيارات "التجوّل الافتراضي" (Street View)، وهي مركبات مجهزة بكاميرات بزاوية 360 درجة تجوب المدن، وأجهزة "تريكير" (Trekker)، وهي حقائب ظهر يمكن ارتداؤها مزودة بكاميرات مثبتة لالتقاط الصور في الأماكن التي لا تستطيع المركبات الوصول إليها، مثل مسارات المشي لمسافات طويلة أو الأزقة الضيقة.

تتم محاذاة هذه الصور مع بيانات الخرائط باستخدام التصوير المساحي (photogrammetry)، وهي تقنية تجمع بين صور ثنائية الأبعاد مأخوذة من زوايا مختلفة لإنشاء نماذج ثلاثية الأبعاد دقيقة للشوارع والمباني والتضاريس.

ثم يتم استخدام رؤية الحاسوب لتحليل هذه النماذج باستخدام تقنيات مثل كشف الأجسام (object detection) و تجزئة الصور (image segmentation) لتحديد وتصنيف الميزات المهمة مثل إشارات المرور والأرصفة وممرات المشاة ومداخل المباني.

الشكل 2. يستخدم العرض الغامر التجزئة segment الأجسام في الشارع.

‍

تُستخدم البيانات المصنفة لتدريب أنظمة الذكاء الاصطناعي التي تتعرف على كيفية اختلاف الإشارات المرئية عبر المناطق. على سبيل المثال، يمكن للنظام بسهولة التمييز بين علامة "SLOW" في الولايات المتحدة، والتي عادة ما تكون ماسية صفراء أو برتقالية، وعلامة مماثلة في اليابان، والتي عادة ما تكون مثلثًا أحمر وأبيض. هذا المستوى من الفهم يجعل تجربة الملاحة أكثر دقة ووعيًا ثقافيًا.

أخيرًا، يضع العرض الغامر (Immersive View) مسارات الملاحة الحية على البيئة ثلاثية الأبعاد، مما يوفر تجربة سلسة وبديهية توضح بالضبط إلى أين تتجه.

الواقع المعزز في حلول الملاحة

ربما اختبرنا جميعاً على الأرجح تجربة الدوران في دوائر ومحاولة معرفة الاتجاه الذي توجهنا إليه خرائط Google . هذا الارتباك هو بالضبط ما يهدف الواقع المعزز (AR) للملاحة (AR) ، وهي تقنية تقوم بتراكب المعلومات الرقمية على عرض الكاميرا في العالم الحقيقي، إلى حل هذه المشكلة. إنها تغيّر الطريقة التي يجد بها الأشخاص طريقهم في الأماكن المزدحمة مثل شوارع المدينة أو المناطق الداخلية الكبيرة.

قد يكون من الصعب تتبع الخرائط العادية، خاصة عندما تكون إشارات نظام تحديد المواقع العالمي (GPS) ضعيفة أو لا تعمل بشكل جيد. تعالج الملاحة بالواقع المعزز (AR) هذا الأمر من خلال عرض التوجيهات الرقمية والأسهم والملصقات مباشرة على عرض الكاميرا الحية للعالم الحقيقي. هذا يعني أن المستخدمين يرون إرشادات تتطابق مع الشوارع والمباني المحيطة بهم، مما يسهل معرفة إلى أين تذهب.

كيف يتم استخدام الواقع المعزز في الملاحة

تعتمد الملاحة بالواقع المعزز (AR) على نماذج رؤية الحاسوب (computer vision models) لفهم البيئة من خلال كاميرا الجهاز. يتضمن ذلك مهام مختلفة مثل تحديد موقع الصورة (image localization)، الذي يكتشف ميزات مثل حواف المباني أو لافتات الشوارع ويطابقها مع خريطة مخزنة. يقوم التوطين ورسم الخرائط المتزامنان (SLAM) بإنشاء خريطة للبيئة مع تتبع موقع الجهاز في الوقت الفعلي.

على سبيل المثال، كان مطار زيورخ أول مطار يطبِّق ميزة "العرض المباشر" من خرائط Google للملاحة الداخلية. يمكن للركاب استخدام كاميرات هواتفهم لرؤية الأسهم والاتجاهات متراكبة في بيئة العالم الحقيقي، لتوجيههم عبر مباني الركاب إلى البوابات والمتاجر والخدمات. ويؤدي ذلك إلى تحسين تجربة الركاب من خلال تسهيل التنقل في الأماكن الداخلية المعقدة.

الشكل 3. يستخدم مطار زيورخ رؤية الحاسوب والواقع المعزز لتوجيه الركاب في الداخل.

‍

تعزيز السلامة على الطرق باستخدام أنظمة الملاحة بالذكاء الاصطناعي

تزداد شوارع المدينة ازدحامًا كل يوم. مع وجود المزيد من السيارات على الطريق، والأرصفة المزدحمة، والنشاط المستمر، فإن الحفاظ على حركة المرور بسلاسة وأمان يمثل تحديًا متزايدًا. للمساعدة في إدارة الفوضى، تلجأ العديد من المدن إلى الذكاء الاصطناعي ورؤية الحاسوب.

تلتقط الكاميرات وأجهزة الاستشعار الذكية المثبتة في التقاطعات وعلى طول الطرقات دفقاً مستمراً من البيانات المرئية. تتم معالجة هذه اللقطات في الوقت الفعلي detect الحوادث ومراقبة تدفق حركة المرور ورصد الحفر واكتشاف الحفر والتقاط أشياء مثل الوقوف غير القانوني أو سلوك المشاة المحفوف بالمخاطر.

مثال مثير للاهتمام على ذلك هو طريق المطار السريع الذكي في هانغتشو، الصين. تم تحديث هذا الطريق السريع الذي يبلغ طوله 20 كيلومترًا، والذي يربط وسط مدينة هانغتشو بمطار شياوشان الدولي، بكاميرات عالية الدقة ورادارات بموجة ملليمترية. تقوم هذه الأجهزة باستمرار بجمع بيانات الفيديو والاستشعار، والتي يتم تحليلها بعد ذلك باستخدام رؤية الحاسوب.

بدلاً من مجرد تسجيل اللقطات، يقوم النظام بتفسير ما يحدث على الطريق. detect خوارزميات الرؤية الحاسوبية تصادم المركبات، وتتعرّف على المخالفات المرورية، بل وتحدّد المشاة أو الحركة غير المعتادة بالقرب من مخارج الطرق السريعة. وهذا يسمح لمسؤولي المرور بالاستجابة للحوادث في غضون ثوانٍ، دون الحاجة إلى التواجد فعلياً في الموقع.

تغذي البيانات أيضًا توأمًا رقميًا: نموذج افتراضي ثلاثي الأبعاد حي للطريق السريع يعرض ظروف حركة المرور في الوقت الفعلي وتفاصيل المركبات والازدحام الناشئ. يراقب ضباط المرور هذه الواجهة المرئية لإدارة التدفق وإصدار تنبيهات ذكية والاستجابة للحوادث بسرعة ودقة.

التنقل الذاتي ممكن بفضل رؤية الحاسوب في الملاحة

يتجاوز التنقل اليوم مجرد الانتقال من النقطة أ إلى النقطة ب. إنه الآن جزء أساسي من الأنظمة الذكية التي تنقل الأشخاص وتدير البضائع وتتخذ قرارات في الوقت الفعلي - سواء على الطريق أو داخل المستودعات.

يكمن جوهر العديد من هذه الأنظمة في رؤية الكمبيوتر، مما يمكّن الآلات من تفسير البيانات المرئية والاستجابة الفورية لمحيطها. دعنا نستعرض بعض الأمثلة لنرى كيف تُحدث هذه التقنية تحولًا في الملاحة في بيئات مختلفة.

روبوتات المستودعات التي تستخدم رؤية الكمبيوتر في الملاحة

أصبحت الروبوتات ضرورية لمستقبل الخدمات اللوجستية، وخاصة في عمليات المستودعات واسعة النطاق. مع نمو الطلب على التجارة الإلكترونية، تعتمد الشركات بشكل متزايد على الآلات التي تعمل برؤية الكمبيوتر للتنقل في البيئات المعقدة، وفرز العناصر، وإدارة المخزون بسرعة ودقة.

على سبيل المثال، مراكز تلبية طلبات أمازون، حيث يعمل أكثر من 750,000 روبوت جنبًا إلى جنب مع البشر للحفاظ على سير العمليات بكفاءة. تعتمد هذه الروبوتات بشكل كبير على رؤية الكمبيوتر للتنقل في أرضيات المستودعات المزدحمة، وتحديد العناصر، واتخاذ قرارات سريعة ودقيقة.

أحد هذه الأنظمة هو Sequoia، وهي منصة روبوتية مصممة لتسريع معالجة المخزون. تستخدم رؤية الكمبيوتر المتقدمة لمسح المنتجات الواردة وعدها وتنظيمها، مما يساعد على تبسيط عمليات التخزين والاسترجاع.

وبالمثل، يستخدم Vulcan، وهو ذراع روبوتية، الكاميرات وتحليل الصور لالتقاط العناصر بأمان من الرفوف، وتعديل قبضته بناءً على شكل وموضع كل كائن، وحتى التعرف على متى تكون هناك حاجة إلى مساعدة بشرية. وفي الوقت نفسه، يتخصص Cardinal، وهو روبوت آخر مزود بتقنية الرؤية، في الفرز: فهو يقوم بمسح أكوام مختلطة من الطرود ووضعها بدقة في عربات الشحن الصادرة الصحيحة.

الشكل 4. Cardinal يرفع الطرود بدقة من كومة.

‍

رؤية الكمبيوتر في ملاحة المركبات ذاتية القيادة

حتى الآن، رأينا كيف تساعد رؤية الكمبيوتر كلاً من الأشخاص والروبوتات على التنقل في بيئاتهم. ولكنه لا يقل أهمية بالنسبة للأنظمة المستقلة، مثل السيارات ذاتية القيادة، حيث يعتمد التنقل كليًا على ما يمكن أن تراه السيارة وتفهمه في الوقت الفعلي.

أحد الأمثلة الجيدة هو نظام Tesla Vision. تبنت Tesla نهجًا يعتمد على الكاميرات فقط للقيادة الذاتية، وإزالة الرادار وأجهزة الاستشعار الأخرى لصالح شبكة من الكاميرات التي توفر رؤية كاملة بزاوية 360 درجة لمحيط السيارة. تغذي هذه الكاميرات البيانات المرئية إلى كمبيوتر القيادة الذاتية الكاملة (FSD)، الذي يستخدم الشبكات العصبية العميقة لتفسير البيئة واتخاذ قرارات القيادة في جزء من الثانية.

بناءً على ما تراه، يقرر النظام متى يتجه، أو يتسارع، أو يضغط على المكابح، أو يغير المسارات - تمامًا كما يفعل السائق البشري، ولكن بالكامل من خلال المدخلات المرئية. تعمل Tesla باستمرار على تحسين هذا النظام من خلال جمع وتعلم كميات هائلة من بيانات القيادة الواقعية عبر أسطولها.

الشكل 5. تستخدم Tesla رؤية الكمبيوتر للملاحة الآمنة والمستقلة (المصدر: Tesla).

‍

إيجابيات وسلبيات رؤية الكمبيوتر في الملاحة

فيما يلي بعض المزايا الرئيسية لاستخدام رؤية الكمبيوتر في الملاحة، خاصة في الأنظمة التي تكون فيها الدقة والسلامة واتخاذ القرارات في الوقت الفعلي ضرورية:

يقلل من استهلاك الوقود: من خلال مساعدة السائقين على تجنب الازدحام المروري وطرق التوقف والانطلاق، يمكن لرؤية الكمبيوتر أن تقلل من استهلاك الوقود الإجمالي ووقت السفر، مما يجعل التنقلات اليومية أكثر كفاءة.
‍
يكتشف تآكل الطرق ومشكلات البنية التحتية: يمكن لحلول الرؤية فحص الحفر وعلامات المسارات الباهتة والإشارات المكسورة والبنية التحتية المتضررة، وتزويد فرق الصيانة ببيانات موثوقة وفي الوقت الفعلي.
‍
يتكامل بسلاسة مع أدوات الذكاء الاصطناعي الأخرى: يمكن دمج رؤية الكمبيوتر مع المساعدين الصوتيين أو نماذج التنبؤ السلوكي أو خوارزميات تحسين المسار لإنشاء تجربة ملاحة ذكية وشخصية للغاية.

في حين أن رؤية الكمبيوتر تجلب العديد من الفوائد للملاحة، إلا أنها تأتي أيضًا مع بعض القيود المهمة التي يجب أخذها في الاعتبار عند تنفيذ مثل هذه الحلول. فيما يلي بعض التحديات الرئيسية التي يجب وضعها في الاعتبار:

نقص التعميم: غالبًا ما تواجه النماذج المدربة على بيئات أو سيناريوهات محددة صعوبة عند نشرها في سياقات جديدة أو متغيرة دون إعادة التدريب.
‍
قيود الإضاءة: تعتمد أنظمة الرؤية على الإضاءة الجيدة والطقس الصافي لتعمل بشكل جيد. في الضباب أو الأمطار الغزيرة أو الظلام، ينخفض أداؤها ما لم يتم دمجها مع أجهزة استشعار مثل LiDAR أو الرادار.
‍
مخاطر الخصوصية: يمكن لأنظمة الملاحة التي تستخدم الكاميرات التقاط صور للأشخاص والممتلكات الخاصة دون موافقة. هذا يثير قضايا الخصوصية التي يجب معالجتها بعناية أثناء التطوير والنشر.

النقاط الرئيسية

تعيد رؤية الكمبيوتر اختراع الملاحة من خلال جعل الخرائط أكثر ديناميكية وأنظمة المرور أكثر ذكاءً والتنقل أكثر سهولة. ما كانت في السابق طرقًا ثابتة أصبحت الآن تجارب تفاعلية في الوقت الفعلي - مدعومة بمعاينات ثلاثية الأبعاد غامرة وتوجيهات موجهة بالواقع المعزز وتقنيات النقل المستقلة.

مع تقدم التكنولوجيا، من المحتمل أن يتحول التركيز نحو جعل هذه الأنظمة أكثر شمولاً وقدرة على التكيف ومسؤولية. سيعتمد التقدم المستمر على تحسين الدقة عبر البيئات المتنوعة، والحفاظ على الأداء الموثوق به، وحماية خصوصية المستخدم. يكمن مستقبل رؤية الكمبيوتر في الملاحة في بناء حلول ليست ذكية فحسب، بل مراعية أيضًا في تصميمها وتأثيرها.

انضم إلى مجتمعنا المتنامي! استكشف مستودع GitHub الخاص بنا للتعرف على الذكاء الاصطناعي، وتحقق من خيارات الترخيص الخاصة بنا لبدء مشاريع Vision AI الخاصة بك. هل أنت مهتم بالابتكارات مثل الذكاء الاصطناعي في البيع بالتجزئة و رؤية الكمبيوتر في الزراعة؟ قم بزيارة صفحات الحلول الخاصة بنا لاكتشاف المزيد!

استكشاف رؤية الحاسوب في تطبيقات الملاحة

أنظمة الملاحة بالذكاء الاصطناعي مع خرائط ثلاثية الأبعاد غامرة

الواقع المعزز في حلول الملاحة

كيف يتم استخدام الواقع المعزز في الملاحة

تعزيز السلامة على الطرق باستخدام أنظمة الملاحة بالذكاء الاصطناعي

التنقل الذاتي ممكن بفضل رؤية الحاسوب في الملاحة

روبوتات المستودعات التي تستخدم رؤية الكمبيوتر في الملاحة

رؤية الكمبيوتر في ملاحة المركبات ذاتية القيادة

إيجابيات وسلبيات رؤية الكمبيوتر في الملاحة

النقاط الرئيسية

اقرأ المزيد في هذه الفئة

فهم أهمية التعليقات التوضيحية التي يضيفها الإنسان

نظارات Oakley Meta AI تعيد تعريف النظارات مع Vision AI

الرؤية الحاسوبية تعزز أداء مناظير مراقبة الطيور الأكثر ذكاءً

لنبنِ مستقبل
الذكاء الاصطناعي معًا!

استكشاف رؤية الحاسوب في تطبيقات الملاحة

أنظمة الملاحة بالذكاء الاصطناعي مع خرائط ثلاثية الأبعاد غامرة

الواقع المعزز في حلول الملاحة

كيف يتم استخدام الواقع المعزز في الملاحة

تعزيز السلامة على الطرق باستخدام أنظمة الملاحة بالذكاء الاصطناعي

التنقل الذاتي ممكن بفضل رؤية الحاسوب في الملاحة

روبوتات المستودعات التي تستخدم رؤية الكمبيوتر في الملاحة

رؤية الكمبيوتر في ملاحة المركبات ذاتية القيادة

إيجابيات وسلبيات رؤية الكمبيوتر في الملاحة

النقاط الرئيسية

اقرأ المزيد في هذه الفئة

فهم أهمية التعليقات التوضيحية التي يضيفها الإنسان

نظارات Oakley Meta AI تعيد تعريف النظارات مع Vision AI

الرؤية الحاسوبية تعزز أداء مناظير مراقبة الطيور الأكثر ذكاءً

لنبنِ مستقبل الذكاء الاصطناعي معًا!

لنبنِ مستقبل
الذكاء الاصطناعي معًا!