تقدير العمق
اكتشف كيف ينشئ تقدير العمق خرائط العمق من الصور - المجسمة، والتركيز الترددي الترددي، والليدار، والتعلم العميق الأحادي - لتشغيل الروبوتات والواقع المعزز/الواقع الافتراضي والإدراك ثلاثي الأبعاد.
تقدير العمق هو مهمة أساسية في الرؤية الحاسوبية تتضمن حساب المسافة بين الأجسام المختلفة في المشهد من وجهة نظر الكاميرا. على عكس الصور القياسية ثنائية الأبعاد التي تلتقط الارتفاع والعرض فقط، يضيف تقدير العمق بُعدًا ثالثًا، مما يسمح للنظام بإدراك العالم بشكل ثلاثي الأبعاد. تُنشئ هذه العملية خريطة عمق، وهي في الأساس صورة تتوافق فيها قيمة كل بكسل مع المسافة التي تفصله عن الكاميرا. تُعد هذه القدرة أساسية لتمكين الآلات من فهم العلاقات المكانية والتفاعل مع بيئاتها بطريقة أكثر وضوحاً، على غرار الرؤية البشرية.
كيفية عمل تقدير العمق
هناك العديد من التقنيات لتحقيق تقدير العمق، بدءًا من الأساليب التقليدية التي تستخدم أجهزة متخصصة إلى الأساليب الحديثة التي تعتمد على التعلم العميق.
- الرؤية المجسمة: تحاكي هذه الطريقة الرؤية المجسمة الرؤية البشرية باستخدام كاميرتين موضوعتين على مسافة قصيرة متباعدتين. ومن خلال تحليل الاختلافات الطفيفة (التباين) بين الصورتين، يمكن تثليث المسافة إلى نقاط في المشهد. هذه طريقة كلاسيكية وموثوقة لالتقاط معلومات العمق.
- كاميرات زمن التحليق (ToF): تبعث هذه المستشعرات المتخصصة إشارة ضوئية (عادةً ما تكون بالأشعة تحت الحمراء) وتقيس الوقت الذي يستغرقه الضوء للارتداد عن جسم ما والعودة إلى المستشعر. يمكن لكاميرات ToF إنشاء خرائط عمق عالية الدقة في الوقت الفعلي.
- ليدار (الكشف عن الضوء وتحديد المدى): غالباً ما تُستخدم تقنية LiDAR في المركبات ذاتية القيادة، وتعمل هذه التقنية من خلال إصدار نبضات ليزر وقياس وقت عودتها لإنشاء سحابة نقطية ثلاثية الأبعاد مفصلة للمحيط. توفر تقنية LiDAR بيانات دقيقة عن العمق، مما يجعلها لا تقدر بثمن للملاحة الآمنة.
- تقدير العمق الأحادي: يتضمن التقدم الكبير في مجال الذكاء الاصطناعي تقدير العمق من صورة واحدة ثنائية الأبعاد. يتم تدريب نماذج التعلّم العميق، وخاصة الشبكات العصبية التلافيفية (CNNs)، على مجموعات بيانات ضخمة لاستنتاج إشارات العمق من القوام والتظليل وأحجام الأجسام، مثلما يفعل الدماغ البشري.
تطبيقات تقدير العمق
تُعد القدرة على إدراك العمق أمراً بالغ الأهمية لمجموعة كبيرة من التطبيقات التي تتطلب وعياً مكانياً.
في مجال الروبوتات، يُعد تقدير العمق أمراً بالغ الأهمية للملاحة والمعالجة. يستخدم الروبوت الصناعي على خط التجميع بيانات العمق للإمساك بالأشياء وتحريكها بدقة، مما يحسّن الكفاءة في أتمتة التصنيع. وبالمثل، يستخدم الروبوت المتحرك خريطة العمق لتجنب العوائق وتخطيط مساره عبر بيئة ديناميكية مثل المستودع. يسمح هذا الإدراك ثلاثي الأبعاد بالتفاعل الدقيق والآمن مع العالم المادي.
يعتمد الواقع المعزز (AR) والواقع الافتراضي (VR) بشكل كبير على تقدير العمق لخلق تجارب غامرة. ولكي يتمكن تطبيق الواقع المعزز على الهاتف الذكي من وضع قطعة أثاث افتراضية في غرفة حقيقية، يجب أن يفهم أولاً هندسة الغرفة. من خلال إنشاء خريطة عمق مفصّلة، يمكن للنظام أن يضمن أن الكائن الافتراضي يتداخل ويتفاعل بشكل واقعي مع الكائنات في العالم الحقيقي، مما يجعل الوهم سلسًا وقابلًا للتصديق.
تقدير العمق مقابل المفاهيم ذات الصلة
من المهم التفريق بين تقدير العمق والمصطلحات المشابهة في الرؤية الحاسوبية.
- حساب المسافة: في حين أن حساب المسافة في الرؤية الحاسوبية يشير غالبًا إلى قياس المسافة بين جسمين داخل مستوى صورة ثنائي الأبعاد (أي بالبكسل). في المقابل، يقيس تقدير العمق المسافة بين الأجسام في الفضاء ثلاثي الأبعاد من الكاميرا نفسها. في حين أن المسافة المعايرة البسيطة يمكن أن تكون كافية لبعض المهام، فإن تقدير العمق يوفر معلومات مكانية أكثر تفصيلاً.
- اكتشاف الأجسام ثلاثية الأبعاد: يُعد تقدير العمق عامل تمكين رئيسي لاكتشاف الأجسام ثلاثية الأبعاد. بينما يرسم الكشف عن الأجسام ثنائية الأبعاد مربعًا محددًا حول جسم ما على صورة مسطحة، فإن الكشف عن الأجسام ثلاثية الأبعاد يضع مكعبًا ثلاثي الأبعاد حوله، ويحدد موضعه وحجمه واتجاهه في الفضاء ثلاثي الأبعاد. هذا الاكتشاف المتقدم ممكن فقط مع معلومات العمق الدقيقة.