استعدوا لـ YOLO Vision 2025!
25 سبتمبر، 2025
10:00 — 18:00 بتوقيت بريطانيا الصيفي
حدث هجين
مؤتمر Yolo Vision 2024
مسرد المصطلحات

الكشف عن الكائنات ثلاثية الأبعاد

استكشف الكشف عن الأجسام ثلاثية الأبعاد: كيف يقوم كل من LiDAR والسحب النقطية والتعلم العميق بإنشاء مربعات حدودية ثلاثية الأبعاد دقيقة للمركبات ذاتية القيادة والروبوتات والواقع المعزز.

الكشف عن الأجسام ثلاثية الأبعاد هو تقنية متقدمة للرؤية الحاسوبية (CV) لتحديد الأجسام وتحديد مواقعها في فضاء ثلاثي الأبعاد. على عكس الكشف عن الأجسام ثنائية الأبعاد، الذي يعمل على الصور المسطحة، يوفر الكشف ثلاثي الأبعاد معلومات عمق مهمة، مما يسمح للنظام بفهم حجم الجسم في العالم الحقيقي وموقعه واتجاهه. تتيح هذه القدرة إدراكاً مكانياً أعمق وأدق بكثير، وهو أمر ضروري للعديد من تطبيقات الذكاء الاصطناعي الحديثة.

كيف يعمل الكشف عن الكائنات ثلاثية الأبعاد

تعتمد أنظمة الكشف عن الأجسام ثلاثية الأبعاد عادةً على أجهزة استشعار متخصصة لالتقاط هندسة البيئة المحيطة. وتشمل مصادر البيانات الشائعة ما يلي:

  • ليدار (الكشف عن الضوء وتحديد المدى): تستخدم هذه التقنية نبضات الليزر لقياس المسافات الدقيقة للأجسام، مما يؤدي إلى إنشاء خريطة ثلاثية الأبعاد مفصلة تسمى سحابة نقطية. السحابة النقطية هي مجموعة من نقاط البيانات في الفضاء ثلاثي الأبعاد، والتي تمثل بدقة الأسطح الخارجية للأجسام.
  • الكاميرات المجسمة: على غرار الرؤية البشرية، تستخدم الكاميرات المجسمة عدستين أو أكثر لالتقاط صور من زوايا مختلفة قليلاً. من خلال مقارنة هذه الصور، يمكن للنظام حساب العمق وإنشاء تمثيل ثلاثي الأبعاد للمشهد.
  • خرائط العمق: يمكن إنشاء هذه الخرائط بواسطة أجهزة استشعار مختلفة، بما في ذلك كاميرات الاستريو أو كاميرات وقت الرحلة (ToF)، وتوفر قيمة المسافة لكل بكسل.

وبمجرد التقاط هذه البيانات ثلاثية الأبعاد، تقوم نماذج التعلّم العميق المتخصصة بتحليلها لتحديد الأجسام وتحديد مواقعها. صُممت نماذج مثل VoxelNet و VoteNet لمعالجة السحب النقطية غير المهيكلة أو شبكات فوكسل (المكافئات ثلاثية الأبعاد للبكسل) للتنبؤ بالمربعات المحددة ثلاثية الأبعاد حول الأجسام.

اكتشاف الأجسام ثلاثية الأبعاد مقابل ثنائية الأبعاد

يتمثل الفرق الأساسي بين الكشف عن الأجسام ثنائية الأبعاد وثلاثية الأبعاد في بُعد المكان الذي تعمل فيه. يحدد الاكتشاف ثنائي الأبعاد موقع الجسم على صورة مسطحة باستخدام مربع مستطيل محدد بإحداثيات X و Y. ومع ذلك، فإنه يفتقر إلى إدراك العمق، مما يجعل من الصعب الحكم على الحجم أو المسافة الحقيقية للجسم. على سبيل المثال، في صورة ثنائية الأبعاد، قد تظهر شاحنة كبيرة بعيدة بنفس حجم سيارة صغيرة أقرب بكثير في صورة ثنائية الأبعاد.

يتغلب الكشف عن الأجسام ثلاثية الأبعاد على هذا القيد من خلال إضافة المحور Z للعمق. وهذا يسمح لها بتحديد ليس فقط ماهية الجسم ومكانه في الإطار، ولكن أيضًا تحديد بُعده وأبعاده المادية واتجاهه في الفضاء ثلاثي الأبعاد. على الرغم من أن هذا يوفر فهمًا أكثر ثراءً للبيئة، إلا أنه يأتي أيضًا بتكاليف حسابية أعلى ومتطلبات بيانات أكثر تعقيدًا.

تطبيقات واقعية

المعلومات المكانية المفصلة التي يوفرها الكشف عن الأجسام ثلاثية الأبعاد لا تقدر بثمن في العديد من المجالات.

  1. المركبات ذاتية القيادة: هذا هو أحد أكثر التطبيقات أهمية. فالسيارات ذاتية القيادة من شركات مثل Waymo تستخدم نظام LiDAR والكاميرات لبناء نموذج ثلاثي الأبعاد في الوقت الحقيقي لمحيطها. وهذا يسمح للمركبة باكتشاف السيارات الأخرى والمشاة وراكبي الدراجات بدقة، والتنبؤ بتحركاتهم والتنقل بأمان.
  2. الروبوتات والأتمتة: في المستودعات ومرافق التصنيع، تستخدم الروبوتات الكشف ثلاثي الأبعاد لتحديد الأجسام والإمساك بها وتحريكها بدقة عالية. كما أنه أساسي لتطبيقات الواقع المعزز (AR) ، مما يتيح وضع الأجسام الافتراضية بشكل واقعي والتفاعل مع العالم المادي.

على الرغم من أن اكتشاف الأجسام ثلاثية الأبعاد أكثر تعقيدًا واستهلاكًا للموارد من الطرق ثنائية الأبعاد، إلا أن قدرتها على توفير فهم مكاني دقيق يجعلها تقنية لا غنى عنها للجيل القادم من الأنظمة الذكية.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن
تم نسخ الرابط إلى الحافظة