يولو فيجن شنتشن
شنتشن
انضم الآن

فهم اكتشاف الكائنات ثلاثية الأبعاد وتطبيقاتها

أبيرامي فينا

4 دقائق قراءة

12 سبتمبر 2024

استكشف كيفية عمل اكتشاف الكائنات ثنائية وثلاثية الأبعاد، والاختلافات الرئيسية بينهما، وتطبيقاتهما في مجالات مثل المركبات ذاتية القيادة والروبوتات والواقع المعزز.

على مر السنين، أصبح اكتشاف الكائنات أكثر تقدمًا. لقد تطور من التعرف على الكائنات في صور بسيطة ثنائية الأبعاد (2D) إلى تحديد الكائنات في العالم ثلاثي الأبعاد (3D) المعقد من حولنا. تم تطوير التقنيات المبكرة مثل مطابقة القوالب، والتي تضمنت العثور على الكائنات عن طريق مقارنة أجزاء من الصورة بصور مرجعية مخزنة، في السبعينيات وشكلت الأساس لاكتشاف الكائنات ثنائية الأبعاد. في التسعينيات، أتاح إدخال تقنيات مثل LIDAR (الكشف عن الضوء وتحديد المدى) للأنظمة التقاط معلومات العمق والمكانية بسهولة أكبر. اليوم، طرق الدمج متعددة الوسائط، التي تجمع بين الصور ثنائية الأبعاد والبيانات ثلاثية الأبعاد، مهدت الطريق لأنظمة اكتشاف الكائنات ثلاثية الأبعاد عالية الدقة.

__wf_reserved_inherit
الشكل 1. مثال على اكتشاف الكائنات ثلاثية الأبعاد.

في هذه المقالة، سوف نستكشف ماهية اكتشاف الكائنات ثلاثية الأبعاد، وكيف يعمل، وكيف يختلف عن اكتشاف الكائنات ثنائية الأبعاد. سنناقش أيضًا بعض تطبيقات اكتشاف الكائنات ثلاثية الأبعاد. هيا بنا نبدأ!

نظرة عامة على اكتشاف الكائنات ثنائية الأبعاد

قبل أن نلقي نظرة على اكتشاف الكائنات ثلاثية الأبعاد، دعنا نفهم كيف يعمل اكتشاف الكائنات ثنائية الأبعاد. اكتشاف الكائنات ثنائية الأبعاد هو تقنية رؤية الكمبيوتر التي تمكن أجهزة الكمبيوتر من التعرف على الكائنات وتحديد موقعها داخل صور مسطحة ثنائية الأبعاد. وهو يعمل عن طريق تحليل الموضع الأفقي (X) والرأسي (Y) للكائن في الصورة. على سبيل المثال، إذا قمت بتمرير صورة للاعبين في ملعب كرة قدم إلى نموذج اكتشاف الكائنات ثنائية الأبعاد مثل Ultralytics YOLOv8، فيمكنه تحليل الصورة و رسم مربعات محيطة حول كل كائن (في هذه الحالة، اللاعبين)، وتحديد موقعهم بدقة.

__wf_reserved_inherit
الشكل 2. يتم استخدام YOLOv8 2D لاكتشاف الكائنات لاكتشاف اللاعبين في ملعب كرة قدم.

ومع ذلك، فإن اكتشاف الكائنات ثنائية الأبعاد له قيوده. نظرًا لأنه يأخذ في الاعتبار بعدين فقط، فإنه لا يفهم العمق. وهذا يمكن أن يجعل من الصعب الحكم على مدى بعد أو حجم الكائن. على سبيل المثال، قد يظهر كائن كبير بعيد بنفس حجم كائن أصغر أقرب، مما قد يكون مربكًا. يمكن أن يتسبب نقص معلومات العمق في حدوث أخطاء في تطبيقات مثل الروبوتات أو الواقع المعزز، حيث تكون معرفة الحجم الحقيقي ومسافة الكائنات ضرورية. هذا هو المكان الذي تظهر فيه الحاجة إلى اكتشاف الكائنات ثلاثية الأبعاد.

اكتساب الوعي المكاني من خلال اكتشاف الكائنات ثلاثية الأبعاد

اكتشاف الكائنات ثلاثية الأبعاد هو تقنية رؤية الكمبيوتر متقدمة تسمح لأجهزة الكمبيوتر بتحديد الكائنات في فضاء ثلاثي الأبعاد، مما يمنحها فهمًا أعمق بكثير للعالم من حولها. على عكس اكتشاف الكائنات ثنائية الأبعاد، يأخذ اكتشاف الكائنات ثلاثية الأبعاد في الاعتبار أيضًا بيانات حول العمق. توفر معلومات العمق مزيدًا من التفاصيل، مثل مكان وجود الكائن، وحجمه، ومدى بعده، وكيف يتم وضعه في العالم ثلاثي الأبعاد الحقيقي. ومن المثير للاهتمام أن الاكتشاف ثلاثي الأبعاد يمكنه أيضًا التعامل مع المواقف التي يخفي فيها كائن ما كائنًا آخر جزئيًا (التداخلات) بشكل أفضل ويظل موثوقًا به حتى عند تغير المنظور. إنها أداة قوية لحالات الاستخدام التي تحتاج إلى وعي مكاني دقيق.

يعد اكتشاف الكائنات ثلاثية الأبعاد أمرًا حيويًا لتطبيقات مثل السيارات ذاتية القيادة و الروبوتات وأنظمة الواقع المعزز. وهو يعمل باستخدام أجهزة استشعار مثل LiDAR أو الكاميرات المجسمة. تنشئ هذه المستشعرات خرائط ثلاثية الأبعاد مفصلة للبيئة، تُعرف باسم السحب النقطية أو خرائط العمق. ثم يتم تحليل هذه الخرائط لاكتشاف الكائنات في بيئة ثلاثية الأبعاد.

__wf_reserved_inherit
الشكل 3. اكتشاف الكائنات ثلاثية الأبعاد لسيارة.

هناك العديد من نماذج رؤية الكمبيوتر المتقدمة المصممة خصيصًا للتعامل مع البيانات ثلاثية الأبعاد، مثل السحب النقطية. على سبيل المثال، VoteNet هو نموذج يستخدم طريقة تسمى تصويت هوف للتنبؤ بمكان مركز الكائن في سحابة نقطية، مما يسهل اكتشاف الكائنات و تصنيفها بدقة. وبالمثل، VoxelNet هو نموذج يحول السحب النقطية إلى شبكة من المكعبات الصغيرة تسمى فوكسل لتبسيط تحليل البيانات.

الاختلافات الرئيسية بين اكتشاف الكائنات ثنائية الأبعاد وثلاثية الأبعاد

الآن بعد أن فهمنا اكتشاف الكائنات ثنائية الأبعاد وثلاثية الأبعاد، دعنا نستكشف الاختلافات الرئيسية بينهما. يعد اكتشاف الكائنات ثلاثية الأبعاد أكثر تعقيدًا من اكتشاف الكائنات ثنائية الأبعاد لأنه يعمل مع السحب النقطية. يتطلب تحليل البيانات ثلاثية الأبعاد، مثل السحب النقطية التي تم إنشاؤها بواسطة LiDAR، قدرًا أكبر من الذاكرة وقوة الحوسبة. هناك اختلاف آخر وهو تعقيد الخوارزميات المستخدمة. يجب أن تكون نماذج اكتشاف الكائنات ثلاثية الأبعاد أكثر تعقيدًا لتتمكن من التعامل مع تقدير العمق وتحليل الشكل ثلاثي الأبعاد وتحليل اتجاه الكائن. 

__wf_reserved_inherit
الشكل 4. اكتشاف الكائنات ثنائية الأبعاد مقابل ثلاثية الأبعاد.

تتضمن نماذج الكشف عن الأجسام ثلاثية الأبعاد عمليات حسابية ورياضية أثقل من نماذج الكشف عن الأجسام ثنائية الأبعاد. قد تكون معالجة البيانات ثلاثية الأبعاد في الوقت الفعلي أمرًا صعبًا بدون أجهزة متطورة وتحسينات. ومع ذلك، فإن هذه الاختلافات تجعل الكشف عن الأجسام ثلاثية الأبعاد أكثر ملاءمة للتطبيقات التي تتطلب فهمًا مكانيًا أفضل. من ناحية أخرى، غالبًا ما يستخدم الكشف عن الأجسام ثنائية الأبعاد في تطبيقات أبسط مثل الأنظمة الأمنية التي تحتاج إلى التعرف على الصور أو تحليل الفيديو

إيجابيات وسلبيات الكشف عن الأجسام ثلاثية الأبعاد

يوفر الكشف عن الأجسام ثلاثية الأبعاد العديد من المزايا التي تجعله متميزًا عن طرق الكشف عن الأجسام ثنائية الأبعاد التقليدية. من خلال التقاط جميع الأبعاد الثلاثة للجسم، فإنه يوفر تفاصيل دقيقة حول موقعه وحجمه واتجاهه بالنسبة للعالم الحقيقي. هذه الدقة ضرورية لتطبيقات مثل السيارات ذاتية القيادة، حيث تعتبر معرفة الموقع الدقيق للعقبات أمرًا حيويًا للسلامة. ميزة أخرى لاستخدام الكشف عن الأجسام ثلاثية الأبعاد هي أنه يمكن أن يساعدك في الحصول على فهم أفضل لكيفية ارتباط الكائنات المختلفة ببعضها البعض في الفضاء ثلاثي الأبعاد. 

__wf_reserved_inherit
الشكل 5. حل الانسدادات باستخدام الكشف عن الأجسام ثلاثية الأبعاد.

على الرغم من الفوائد العديدة، هناك أيضًا قيود متعلقة بالكشف عن الأجسام ثلاثية الأبعاد. فيما يلي بعض التحديات الرئيسية التي يجب وضعها في الاعتبار:

  • تكاليف حسابية أعلى: يتطلب العمل مع البيانات ثلاثية الأبعاد موارد أجهزة أكثر قوة، ويمكن أن تتراكم التكلفة بسرعة.
  • متطلبات بيانات أكثر تعقيدًا: غالبًا ما يعتمد الكشف عن الأجسام ثلاثية الأبعاد على أجهزة استشعار متقدمة مثل الليدار (LiDAR)، والتي قد تكون باهظة الثمن وغير متوفرة بالضرورة في جميع البيئات.
  • جمع ومعالجة البيانات: إن متطلبات البيانات المعقدة للكشف عن الأجسام ثلاثية الأبعاد تجعل جمع وإعداد ومعالجة مجموعات البيانات الكبيرة اللازمة لتدريب النماذج أمرًا مستهلكًا للوقت ومكلفًا للموارد.
  • زيادة تعقيد النموذج: النماذج المستخدمة للكشف عن الأجسام ثلاثية الأبعاد تكون بشكل عام أكثر تعقيدًا، مع طبقات ومعلمات أكثر من تلك المستخدمة للكشف عن الأجسام ثنائية الأبعاد. 

تطبيقات الكشف عن الأجسام ثلاثية الأبعاد

الآن بعد أن ناقشنا إيجابيات وسلبيات الكشف عن الأجسام ثلاثية الأبعاد، دعنا نلقي نظرة فاحصة على بعض حالات استخدام الكشف عن الأجسام ثلاثية الأبعاد.

المركبات ذاتية القيادة

في السيارات ذاتية القيادة، يعد الكشف عن الأجسام ثلاثية الأبعاد أمرًا حيويًا لإدراك المناطق المحيطة بالسيارة. فهو يتيح للمركبات اكتشاف المشاة والسيارات الأخرى والعقبات. كما يوفر معلومات دقيقة حول موقعها وحجمها واتجاهها في العالم الحقيقي. البيانات التفصيلية التي يتم الحصول عليها من خلال أنظمة الكشف عن الأجسام ثلاثية الأبعاد مفيدة لتجربة قيادة ذاتية أكثر أمانًا للركاب على متنها. 

__wf_reserved_inherit
الشكل 6. استخدام الكشف عن الأجسام ثلاثية الأبعاد في المركبات ذاتية القيادة. (المصدر: towardsdatascience.com)

الروبوتات

تستخدم الأنظمة الروبوتية الكشف عن الأجسام ثلاثية الأبعاد للعديد من التطبيقات. إنهم يستخدمونه للتنقل عبر أنواع مختلفة من البيئات، والتقاط الأشياء ووضعها، والتفاعل مع محيطهم. تعتبر حالات الاستخدام هذه مهمة بشكل خاص في البيئات الديناميكية مثل المستودعات أو مرافق التصنيع، حيث تحتاج الروبوتات إلى فهم التخطيطات ثلاثية الأبعاد لتعمل بفعالية. 

__wf_reserved_inherit
الشكل 7. روبوت متنقل يستخدم الكشف عن الأجسام ثلاثية الأبعاد.

الواقع المعزز والواقع الافتراضي (AR/VR)

حالة استخدام أخرى مثيرة للاهتمام للكشف عن الأجسام ثلاثية الأبعاد هي في تطبيقات الواقع المعزز والواقع الافتراضي. يتم استخدام الكشف عن الأجسام ثلاثية الأبعاد لوضع الكائنات الافتراضية بدقة في بيئة واقع افتراضي أو واقع معزز واقعية. القيام بذلك يزيد من تجربة المستخدم الشاملة لهذه التقنيات. كما يسمح لأنظمة الواقع الافتراضي/الواقع المعزز بالتعرف على الأشياء المادية وتتبعها، مما يخلق بيئات غامرة حيث تتفاعل العناصر الرقمية والمادية بسلاسة. على سبيل المثال، يمكن للاعبين الذين يستخدمون سماعات الرأس AR/VR الحصول على تجربة أكثر غامرة بمساعدة الكشف عن الأجسام ثلاثية الأبعاد. إنه يجعل التفاعلات مع الكائنات الافتراضية في المساحات ثلاثية الأبعاد أكثر جاذبية.

__wf_reserved_inherit
الشكل 8. مثال على استخدام التعرف على الكائنات ثلاثية الأبعاد لتطبيق AR. 

أفكار أخيرة حول الكشف عن الأجسام ثلاثية الأبعاد

يمكّن الكشف عن الأجسام ثلاثية الأبعاد الأنظمة من فهم العمق والمساحة بشكل أكثر فعالية من طرق الكشف عن الأجسام ثنائية الأبعاد. إنه يلعب دورًا رئيسيًا في تطبيقات مثل السيارات ذاتية القيادة والروبوتات والواقع المعزز/الواقع الافتراضي، حيث تعتبر معرفة حجم الكائن ومسافته وموضعه أمرًا مهمًا. في حين أن الكشف عن الأجسام ثلاثية الأبعاد يتطلب المزيد من قوة المعالجة والبيانات المعقدة، فإن قدرته على توفير معلومات دقيقة ومفصلة تجعله أداة قيمة للغاية في العديد من المجالات. مع تقدم التكنولوجيا، من المرجح أن تتحسن كفاءة وسهولة الوصول إلى الكشف عن الأجسام ثلاثية الأبعاد، مما يمهد الطريق لاعتماد أوسع وابتكار عبر مختلف الصناعات.

ابق على اتصال مع مجتمعنا لمواكبة آخر التطورات في مجال الذكاء الاصطناعي! قم بزيارة مستودع GitHub الخاص بنا لترى كيف نستخدم الذكاء الاصطناعي لإنشاء حلول متطورة في صناعات مثل التصنيع و الرعاية الصحية. 🚀

لنبنِ مستقبل
الذكاء الاصطناعي معًا!

ابدأ رحلتك مع مستقبل تعلم الآلة

ابدأ مجانًا
تم نسخ الرابط إلى الحافظة