مجالات الإشعاع العصبي (NeRF)
اكتشف قوة حقول الإشعاع العصبي (NeRF) للمشاهد الواقعية ثلاثية الأبعاد، والواقع الافتراضي/الواقع المعزز، والروبوتات، وإنشاء المحتوى. استكشف الآن!
حقول الإشعاع العصبي (NeRF) هي تقنية تعلُّم عميق قوية تُستخدم لإنشاء مشاهد ثلاثية الأبعاد مذهلة من مجموعة من الصور ثنائية الأبعاد. بشكل أساسي، يتعلم نموذج NeRF تمثيلًا حجميًا مستمرًا للمشهد، مما يسمح له بإنشاء مشاهد جديدة وواقعية من أي زاوية. وقد أحدثت هذه الطريقة، التي تم تقديمها في ورقة بحثية رائدة لعام 2020، ثورة في إنشاء المحتوى ثلاثي الأبعاد من خلال تمكين توليف مشاهد واقعية ومفصلة للغاية. ويتمثل جوهر NeRF في شبكة عصبية صغيرة (NN) تعمل كتمثيل "ضمني" للمشهد، وهو نهج مختلف جذرياً عن النماذج ثلاثية الأبعاد التقليدية مثل الشبكات أو فوكسلات الأشكال.
كيف تعمل مجالات الإشعاع العصبي؟
يتعلم نموذج NeRF تعيين إحداثيات ثلاثية الأبعاد (نقطة في الفضاء) واتجاه عرض ثنائي الأبعاد إلى لون وكثافة محددين. لعرض صورة من كاميرا افتراضية، يتتبع النموذج الأشعة من وجهة نظر الكاميرا عبر المشهد. يستعلم الشبكة العصبية في العديد من النقاط على طول كل شعاع للتنبؤ باللون والكثافة في كل نقطة. ثم يتم دمج هذه القيم باستخدام عملية تُعرف باسم العرض الحجمي لحساب اللون النهائي للبكسل في الصورة ثنائية الأبعاد.
من خلال تدريب هذه الشبكة العصبية على مجموعة من الصور المدخلة لمشهد من مواضع كاميرا معروفة، يتم تحسين أوزان النموذج لإعادة إنتاج تلك الصور الأصلية بدقة. وبمجرد التدريب، يمكن للشبكة العصبية الجديدة توليد مناظر جديدة من خلال عرض الأشعة من مواضع كاميرا جديدة غير مرئية. تعد هذه التقنية جزءًا من المجال الأوسع للذكاء الاصطناعي التوليدي وتعتمد على أطر عمل شائعة مثل PyTorch و TensorFlow للتنفيذ.
التطبيقات والأمثلة الواقعية
تتمتع تقنية NeRF بمجموعة واسعة من التطبيقات، حيث تعمل على سد الفجوة بين الصور ثنائية الأبعاد والتجارب التفاعلية ثلاثية الأبعاد.
- إعادة بناء المشهد ثلاثي الأبعاد: تتفوق تقنية NeRFs في إنشاء توائم رقمية لبيئات العالم الحقيقي والأشياء. ومن الأمثلة البارزة على ذلك "العرض الغامر" في خرائط جوجل، والذي يستخدم تقنية NeRFs لبناء نماذج ثلاثية الأبعاد تفاعلية مفصلة وتفاعلية للمدن. وهذا له تطبيقات في التخطيط الحضري والسياحة الافتراضية والحفاظ على التراث الثقافي.
- المؤثرات البصرية (VFX) والترفيه: القدرة على توليد مناظر واقعية لا تقدر بثمن في صناعة الأفلام وألعاب الفيديو. يمكن استخدام تقنية NeRFs لإنشاء مجموعات افتراضية واقعية ورقمنة الممثلين وتوليد مؤثرات بصرية معقدة يصعب تحقيقها بالطرق التقليدية. تعمل شركات مثل لوما للذكاء الاصطناعي على تطوير أدوات لجعل هذه التكنولوجيا أكثر سهولة.
- الروبوتات والأنظمة المستقلة: بالنسبة للمركبات والروبوتات ذاتية القيادة، يعد فهم البيئة ثلاثية الأبعاد أمراً بالغ الأهمية للملاحة والتفاعل. يمكن أن توفر أجهزة الترددات الراديوية الجديدة خريطة ثلاثية الأبعاد غنية ومفصلة من بيانات المستشعرات، مما يحسن قدرة الروبوت على إدراك البيئة المحيطة به.
- التجارة الإلكترونية وتجارة التجزئة: يمكن استخدام NeRF لإنشاء نماذج تفاعلية ثلاثية الأبعاد للمنتجات، مما يسمح للعملاء بمشاهدة العناصر من أي زاوية عبر الإنترنت، مما يعزز تجربة التسوق.
لقد جعلت مشاريع مثل Nerfstudio و NVIDIA's Instant-NGP (NERFs NeRFs الفوري) من التدريب على NeRFs وتجربتها أسرع وأسهل بكثير.
الترددات الراديوية الجديدة مقابل تقنيات الرؤية الحاسوبية الأخرى
من المهم التمييز بين تقنية NeRF والتقنيات الأخرى في مجال الرؤية الحاسوبية (CV).
- تقنية NeRF مقابل القياس التصويري: يُعدّ القياس التصويري الضوئي تقنية تقليدية تنشئ أيضًا نماذج ثلاثية الأبعاد من الصور، لكنها عادةً ما تنتج هندسة واضحة مثل شبكة مضلعة. وعلى النقيض من ذلك، تُنشئ تقنية NeRFs تمثيلاً ضمنياً مستمراً. وهذا يسمح لأجهزة NeRFs بالتقاط تأثيرات بصرية معقدة مثل الشفافية والانعكاسات والتفاصيل الدقيقة بشكل أكثر فعالية من التصوير التصوير الفوتوغرافي القياسي.
- NeRF مقابل اكتشاف الأجسام: تم تصميم نماذج مثل Ultralytics YOLO للكشف عن الكائنات وتجزئة الصور والمهام التحليلية الأخرى. فهي تحدد ما هو موجود في الصورة، غالبًا عن طريق وضع مربعات محددة حول الكائنات. أما NeRF فله هدف مختلف: فهو يقوم بتوليف مناظر جديدة تمامًا للمشهد من مجموعة من الصور. في حين أن كلاهما أداتا ذكاء اصطناعي قويتان، إلا أن اكتشاف الكائنات يحلل الصور الموجودة، بينما يقوم NeRF بإنشاء صور جديدة. يمكنك استخدام نموذج الكشف عن الأجسام لتحديد موقع السيارات في مقطع فيديو، ولكن يمكنك استخدام NeRF لإنشاء نموذج ثلاثي الأبعاد للسيارة يمكنك مشاهدته من أي زاوية.
مع تطور هذا المجال، أصبحت تقنية NeRF والأساليب ذات الصلة أساسية في إنشاء الجيل التالي من المحتوى ثلاثي الأبعاد والغامرة، مع دعم التطوير من خلال منصات مثل Ultralytics HUB التي تسهل تطوير نماذج الذكاء الاصطناعي.