اكتشف قوة مجالات الإشعاع العصبي (NeRF) للمشاهد ثلاثية الأبعاد الواقعية، والواقع الافتراضي/المعزز، والروبوتات، وإنشاء المحتوى. استكشف الآن!
تمثل حقول الإشعاع العصبي (NeRF) تقدماً رائداً في مجال الذكاء الاصطناعي التوليدي المستخدم لتوليف مشاهد ثلاثية الأبعاد واقعية من مجموعة من الصور ثنائية الأبعاد. على عكس مناهج النمذجة ثلاثية الأبعاد التقليدية التي تعتمد على هياكل هندسية واضحة الصريحة مثل المضلعات أو الشبكات، تستخدم الشبكات العصبية شبكة عصبونية (NN) لإنشاء تمثيل تمثيل "ضمني" للمشهد. وهذا يسمح بتوليد وجهات نظر جديدة بدقة عالية, التقاط الظواهر البصرية المعقدة بدقة مثل الإضاءة المتغيرة والانعكاسات والشفافية.
يعمل نموذج NeRF في جوهره كدالة حجمية مستمرة. يأخذ إحداثيات مكانية ثلاثية الأبعاد و واتجاه الرؤية كمدخلات ويخرج اللون المقابل وكثافة الحجم لتلك النقطة. لتقديم صورة صورة جديدة، يستخدم النظام تقنية تسمى التصيير الحجمي. يرسل النموذج أشعة من الكاميرا الافتراضية من خلال كل بكسل في المشهد، مستفسرًا من شبكة التعلم العميق شبكة التعلم العميق في نقاط متعددة على طول الأشعة للتنبؤ باللون والكثافة. ثم يتم تجميع هذه القيم لحساب لون البكسل النهائي.
تتضمن عملية التدريب تحسين أوزان أوزان النموذج بحيث تتطابق المشاهدات المعروضة مع الصور المدخلة الأصلية. يتم تحقيق ذلك عادةً باستخدام أطر مثل PyTorch أو TensorFlow. والنتيجة هي بيئة ثلاثية الأبعاد مفصلة للغاية وقابلة للملاحة بيئة ثلاثية الأبعاد مستمدة بالكامل من بيانات تدريبية تتكون من صور فوتوغرافية قياسية.
توسعت تقنية الترددات الراديوية الجديدة بسرعة خارج نطاق البحث الأكاديمي إلى الصناعات العملية، مما أدى إلى سد الفجوة بين ثنائية الأبعاد والتجارب التفاعلية ثلاثية الأبعاد.
من المهم التمييز بين تقنية NeRF وتقنيات الرؤية ثلاثية الأبعاد والرؤية الأخرى، لأنها تخدم أغراضاً مختلفة ضمن نظام الذكاء الاصطناعي.
على الرغم من أن نماذج Ultralytics ليست مصممة للعرض الحجمي، إلا أنها تلعب دورًا حاسمًا في المعالجة المسبقة المسبق لسير عمل الترددات الراديوية الجديدة. على سبيل المثال، غالبًا ما يتطلب توليد إطار عمل جديد نظيف لجسم معين إخفاء الخلفية. يمكن لنموذج نموذج تجزئة مثيل قوي يمكنه تلقائيًا توليد هذه الأقنعة تلقائيًا.
يوضح المثال التالي كيفية استخدام YOLO11 detect كائن ما وتحديده، وهي خطوة أولى شائعة في تنسيق مجموعة بيانات لإعادة البناء ثلاثي الأبعاد:
from ultralytics import YOLO
# Load the official YOLO11 model
model = YOLO("yolo11n.pt")
# Run inference to detect objects in an image
results = model("path/to/image.jpg")
# Show results to verify detection accuracy before downstream processing
results[0].show()
يتم دعم التطور السريع في هذا المجال من خلال مكتبات مفتوحة المصدر مثل Nerfstudio، التي تبسّط سير عمل التدريب، ومكتبات NVIDIA Instant-NGP، والتي تقلل بشكل كبير من أوقات التدريب. هذه الأدوات تجعل إعادة البناء ثلاثي الأبعاد القوي في متناول الباحثين والمطورين على حد سواء.