Yolo فيجن شنتشن
شنتشن
انضم الآن
مسرد المصطلحات

مجالات إشعاع الأعصاب (NeRF)

Explore how Neural Radiance Fields (NeRF) revolutionize 3D scene synthesis. Learn to use [YOLO26](https://docs.ultralytics.com/models/yolo26/) for NeRF data prep.

تمثل حقول الإشعاع العصبي (NeRF) تطوراً رائداً في الرؤية الحاسوبية (CV) و الذكاء الاصطناعي التوليدي، وهي مصممة لتركيب مشاهد ثلاثية الأبعاد واقعية من مجموعة متفرقة من الصور ثنائية الأبعاد. على عكس أساليب النمذجة ثلاثية الأبعاد التقليدية التي تعتمد على هياكل هندسية واضحة مثل المضلعات أو الشبكات أو السحب النقطية، تستخدم NeRF شبكة عصبية (NN) لتعلم تمثيل "ضمني" للمشهد. من خلال تعيين الإحداثيات المكانية واتجاهات العرض لقيم الألوان والكثافة، يمكن لـ NeRFs عرض وجهات نظر جديدة بدقة استثنائية، والتقاط التأثيرات البصرية المعقدة بدقة مثل الانعكاسات والشفافية والإضاءة المتغيرة التي يصعب غالبًا إعادة إنتاجها باستخدام التصوير الفوتوغرافي القياسي.

كيف تعمل مجالات الإشعاع العصبي

في جوهرها، تقوم NeRF بنمذجة مشهد كدالة حجمية مستمرة. عادةً ما يتم تحديد معلمات هذه الدالة بواسطة شبكة تعلم عميق (DL) متصلة بالكامل. تبدأ العملية بمرور الأشعة، حيث يتم إرسال الأشعة من كاميرا افتراضية عبر كل بكسل من مستوى الصورة المطلوب إلى الفضاء ثلاثي الأبعاد.

بالنسبة للنقاط التي تم أخذ عينات منها على طول كل شعاع، تأخذ الشبكة مدخلاً خماسي الأبعاد — يتألف من الموقع المكاني ثلاثي الأبعاد ($x, y, z$) و اتجاه الرؤية ثنائي الأبعاد ($\theta, \phi$) — وتخرج اللون المنبعث وكثافة الحجم (العتامة) في تلك النقطة. باستخدام تقنيات متجذرة في عرض الحجم، يتم تجميع هذه القيم المأخوذة لحساب اللون النهائي للبكسل. يتم تدريب الشبكة عن طريق تقليل الفرق بين البكسل المعروض والبكسل الفعلي من بيانات التدريب الأصلية، مما يؤدي إلى تحسين أوزان النموذج بشكل فعال لتذكر الخصائص البصرية للمشهد .

تطبيقات واقعية

انتقلت تقنية NeRF بسرعة من البحث الأكاديمي إلى الأدوات العملية، مما أثر على مختلف الصناعات من خلال سد الفجوة بين التصوير الفوتوغرافي الثابت والبيئات ثلاثية الأبعاد التفاعلية.

  • التجارة الإلكترونية الغامرة: يستفيد تجار التجزئة من NeRFs لإنشاء عروض تفاعلية للمنتجات. من خلال معالجة بعض الصور لسلعة ما، يمكن للذكاء الاصطناعي في حلول البيع بالتجزئة إنشاء تمثيل ثلاثي الأبعاد يمكن للعملاء مشاهدته من أي زاوية، مما يوفر تجربة أكثر ثراءً من الصور الثابتة.
  • الإنتاج الافتراضي والمؤثرات البصرية: تستخدم صناعة السينما تقنية NeRF لالتقاط مواقع حقيقية وتحويلها إلى خلفيات واقعية للإنتاج الافتراضي. وهذا يسمح للمخرجين بوضع الممثلين في بيئات رقمية تتصرف بشكل واقعي مع حركات الكاميرا، مما يقلل من الحاجة إلى التصوير المكلف في المواقع الحقيقية.
  • محاكاة الروبوتات: يتطلب تدريب المركبات ذاتية القيادة والطائرات بدون طيار كميات هائلة من البيانات. يمكن لـ NeRFs إعادة بناء بيئات معقدة من العالم الحقيقي من بيانات المستشعرات، مما يخلق أرضية محاكاة عالية الدقة حيث يمكن اختبار خوارزميات الروبوتات بأمان وبشكل مكثف.

التمييز عن المفاهيم ذات الصلة

من المفيد التمييز بين NeRF والتقنيات ثلاثية الأبعاد وتقنيات الرؤية الأخرى لفهم فائدتها المحددة.

  • NeRF مقابل التصوير المساحي الضوئي: يقوم التصوير المساحي الضوئي بإعادة بناء هندسة السطح (الشبكات) بشكل صريح من خلال مطابقة الميزات عبر الصور. على الرغم من فعاليته في الأسطح البسيطة، إلا أنه غالبًا ما يواجه صعوبات مع التأثيرات "غير اللامبرتية" مثل الأسطح اللامعة والهياكل الرقيقة (مثل الشعر) أو الشفافية. تتفوق NeRFs في هذه المجالات لأنها تقوم بنمذجة الحجم ونقل الضوء بشكل مباشر.
  • NeRF مقابل الكشف عن الكائنات ثلاثية الأبعاد: بينما يولد NeRF بيانات بصرية، يركز الكشف عن الكائنات ثلاثية الأبعاد على فهم محتوى المشهد. تحدد نماذج الكشف الكائنات وتحدد مواقعها باستخدام مربعات الحدود، بينما يهتم NeRFs بعرض مظهر المشهد.
  • NeRF مقابل تقدير العمق: تقدير العمق يتنبأ بمسافة البكسلات من الكاميرا، مما ينتج عنه خريطة عمق. NeRFs تتعلم بشكل ضمني الهندسة لعرض الصور، لكن ناتجها الأساسي هو العرض المركب بدلاً من خريطة عمق واضحة.

دمج الترددات الراديوية الجديدة في خطوط أنابيب الرؤية

غالبًا ما يتطلب تدريب NeRF عالي الجودة بيانات نظيفة. يمكن أن تتسبب الضوضاء الخلفية أو الأجسام المتحركة في ظهور تشوهات "شبحية" في العرض النهائي. للتخفيف من ذلك، غالبًا ما يستخدم المطورون نماذج تقسيم المثيلات لإخفاء موضوع الاهتمام تلقائيًا قبل تدريب NeRF.

تسمح Ultralytics وواجهة Python بدمج التجزئة بسلاسة في سير عمل المعالجة المسبقة هذا. يوضح المثال التالي كيفية استخدام YOLO26 لإنشاء أقنعة لمجموعة من الصور، وإعدادها لإعادة البناء ثلاثي الأبعاد.

from ultralytics import YOLO

# Load the YOLO26 segmentation model
model = YOLO("yolo26n-seg.pt")

# Run inference to detect and segment objects
# Saving results creates masks useful for NeRF preprocessing
results = model("scene_image.jpg", save=True)

# Access the binary masks for the detected objects
masks = results[0].masks.data
print(f"Generated {len(masks)} masks for NeRF training.")

من خلال الجمع بين دقة التجزئة والقوة التوليدية لـ NeRFs، يمكن للمهندسين إنشاء خطوط إنتاج قوية لتوليد البيانات الاصطناعية ، مما يتيح إنشاء عينات تدريب غير محدودة لمهام أخرى لاحقة.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن