Yolo فيجن شنتشن
شنتشن
انضم الآن
مسرد المصطلحات

مجالات إشعاع الأعصاب (NeRF)

اكتشف قوة مجالات الإشعاع العصبي (NeRF) للمشاهد ثلاثية الأبعاد الواقعية، والواقع الافتراضي/المعزز، والروبوتات، وإنشاء المحتوى. استكشف الآن!

تمثل حقول الإشعاع العصبي (NeRF) تقدماً رائداً في مجال الذكاء الاصطناعي التوليدي المستخدم لتوليف مشاهد ثلاثية الأبعاد واقعية من مجموعة من الصور ثنائية الأبعاد. على عكس مناهج النمذجة ثلاثية الأبعاد التقليدية التي تعتمد على هياكل هندسية واضحة الصريحة مثل المضلعات أو الشبكات، تستخدم الشبكات العصبية شبكة عصبونية (NN) لإنشاء تمثيل تمثيل "ضمني" للمشهد. وهذا يسمح بتوليد وجهات نظر جديدة بدقة عالية, التقاط الظواهر البصرية المعقدة بدقة مثل الإضاءة المتغيرة والانعكاسات والشفافية.

كيف تعمل مجالات الإشعاع العصبي

يعمل نموذج NeRF في جوهره كدالة حجمية مستمرة. يأخذ إحداثيات مكانية ثلاثية الأبعاد و واتجاه الرؤية كمدخلات ويخرج اللون المقابل وكثافة الحجم لتلك النقطة. لتقديم صورة صورة جديدة، يستخدم النظام تقنية تسمى التصيير الحجمي. يرسل النموذج أشعة من الكاميرا الافتراضية من خلال كل بكسل في المشهد، مستفسرًا من شبكة التعلم العميق شبكة التعلم العميق في نقاط متعددة على طول الأشعة للتنبؤ باللون والكثافة. ثم يتم تجميع هذه القيم لحساب لون البكسل النهائي.

تتضمن عملية التدريب تحسين أوزان أوزان النموذج بحيث تتطابق المشاهدات المعروضة مع الصور المدخلة الأصلية. يتم تحقيق ذلك عادةً باستخدام أطر مثل PyTorch أو TensorFlow. والنتيجة هي بيئة ثلاثية الأبعاد مفصلة للغاية وقابلة للملاحة بيئة ثلاثية الأبعاد مستمدة بالكامل من بيانات تدريبية تتكون من صور فوتوغرافية قياسية.

التطبيقات في سيناريوهات العالم الحقيقي

توسعت تقنية الترددات الراديوية الجديدة بسرعة خارج نطاق البحث الأكاديمي إلى الصناعات العملية، مما أدى إلى سد الفجوة بين ثنائية الأبعاد والتجارب التفاعلية ثلاثية الأبعاد.

  • إعادة بناء المشهد ثلاثي الأبعاد: تُعدّ تقنية NeRFs محورية في إنشاء توائم رقمية لبيئات العالم الحقيقي. على سبيل المثال، تستخدم خرائط Google هذه التقنية في العرض الغامر لتوليد نماذج ثلاثية الأبعاد غنية ثلاثية الأبعاد غنية وقابلة للاستكشاف للمدن، مما يعزز التنقل والتخطيط الحضري.
  • المؤثرات البصرية (VFX) والإنتاج الافتراضي: في صناعة الترفيه، تسمح الترددات الراديوية الجديدة لصانعي الأفلام برقمنة الممثلين أو البيئات بسرعة. أدوات من شركات مثل لوما للذكاء الاصطناعي لتمكين صانعي المحتوى من التقاط المشاهد باستخدام هاتف ذكي وتقديمها لاستخدامها في ألعاب الفيديو أو الواقع الافتراضي.
  • الروبوتات والتحكم الذاتي: الروبوتات المتقدمة تستخدم أنظمة الروبوتات المتقدمة الترددات الراديوية الجديدة لفهم محيطها بشكل أفضل. محيطها بشكل أفضل. من خلال بناء خرائط ثلاثية الأبعاد كثيفة من مدخلات أجهزة الاستشعار, يمكن للمركبات ذاتية القيادة التنقل في المعقدة بأمان أكبر.
  • توليد البيانات الاصطناعية: يمكن ل NeRFs توليد عدد غير محدود من المناظر الجديدة للأشياء، حيث تعمل كـ بيانات تركيبية عالية الجودة لتدريب نماذج رؤية الحاسوب (CV) الأخرى عندما تكون بيانات العالم الحقيقي عندما تكون البيانات في العالم الحقيقي نادرة.

الترددات الراديوية الجديدة مقابل التقنيات ذات الصلة

من المهم التمييز بين تقنية NeRF وتقنيات الرؤية ثلاثية الأبعاد والرؤية الأخرى، لأنها تخدم أغراضاً مختلفة ضمن نظام الذكاء الاصطناعي.

  • الترددات الراديوية الجديدة مقابل القياس التصويري: في حين أن يبني القياس التصويري الضوئي أيضًا نماذج ثلاثية الأبعاد من الصور، فإنه تنشئ هندسة واضحة (شبكات). تُنشئ تقنية NeRFs تمثيلاً حجميًا مستمرًا، والتي غالبًا ما تكون أفضل في التعامل مع التفاصيل الدقيقة مثل الشعر أو الدخان أو المواد الشفافة التي يصعب على الشبكات التقاطها.
  • الترددات الراديوية الجديدة مقابل الكشف عن الأجسام: تقنيات مثل Ultralytics YOLO11 تركز على الكشف عن الأجسام، والتي تتضمن تحديد وتحديد موقع كائنات معينة داخل الصورة باستخدام الصندوق المحيط. NeRF هي عملية توليدية لـ لعرض المناظر. ومع ذلك، يمكن أن يعمل الاثنان معًا؛ غالبًا ما يُستخدم اكتشاف الكائنات لعزل موضوع الاهتمام قبل تدريب نموذج NeRF.

دمج الترددات الراديوية الجديدة في خطوط أنابيب الرؤية

على الرغم من أن نماذج Ultralytics ليست مصممة للعرض الحجمي، إلا أنها تلعب دورًا حاسمًا في المعالجة المسبقة المسبق لسير عمل الترددات الراديوية الجديدة. على سبيل المثال، غالبًا ما يتطلب توليد إطار عمل جديد نظيف لجسم معين إخفاء الخلفية. يمكن لنموذج نموذج تجزئة مثيل قوي يمكنه تلقائيًا توليد هذه الأقنعة تلقائيًا.

يوضح المثال التالي كيفية استخدام YOLO11 detect كائن ما وتحديده، وهي خطوة أولى شائعة في تنسيق مجموعة بيانات لإعادة البناء ثلاثي الأبعاد:

from ultralytics import YOLO

# Load the official YOLO11 model
model = YOLO("yolo11n.pt")

# Run inference to detect objects in an image
results = model("path/to/image.jpg")

# Show results to verify detection accuracy before downstream processing
results[0].show()

يتم دعم التطور السريع في هذا المجال من خلال مكتبات مفتوحة المصدر مثل Nerfstudio، التي تبسّط سير عمل التدريب، ومكتبات NVIDIA Instant-NGP، والتي تقلل بشكل كبير من أوقات التدريب. هذه الأدوات تجعل إعادة البناء ثلاثي الأبعاد القوي في متناول الباحثين والمطورين على حد سواء.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن