Yolo فيجن شنتشن
شنتشن
انضم الآن
مسرد المصطلحات

التصوير العصبي

اكتشف كيف يجمع "الرسم العصبي" بين التعلم العميق والرسومات لإنشاء مشاهد ثلاثية الأبعاد واقعية. تعلم اليوم كيفية تدريب Ultralytics باستخدام البيانات الاصطناعية.

يمثل العرض العصبي نقطة التقاء رائدة بين التعلم العميق ورسومات الحاسوب التقليدية. من خلال استخدام الشبكات العصبية الاصطناعية لتوليد الصور ومقاطع الفيديو أو معالجتها انطلاقًا من تمثيلات البيانات ثنائية أو ثلاثية الأبعاد، فإن هذا النهج يتجاوز الحسابات المعقدة القائمة على الفيزياء التي تتطلبها محركات العرض التقليدية. بدلاً من تحديد الهندسة والإضاءة والأنسجة يدويًا، تتعلم الشبكات العصبية هذه الخصائص مباشرةً من كميات هائلة من البيانات المرئية، مما يتيح إنشاء بيئات واقعية، ووجهات نظر مبتكرة، وأنسجة شديدة التعقيد في جزء بسيط من الوقت.

التمييز بين المفاهيم الرئيسية

عند استكشاف هذا المجال، من المهم التمييز بين "العرض العصبي" والتقنيات المحددة التي تندرج تحت مظلته:

  • مجالات الإشعاع العصبي (NeRF): تقنية فرعية شائعة جدًا في مجال العرض العصبي تستخدم شبكات عصبية متصلة بالكامل لتحسين دالة مشهد حجمي مستمر، مما يتيح إنشاء مشاهد ثلاثية الأبعاد معقدة من مجموعة متفرقة من الصور ثنائية الأبعاد.
  • التقطيع الغاوسي: طريقة أحدث وأكثر كفاءة لإعادة البناء ثلاثي الأبعاد، تعتمد على تمثيل المشاهد باستخدام توزيعات غاوسية ثلاثية الأبعاد بدلاً من الشبكات العصبية. ورغم أنها تُصنف غالبًا ضمن مسارات العرض الحديثة، إلا أنها تعتمد على التحويل إلى صورة نقطية بدلاً من الاستعلامات عبر الشبكات العصبية من أجل التصور في الوقت الفعلي.

يُعد «التصوير العصبي» الفئة الشاملة لاستخدام التعلم العميق في مجال الرسومات، وهو مجال خضع لأبحاث مكثفة من قِبل مؤسسات مثل مختبر علوم الحاسوب والذكاء الاصطناعيالتابع لمعهد ماساتشوستس للتكنولوجيا (MIT) كما يتم نشر العديد من الأبحاث حوله في المؤتمرات الكبرى الخاصة بالرسومات الحاسوبية التي تنظمها جمعية ACM SIGGRAPH.

تطبيقات واقعية

يعمل العرض العصبي على إحداث تغيير جذري في مختلف القطاعات من خلال توفير محتوى مرئي قابل للتطوير وعالي الجودة كان من المستحيل أو مكلفًا للغاية إنتاجه في السابق.

الأدوات والأطر

غالبًا ما يعتمد المطورون على مكتبات متخصصة مثل وثائق PyTorch3D لدمج البيانات ثلاثية الأبعاد مباشرةً في مسارات التعلم العميق، أو مكتبةTensorFlow للحصول على طبقات رسومية قابلة للاشتقاق. وتعتمد نماذج إنشاء الفيديو الحديثة، التي تم تناولها بالتفصيل في المقالات المسبقة المنشورة مؤخرًا على موقع arXiv حول تركيب المشاهد المبتكرة، على مفاهيم العرض هذه لإنتاج مخر جات فيديو فائقة الواقعية باستخدام تقنية OpenAI.

بالنسبة للمتخصصين الذين يسعون إلى بناء أنظمة رؤية حاسوبية متكاملة، يمكن تحميل البيانات الاصطناعية المُعالجة بسلاسة إلى Ultralytics لإدارة مجموعات البيانات ووضع التعليقات التوضيحية عليها عبر السحابة.

تدريب النماذج باستخدام البيانات المركبة

تعد إحدى أقوى حالات استخدام تقنية العرض العصبي هي إنشاء مجموعات بيانات تدريبية للبيئات التي يصعب أو يكون من الخطر فيها جمع البيانات الفعلية. وبمجرد عرض المشهد ثلاثي الأبعاد وتزويده بالتعليقات التوضيحية تلقائيًا، يمكنك تدريب نموذج رؤية متطور مثل Ultralytics بسهولة على الصور الناتجة.

from ultralytics import YOLO

# Load the highly recommended YOLO26 model natively optimized for edge devices
model = YOLO("yolo26n.pt")

# Train the model on a dataset generated via neural rendering pipelines
results = model.train(data="rendered_synthetic_data.yaml", epochs=50, imgsz=640)

من خلال سد الفجوة بين الرسومات الحاسوبية التقليدية والذكاء الاصطناعي الحديث، يظل التصوير العصبي محور اهتمام في المجلات الأكاديمية المرموقة مثل "مجلة IEEE للرؤية الحاسوبية" ومنشورات مختبر ستانفورد للرؤية المتطورة، مما يمهد الطريق للجيل القادم من الحوسبة المكانية والذكاء البصري.

لنبني مستقبل الذكاء الاصطناعي معًا!

ابدأ رحلتك مع مستقبل تعلم الآلة