اكتشف تقنية الرؤية العصبية والمستشعرات القائمة على الأحداث. تعرف على كيفية دمج البيانات منخفضة زمن الاستجابة مع Ultralytics على Ultralytics لتحقيق كفاءة أعلى في الذكاء الاصطناعي.
الرؤية العصبية هي نموذج متطور للرؤية الحاسوبية مستوحى من الآليات البيولوجية للعين والدماغ البشريين. وعلى عكس الكاميرات التقليدية القائمة على الإطارات التي تلتقط صورًا ثابتة على فترات زمنية محددة، تقوم المستشعرات العصبية — التي تُعرف غالبًا باسم مستشعرات الرؤية الديناميكية (DVS) أو الكاميرات الحدثية — بتسجيل التغيرات في شدة الضوء بشكل غير متزامن على مستوى البكسل. وهذا يخلق تدفقًا مستمرًا ومتفرقًا من الأحداث بدلاً من إطارات الصور المتكررة. مع استمرار تطور الذكاء الاصطناعي في عام 2025 وما بعد، أصبح هذا النهج المستوحى من البيولوجيا أمرًا حاسمًا لتطوير أنظمة رؤية منخفضة التأخير وموفرة للطاقة قادرة على العمل في بيئات ديناميكية للغاية.
تعتمد الرؤية العصبية في جوهرها على التآزر بين أجهزة الاستشعار القائمة على الأحداث والشبكات العصبية المتخصصة. عندما تكتشف بكسل ما تغيرًا في السطوع، فإنها ترسل على الفور «حدثًا» يتضمن إحداثياتها المكانية، وختمًا زمنيًا دقيقًا بمقدار ميكروثانية، وكذلك اتجاه التغير (سواء زاد الضوء أم انخفض). تقلل هذه الطريقة بشكل كبير من تكرار البيانات، حيث لا تستهلك الخلفيات الثابتة أي نطاق ترددي تقريبًا.
ولمعالجة تدفقات الأحداث المتفرقة هذه بفعالية، غالبًا ما يستخدم المهندسون الشبكات العصبية النبضية (SNNs)، التي تتواصل عبر نبضات كهربائية منفصلة بدلاً من قيم تنشيط مستمرة، مما يعكس بشكل وثيق عمل الخلايا العصبية البيولوجية. وتتطلب البنية الناتجة قدرة حاسوبية أقل بكثير، مما يجعلها خيارًا مثاليًا للتعلم الآلي على الحافة وأجهزة الحوسبة على الحافة المحدودة الموارد.
في حين تعتمد البنى التقليدية لاكتشاف الأجسام على معالجة مصفوفات كثيفة من شدة البكسلات، فإن الرؤية العصبية تعالج البيانات المكانية-الزمنية غير المتزامنة. ويمنح هذا الاختلاف الجوهري الكاميرات الحدثية مزايا فريدة: دقة زمنية بمستوى الميكروثانية، وتشويش حركة يقترب من الصفر، وإمكانات استثنائية في النطاق الديناميكي العالي (HDR) التي تتفوق في ظروف الإضاءة القاسية.
ومع ذلك، تظل النماذج البصرية القياسية مثل Ultralytics هي المعيار الصناعي في مجال الكشف عن الأجسام للأغراض العامة و تقسيم الصور ، وذلك بفضل دقتها التي لا تضاهى في معالجة البيانات البصرية الكثيفة وتوافقها الواسع مع مسرعات الأجهزة الحديثة مثل وحدات معالجة الرسومات (GPU) و وحدات معالجة التعميق (TPU). وفي حين تقوم النماذج القياسية بتحليل المشاهد بالكامل لفهم السياق، تركز الأنظمة العصبية الاصطناعية بشكل حصري على التغيرات الديناميكية.
أدت السرعة والكفاءة المذهلتان للرؤية العصبية إلى ظهور العديد من التطبيقات الرائدة في عام 2025.
على الرغم من أن الأجهزة المخصصة لشبكات العصبية التوافقية (SNN) لا تزال في مرحلة النضج، فإن مجتمع الرؤية الحاسوبية يتجه بشكل متزايد إلى دمج البيانات القائمة على الأحداث مع أطر العمل التقليدية للتعلم العميق مثل PyTorch و TensorFlow. غالبًا ما يحول الباحثون تدفقات الأحداث الأولية إلى إطارات زائفة أو tensor ، مما يتيح استخدام كاشفات مكانية قوية وعصرية.
على سبيل المثال، يمكنك تجميع بيانات الأحداث رياضيًا في إطار صورة ومعالجتها باستخدام نموذج YOLO26 المُحسَّن للغاية لتحقيق استدلال سريع ومنخفض الاستهلاك للطاقة على مستوى الحافة. ولإنشاء هذه المسارات الهجينة وتدريبها وتوسيع نطاقها بسهولة، تعتمد فرق الشركات على Ultralytics لإدارة مجموعات البيانات من البداية إلى النهاية، و التعليق التلقائي على البيانات، والنشر السلس على السحابة.
from ultralytics import YOLO
# Load the highly efficient Ultralytics YOLO26 edge model
model = YOLO("yolo26n.pt")
# In a neuromorphic setup, sparse event data is often accumulated
# into pseudo-frames before processing with traditional neural networks.
# Here we simulate running inference on an accumulated event-frame.
results = model.predict(source="event_frame_accumulated.jpg", device="cpu", imgsz=320)
# Display bounding box detection results optimized for edge-compute
results[0].show()
يتيح هذا النهج المختلط للمهندسين الاستفادة من زمن الاستجابة المنخفض للغاية الذي تتميز به مستشعرات الأحداث، إلى جانب الدقة القوية والمعترف بها YOLO الحديثة، مما يدفع عجلة الجيل القادم من حلول التعلم الآلي الذكية والعالية الكفاءة.
ابدأ رحلتك مع مستقبل تعلم الآلة