اكتشف كيف يتيح الاستدلال في الوقت الفعلي باستخدام Ultralytics YOLO التنبؤات الفورية لتطبيقات الذكاء الاصطناعي مثل القيادة الذاتية وأنظمة الأمان.
الاستدلال في الوقت الحقيقي هو العملية التي يقبل فيها نموذج التعلّم الآلي المدرّب نموذج تعلّم آلي مدرّب يقبل بيانات المدخلات المباشرة ويُنشئ تنبؤًا فوريًا تقريبًا. في هذا السياق، تعني كلمة "في الوقت الحقيقي" أن سرعة المعالجة كافية لمواكبة تدفق البيانات الواردة، مما يسمح للنظام باتخاذ قرارات فورية. هذه القدرة هي حجر الزاوية في تطبيقات تطبيقات الرؤية الحاسوبية الحديثة، مما يتيح للأجهزة من إدراك البيئة المحيطة بها والتفاعل معها بأقل قدر من التأخير.
المقياس الأساسي لتقييم الأداء في الوقت الحقيقي هو زمن الاستنتاج، والذي يقيس الوقت المنقضي بين تلقي النموذج لمدخلات وإنتاج مخرجات. لكي يُعتبر النظام في الزمن الحقيقي، يجب أن يكون هذا الزمن يجب أن يكون هذا الزمن منخفضًا بما يكفي لتلبية قيود التوقيت المحددة لحالة الاستخدام. على سبيل المثال، نظام نظام فهم الفيديو الذي يحلل دفقًا بمعدل 30 إطارًا في الثانية (FPS) يستغرق حوالي 33 مللي ثانية لمعالجة كل إطار. إذا استغرق الاستدلال وقتًا أطول، فإن الإطارات يتم إسقاط الإطارات، ويتأخر النظام.
غالبًا ما يتضمن تحقيق هذه السرعة استخدام أجهزة متخصصة مثل وحدات معالجة الرسومات أو مسرّعات الذكاء الاصطناعي المتطورة، مثل منصةNVIDIA Jetson. بالإضافة إلى ذلك غالبًا ما يستخدم المهندسون تقنيات تحسين النموذج لتقليل التعقيد الحسابي دون التضحية بالدقة بشكل كبير.
من المهم التمييز بين تدفقات العمل في الوقت الحقيقي و الاستدلال الدفعي. في حين أن الاستدلال في الوقت الحقيقي يعالج نقاط البيانات بشكل فردي عند وصولها لتقليل زمن الوصول، فإن الاستدلال على دفعات يجمع البيانات في أجزاء كبيرة لتتم معالجتها معًا في وقت لاحق.
لقد أدت القدرة على توليد تنبؤات فورية إلى تغيير العديد من الصناعات من خلال أتمتة المهام المعقدة التي تتطلب اتخاذ القرارات في جزء من الثانية.
لتحقيق السرعات اللازمة للتطبيقات في الوقت الفعلي، غالبًا ما يقوم المطورون بنشر النماذج باستخدام الأمثل. أطر عمل مثل TensorRT ل NVIDIA أو OpenVINO لمعالجات Intel يمكن أن تسريع الأداء بشكل كبير. علاوة على ذلك، يمكن لتقنيات مثل تكميم النموذج - التيتقلل من دقة أوزان النموذج من قيم الفاصلة العائمة إلى قيم صحيحة - يمكن أن تقلل بشكل كبير من بصمة الذاكرة وتحسن سرعة التنفيذ على الأنظمة المدمجة.
يوضّح مثال Python التالي كيفية تشغيل الاستدلال في الوقت الحقيقي على موجز كاميرا ويب باستخدام
ultralytics المكتبة.
from ultralytics import YOLO
# Load the official YOLO11 nano model, optimized for speed
model = YOLO("yolo11n.pt")
# Run inference on the default webcam (source=0)
# 'stream=True' creates a generator for memory-efficient real-time processing
# 'show=True' displays the video feed with prediction overlays
results = model.predict(source="0", stream=True, show=True)
# Process the generator to keep the stream running
for result in results:
pass
مع توسع اتصال الجيل الخامس 5G وزيادة قوة الأجهزة, يتسع نطاق الذكاء الاصطناعي في الوقت الحقيقي. مفاهيم مثل إنترنت الأشياء (IoT) تصبح أكثر ذكاءً، وتنتقل من مجرد أجهزة بسيطة لجمع البيانات إلى صانعي قرار نشطين. التطورات المستقبلية، مثل مثل YOLO26 القادم، تهدف إلى دفع هذه الحدود إلى أبعد من ذلك من خلال تقديم نماذج أصلية شاملة أصغر وأسرع، مما يضمن أن المدن الذكية والأجهزة الطبية العمل بسلاسة في الوقت الفعلي.