اكتشف قوة الاستدلال في الوقت الفعلي للتنبؤات الفورية بالذكاء الاصطناعي. تعرف على كيفية تقديم Ultralytics نتائج منخفضة التأخير للأجهزة الطرفية والروبوتات.
يشير الاستدلال في الوقت الفعلي إلى العملية التي يقبل فيها نموذج التعلم الآلي (ML) المدرب البيانات المدخلة الحية ويقوم بتوليد تنبؤات بشكل فوري تقريبًا. على عكس المعالجة غير المتصلة بالإنترنت، حيث يتم جمع البيانات وتحليلها بشكل مجمّع في وقت لاحق، يحدث الاستدلال في الوقت الفعلي بشكل فوري، مما يمكّن الأنظمة من الاستجابة لبيئتها بسرعة ورشاقة. هذه القدرة هي جوهر تطبيقات الذكاء الاصطناعي (AI) الحديثة، حيث تسمح للأجهزة بإدراك البيانات وتفسيرها والتصرف بناءً عليها في غضون أجزاء من الثانية.
المقياس الأساسي لتقييم الأداء في الوقت الفعلي هو زمن انتظار الاستدلال. يقيس هذا المقياس الفارق الزمني بين لحظة إدخال البيانات في النموذج — مثل إطار من كاميرا فيديو — ولحظة إنتاج النموذج لناتج، مثل مربع حدودي أو تسمية تصنيف. لكي يعتبر التطبيق "في الوقت الفعلي"، يجب أن يكون زمن الانتظار منخفضًا بدرجة كافية لتتناسب مع سرعة تدفق البيانات الواردة.
على سبيل المثال، في مهام فهم الفيديو التي تعمل بسرعة 30 إطارًا في الثانية (FPS)، يتمتع النظام بميزانية زمنية صارمة تبلغ حوالي 33 مللي ثانية لمعالجة كل إطار. إذا استغرق الاستدلال وقتًا أطول، فإن النظام يحدث تأخيرًا، مما قد يؤدي إلى فقدان الإطارات أو تأخير الاستجابات. لتحقيق ذلك، غالبًا ما يتطلب الأمر تسريع الأجهزة باستخدام وحدات معالجة الرسومات (GPU) أو أجهزة Edge AI المتخصصة مثل NVIDIA .
من المفيد التمييز بين سير العمل في الوقت الحقيقي و المعالجة المجمعة. على الرغم من أن كلاهما ينطوي على إنشاء تنبؤات، إلا أن أهدافهما وبنيتهما تختلفان بشكل كبير:
أدت القدرة على اتخاذ قرارات في أجزاء من الثانية إلى تغيير العديد من الصناعات من خلال تمكين الأتمتة في البيئات الديناميكية .
غالبًا ما يتطلب نشر النماذج للتطبيقات في الوقت الفعلي تحسينًا لضمان تشغيلها بكفاءة على الأجهزة المستهدفة . تقنيات مثل تكمية النموذج تقلل من دقة أوزان النموذج (على سبيل المثال، من float32 إلى int8) لتقليل استخدام الذاكرة وزيادة سرعة الاستدلال مع تأثير ضئيل على الدقة.
يمكن للمطورين استخدام Ultralytics لتبسيط هذه العملية. تعمل المنصة على تبسيط التدريب وتسمح للمستخدمين بتصدير النماذج إلى تنسيقات محسّنة مثل TensorRTNVIDIA OpenVINO لمعالجات Intel ، أو TFLite للنشر على الأجهزة المحمولة.
يوضح Python التالي Python كيفية تشغيل الاستدلال في الوقت الفعلي على بث كاميرا الويب باستخدام
ultralytics مكتبة. وهي تستخدم يولو26 نموذج Nano
، الذي تم تصميمه خصيصًا لتحقيق أداء عالي السرعة على الأجهزة المتطورة.
from ultralytics import YOLO
# Load the YOLO26 Nano model, optimized for speed and real-time tasks
model = YOLO("yolo26n.pt")
# Run inference on the default webcam (source="0")
# 'stream=True' returns a generator for memory-efficient processing
# 'show=True' displays the video feed with bounding boxes in real-time
results = model.predict(source="0", stream=True, show=True)
# Iterate through the generator to process frames as they arrive
for result in results:
# Example: Print the number of objects detected in the current frame
print(f"Detected {len(result.boxes)} objects")