Real-time Inference
استكشف قوة الاستدلال في الوقت الفعلي للحصول على تنبؤات ذكاء اصطناعي فورية. تعلم كيف توفر Ultralytics YOLO26 نتائج ذات زمن انتقال منخفض للأجهزة الطرفية والروبوتات.
يشير الاستدلال في الوقت الفعلي إلى العملية التي يتلقى فيها نموذج تعلم الآلة (ML) مُدرب بيانات إدخال حية ويُنتج تنبؤات بشكل لحظي تقريباً. على عكس المعالجة دون اتصال (offline)، حيث يتم جمع البيانات وتحليلها بشكل مجمع في وقت لاحق، يحدث الاستدلال في الوقت الفعلي أثناء التشغيل، مما يُمكّن الأنظمة من التفاعل مع بيئتها بسرعة ومرونة. تُعد هذه القدرة جوهر تطبيقات الذكاء الاصطناعي (AI) الحديثة، مما يسمح للأجهزة بإدراك البيانات وتفسيرها والعمل بناءً عليها في غضون أجزاء من الثانية.
Link to this sectionأهمية زمن الوصول المنخفض#
المقياس الأساسي لتقييم الأداء في الوقت الفعلي هو زمن وصول الاستدلال. يقيس هذا المقياس التأخير الزمني بين لحظة إدخال البيانات إلى النموذج—مثل إطار من كاميرا فيديو—واللحظة التي يُنتج فيها النموذج مخرجات، مثل صندوق محيط (bounding box) أو تصنيف. لكي يعتبر التطبيق "في الوقت الفعلي"، يجب أن يكون زمن الوصول منخفضاً بما يكفي ليتوافق مع سرعة تدفق البيانات الواردة.
على سبيل المثال، في مهام فهم الفيديو التي تعمل بسرعة 30 إطاراً في الثانية (FPS)، يكون لدى النظام ميزانية زمنية صارمة تبلغ حوالي 33 مللي ثانية لمعالجة كل إطار. إذا استغرق الاستدلال وقتاً أطول، سيحدث تأخير في النظام، مما قد يؤدي إلى ضياع إطارات أو تأخر في الاستجابة. غالباً ما يتطلب تحقيق ذلك تسريع الأجهزة باستخدام GPUs أو أجهزة Edge AI متخصصة مثل NVIDIA Jetson.
Link to this sectionالاستدلال في الوقت الفعلي مقابل استدلال الدفعات (Batch Inference)#
من المفيد التمييز بين سير عمل الوقت الفعلي والمعالجة على دفعات. في حين أن كلاهما يتضمن توليد تنبؤات، إلا أن أهدافهما وبنيتهما تختلف بشكل كبير:
- الاستدلال في الوقت الفعلي: يعطي الأولوية لزمن الوصول المنخفض. حيث يقوم بمعالجة نقاط بيانات فردية (أو دفعات صغيرة جداً) فور وصولها. هذا أمر ضروري للتطبيقات التفاعلية مثل المركبات ذاتية القيادة، حيث يجب أن تكتشف السيارة المشاة فوراً للفرملة في الوقت المناسب.
- استدلال الدفعات (Batch Inference): يعطي الأولوية للإنتاجية العالية. حيث يجمع كمية كبيرة من البيانات ويعالجها كلها دفعة واحدة. هذا مناسب للمهام غير العاجلة، مثل إنشاء تقارير المخزون الليلية أو تحليل اتجاهات البيانات الضخمة التاريخية.
Link to this sectionتطبيقات العالم الحقيقي#
لقد غيرت القدرة على اتخاذ قرارات في أجزاء من الثانية العديد من الصناعات من خلال تمكين الأتمتة في البيئات الديناميكية.
- التصنيع الذكي: في مجال الذكاء الاصطناعي في التصنيع، تستخدم الكاميرات الموضعة فوق سيور النقل الاستدلال في الوقت الفعلي لإجراء مراقبة الجودة المؤتمتة. يمكن لنموذج كشف الأشياء التعرف فوراً على العيوب أو الأجسام الغريبة في المنتجات التي تتحرك بسرعات عالية. إذا تم اكتشاف خلل، يقوم النظام بتشغيل ذراع آلية لإزالة العنصر على الفور، مما يضمن وصول المنتجات عالية الجودة فقط إلى التغليف.
- المراقبة والأمن: تعتمد أنظمة الأمن الحديثة على رؤية الحاسوب لمراقبة المحيط. بدلاً من مجرد تسجيل اللقطات، تقوم هذه الكاميرات بتشغيل كشف الأشخاص أو التعرف على الوجوه في الوقت الفعلي لتنبيه أفراد الأمن بوجود وصول غير مصرح به في اللحظة التي يحدث فيها ذلك.
- الروبوتات: في مجال الذكاء الاصطناعي في الروبوتات، تستخدم الروبوتات تقدير الوضعية للتنقل في المساحات المادية المعقدة. يجب على روبوت المستودعات استنتاج موقع العوائق والعمال البشريين باستمرار لتخطيط مساره بأمان وكفاءة.
Link to this sectionالتحسين والنشر#
غالباً ما يتطلب نشر النماذج للتطبيقات في الوقت الفعلي تحسيناً لضمان تشغيلها بكفاءة على الأجهزة المستهدفة. تقلل تقنيات مثل تكميم النموذج من دقة أوزان النموذج (على سبيل المثال، من float32 إلى int8) لتقليل استخدام الذاكرة وزيادة سرعة الاستدلال مع الحد الأدنى من التأثير على الدقة.
يمكن للمطورين الاستفادة من Ultralytics Platform لتبسيط هذه العملية. حيث تبسط المنصة التدريب وتسمح للمستخدمين بتصدير النماذج إلى تنسيقات محسنة مثل TensorRT لوحدات معالجة الرسومات من NVIDIA، أو OpenVINO لوحدات المعالجة المركزية من Intel، أو TFLite للنشر على الأجهزة المحمولة.
Link to this sectionمثال برمجي#
The following Python snippet demonstrates how to run real-time inference on a webcam feed using the ultralytics library. It uses the YOLO26 Nano model, which is engineered specifically for high-speed performance on edge devices.
from ultralytics import YOLO
# Load the YOLO26 Nano model, optimized for speed and real-time tasks
model = YOLO("yolo26n.pt")
# Run inference on the default webcam (source="0")
# 'stream=True' returns a generator for memory-efficient processing
# 'show=True' displays the video feed with bounding boxes in real-time
results = model.predict(source="0", stream=True, show=True)
# Iterate through the generator to process frames as they arrive
for result in results:
# Example: Print the number of objects detected in the current frame
print(f"Detected {len(result.boxes)} objects")





