Inference Engine
اكتشف كيف يعمل محرك الاستنتاج (inference engine) على تحسين نماذج تعلم الآلة مثل Ultralytics YOLO26 للنشر في الوقت الفعلي. استكشف نصائح الأداء لذكاء الحافة اليوم.
محرك الاستدلال هو مكون برمجي متخصص مصمم لتنفيذ نماذج تعلم الآلة المدربة وتوليد تنبؤات من بيانات جديدة. على عكس مرحلة التدريب، التي تركز على تعلم الأنماط من خلال عمليات مكثفة حسابيًا مثل الانتشار العكسي، يتم تحسين محرك الاستدلال بدقة للمرحلة التشغيلية المعروفة باسم نشر النموذج. هدفه الأساسي هو إجراء العمليات الحسابية بأكثر كفاءة ممكنة، مع تقليل زمن انتقال الاستدلال وتعظيم الإنتاجية على الأجهزة المستهدفة، سواء كانت خادم سحابي قابل للتوسع أو جهاز Edge AI يعمل بالبطارية. من خلال إزالة العبء الزائد المطلوب للتدريب، تسمح هذه المحركات للشبكات العصبية المعقدة بالعمل في تطبيقات الوقت الفعلي.
Link to this sectionكيف تحسن محركات الاستدلال الأداء#
يتضمن الانتقال من بيئة التدريب إلى محرك الاستدلال عادةً عدة خطوات تحسين لتبسيط هيكل النموذج. نظرًا لأن النموذج لم يعد بحاجة إلى التعلم، يمكن للمحرك تجاهل البيانات المطلوبة لتحديثات التدرج، مما يؤدي فعليًا إلى تجميد أوزان النموذج. تشمل التقنيات الشائعة التي تستخدمها محركات الاستدلال دمج الطبقات، حيث يتم دمج عمليات متعددة في خطوة واحدة لتقليل الوصول إلى الذاكرة، وكمية النموذج، التي تحول الأوزان من تنسيقات الفاصلة العائمة عالية الدقة إلى أعداد صحيحة منخفضة الدقة (مثل INT8).
تسمح هذه التحسينات للهياكل المتقدمة مثل Ultralytics YOLO26 بالعمل بسرعات عالية للغاية دون فقدان كبير في الدقة. غالبًا ما يتم تصميم محركات مختلفة لتناسب أنظمة أجهزة معينة لإطلاق أقصى قدر من الأداء:
- NVIDIA TensorRT: يوفر استدلالًا عالي الأداء على GPUs من NVIDIA باستخدام نوى خاصة بالأجهزة وتحسين رسم بياني للشبكة.
- Intel OpenVINO: يحسن أداء التعلم العميق على معماريات Intel، بما في ذلك CPUs والرسومات المدمجة، مما يجعله مثاليًا للحوسبة المتطورة.
- ONNX Runtime: مسرع متعدد المنصات يدعم النماذج بتنسيق ONNX، مما يوفر جسرًا بين أطر العمل المختلفة وخلفيات الأجهزة.
Link to this sectionتطبيقات العالم الحقيقي#
تعد محركات الاستدلال المحركات الصامتة وراء العديد من وسائل الراحة الحديثة التي توفرها الذكاء الاصطناعي، مما يمكن أنظمة الرؤية الحاسوبية من التفاعل فورًا مع بيئتها.
-
المركبات ذاتية القيادة: في السيارات ذاتية القيادة، يجب أن تحدد نماذج اكتشاف الكائنات المشاة، وإشارات المرور، والمركبات الأخرى في أجزاء من الثانية. يضمن محرك الاستدلال الذي يعمل محليًا على أجهزة السيارة حدوث هذه المعالجة بسرعات استدلال الوقت الفعلي، حيث أن الاعتماد على اتصال سحابي سيؤدي إلى تأخيرات خطيرة.
-
التصنيع الذكي: تستخدم المصانع كاميرات IIoT لفحص المنتجات على خطوط التجميع. يقوم محرك الاستدلال بمعالجة موجزات الفيديو لإجراء اكتشاف الشذوذ، مع تحديد العيوب فورًا. تقلل هذه الأتمتة من النفايات وتضمن مراقبة صارمة للجودة دون إبطاء الإنتاج.
Link to this sectionمحرك الاستدلال مقابل إطار عمل التدريب#
من المفيد التمييز بين البرنامج المستخدم لإنشاء النموذج والمحرك المستخدم لتشغيله. يوفر إطار عمل التدريب (مثل PyTorch أو TensorFlow) الأدوات اللازمة لتصميم الهياكل، وحساب الخسارة، وتحديث المعلمات عبر التعلم الخاضع للإشراف. وهو يعطي الأولوية للمرونة وقدرات تصحيح الأخطاء.
على النقيض من ذلك، يأخذ محرك الاستدلال الأداة النهائية من إطار عمل التدريب ويعطي الأولوية لسرعة التنفيذ وكفاءة الذاكرة. بينما يمكنك تشغيل الاستدلال داخل إطار عمل التدريب، فإنه نادرًا ما يكون بنفس كفاءة استخدام محرك مخصص، خاصة للنشر على الهواتف المحمولة أو الأجهزة المدمجة عبر أدوات مثل TensorFlow Lite أو Apple Core ML.
Link to this sectionاستخدام محرك استدلال مع YOLO26#
تقوم حزمة ultralytics بتجريد الكثير من تعقيد محركات الاستدلال، مما يسمح للمستخدمين بتشغيل التنبؤات بسلاسة. خلف الكواليس، تتعامل الحزمة مع المعالجة المسبقة للصور وتنفيذ النموذج. بالنسبة للمستخدمين الذين يتطلعون إلى التوسع، تعمل Ultralytics Platform على تبسيط عملية تدريب وتصدير النماذج إلى تنسيقات محسنة متوافقة مع محركات استدلال مختلفة.
يوضح المثال التالي كيفية تحميل نموذج YOLO26 مدرب مسبقًا وتشغيل الاستدلال على صورة:
from ultralytics import YOLO
# Load the YOLO26n model (nano version for speed)
model = YOLO("yolo26n.pt")
# Run inference on an image from a URL
# The 'predict' method acts as the interface to the inference process
results = model.predict("https://ultralytics.com/images/bus.jpg")
# Display the results
results[0].show()





