اكتشف كيف يعمل محرك الاستدلال على تحسين نماذج التعلم الآلي مثل Ultralytics من أجل النشر في الوقت الفعلي. اكتشف اليوم نصائح حول أداء الذكاء الاصطناعي الطرفي.
محرك الاستدلال هو مكون برمجي متخصص مصمم لتنفيذ نماذج التعلم الآلي المدربة و توليد تنبؤات من البيانات الجديدة. على عكس مرحلة التدريب، التي تركز على أنماط التعلم من خلال عمليات حسابية مكثفة مثل الانتشار العكسي، فإن محرك الاستدلال مُحسّن بشكل صارم للمرحلة التشغيلية المعروفة باسم نشر النموذج. هدفه الأساسي هو تشغيل الحسابات بأكبر قدر ممكن من الكفاءة، وتقليل زمن الاستدلال إلى الحد الأدنى وزيادة الإنتاجية إلى الحد الأقصى على الأجهزة المستهدفة، سواء كانت خادم سحابي قابل للتوسع أو جهاز Edge AI يعمل بالبطارية. من خلال التخلص من النفقات الإضافية المطلوبة للتدريب ، تسمح هذه المحركات للشبكات العصبية المعقدة بالعمل في تطبيقات الوقت الفعلي .
عادةً ما يتضمن الانتقال من بيئة التدريب إلى محرك الاستدلال عدة خطوات تحسين لتبسيط هيكل النموذج. ونظرًا لأن النموذج لم يعد بحاجة إلى التعلم، يمكن للمحرك تجاهل البيانات المطلوبة لتحديثات التدرج، مما يؤدي إلى تجميد أوزان النموذج بشكل فعال. تشمل التقنيات الشائعة المستخدمة في محركات الاستدلال دمج الطبقات، حيث يتم دمج عمليات متعددة في خطوة واحدة لتقليل الوصول إلى الذاكرة، و تكمية النموذج، التي تحول الأوزان من تنسيقات النقاط العائمة عالية الدقة إلى أعداد صحيحة أقل دقة (على سبيل المثال، INT8).
تسمح هذه التحسينات للبنى المتقدمة مثل Ultralytics بالعمل بسرعات عالية للغاية دون فقدان كبير في الدقة. غالبًا ما يتم تصميم محركات مختلفة لتناسب أنظمة أجهزة معينة من أجل تحقيق أقصى أداء ممكن:
محركات الاستدلال هي المحركات الصامتة وراء العديد من مزايا الذكاء الاصطناعي الحديثة، حيث تتيح لأنظمة الرؤية الحاسوبية الاستجابة الفورية لبيئتها.
من المفيد التمييز بين البرنامج المستخدم لإنشاء النموذج والمحرك المستخدم لتشغيله. إطار التدريب (مثل PyTorch أو TensorFlow) الأدوات اللازمة لتصميم البنى، وحساب الخسارة، وتحديث المعلمات عبر التعلم الخاضع للإشراف. وهو يعطي الأولوية للمرونة وقدرات تصحيح الأخطاء.
في المقابل، يأخذ محرك الاستدلال الناتج النهائي من إطار التدريب ويمنح الأولوية لسرعة التنفيذ وكفاءة الذاكرة. على الرغم من أنه يمكنك تشغيل الاستدلال داخل إطار التدريب، إلا أنه نادرًا ما يكون بنفس كفاءة استخدام محرك مخصص، خاصةً للنشر على الهواتف المحمولة أو الأجهزة المدمجة عبر أدوات مثل TensorFlow أو Apple Core ML.
إن ultralytics تختزل الحزمة الكثير من تعقيدات محركات الاستدلال، مما يتيح للمستخدمين
تشغيل التنبؤات بسلاسة. وفي الخلفية، تتولى الحزمة المعالجة المسبقة للصور وتنفيذ النموذج.
بالنسبة للمستخدمين الذين يسعون إلى التوسع، فإن منصة Ultralytics يبسط
عملية التدريب وتصدير النماذج إلى تنسيقات محسّنة متوافقة مع مختلف محركات الاستدلال.
يوضح المثال التالي كيفية تحميل نموذج YOLO26 المدرب مسبقًا وتشغيل الاستدلال على صورة:
from ultralytics import YOLO
# Load the YOLO26n model (nano version for speed)
model = YOLO("yolo26n.pt")
# Run inference on an image from a URL
# The 'predict' method acts as the interface to the inference process
results = model.predict("https://ultralytics.com/images/bus.jpg")
# Display the results
results[0].show()