مسرد المصطلحات

محرك الاستدلال

اكتشف كيف تعمل محركات الاستدلال على تعزيز الذكاء الاصطناعي من خلال تقديم تنبؤات في الوقت الفعلي، وتحسين النماذج، وتمكين النشر عبر المنصات.

في عالم الذكاء الاصطناعي والتعلم الآلي ( AI) ، يعد محرك الاستدلال مكونًا برمجيًا أو مكونًا حاسماً في مجال الذكاء الاصطناعي (AI) والتعلم الآلي (ML)، وهو مكون برمجي أو مكون أجهزة مهم مسؤول عن تنفيذ النماذج المدربة لإجراء تنبؤات على بيانات جديدة غير مرئية. بعد أن يتعلم النموذج الأنماط خلال مرحلة التدريب، يأخذ محرك الاستدلال هذا النموذج المدرّب ويطبقه على مدخلات العالم الحقيقي. تسمح هذه العملية، المعروفة باسم الاستدلال، لأنظمة الذكاء الاصطناعي بأداء مهام مثل اكتشاف الأجسام أو تصنيف الصور أو معالجة اللغة الطبيعية (NLP) في التطبيقات العملية. إنه في الأساس القلب التشغيلي لنموذج الذكاء الاصطناعي المنتشر، حيث يقوم بترجمة المعرفة المكتسبة إلى مخرجات قابلة للتنفيذ بكفاءة.

كيفية عمل محركات الاستدلال

يستخدم محرك الاستدلال نموذجًا مدربًا مسبقًا، وغالبًا ما يتم تطويره باستخدام أطر التعلم العميق (DL) مثل PyTorch أو TensorFlowالذي يغلف المعرفة اللازمة لمهمة محددة. عندما يتم توفير بيانات جديدة (على سبيل المثال، صورة أو مقطع صوتي أو جملة نصية) كمدخلات، يقوم محرك الاستدلال بمعالجتها من خلال البنية الحسابية للنموذج (غالبًا ما تكون شبكة عصبية). ويؤدي ذلك إلى توليد مخرجات، مثل تحديد الكائنات ذات المربعات المحدودة في صورة أو تدوين الكلام أو تصنيف المشاعر. Ultralytics YOLO على سبيل المثال، تعتمد النماذج على محركات استدلال فعّالة لتحقيق الكشف عن الكائنات وتجزئتها في الوقت الفعلي عبر منصات مختلفة، بدءًا من الخوادم السحابية القوية إلى الأجهزة الطرفية المحدودة الموارد. ويؤثر أداء محرك الاستدلال بشكل مباشر على سرعة التطبيق واستجابته، وغالبًا ما يُقاس ذلك من خلال زمن انتقال الاستدلال والإنتاجية.

التحسينات والميزات الرئيسية

الدور الرئيسي لمحركات الاستدلال الحديثة هو التحسين. قد يكون تشغيل نموذج تعلّم عميق كبير ومدرّب مباشرةً مكلفًا وبطيئًا من الناحية الحسابية. توظف محركات الاستدلال تقنيات مختلفة لجعل النماذج أسرع وأكثر كفاءة، مما يتيح النشر على أجهزة متنوعة. تتضمن استراتيجيات تحسين النماذج الشائعة ما يلي:

التكميم الكمي للنموذج: تقليل دقة أوزان النموذج (على سبيل المثال، من 32 بت ذات الفاصلة العائمة إلى 8 بت ذات الأعداد الصحيحة) لتقليل حجم النموذج وتسريع الحساب، وغالبًا ما يكون ذلك بأقل تأثير على الدقة.
تشذيب النموذج: إزالة الوصلات (الأوزان) الزائدة أو غير المهمة داخل الشبكة العصبية لإنشاء نموذج أصغر وأسرع.
تحسين الرسم البياني: دمج الطبقات أو إعادة ترتيب العمليات في الرسم البياني الحسابي للنموذج لتحسين كفاءة التنفيذ على أجهزة معينة.
تسريع الأجهزة: الاستفادة من المعالجات المتخصصة مثل وحدات معالجة الرسومات أو وحدات معالجة الرسومات، أو وحدات معالجة الرسومات، أو مسرعات الذكاء الاصطناعي المخصصة الموجودة في أجهزة مثل Google Edge TPU أو NVIDIA Jetson.

كما تدعم العديد من محركات الاستدلال أيضًا تنسيقات النماذج الموحدة مثل ONNX (Open Neural Network Exchange)، والتي تسمح للنماذج المدربة في إطار واحد (مثل PyTorch) أن يتم تشغيلها باستخدام محرك أو منصة مختلفة. تشمل محركات الاستدلال الشائعة ما يلي NVIDIA TensorRTو OpenVINO منIntel و TensorFlow Lite. تدعم نماذج Ultralytics التصدير إلى تنسيقات مختلفة متوافقة مع هذه المحركات، مفصلة في دليل خيارات نشر النموذج.