مسرد المصطلحات

محرك الاستدلال

اكتشف كيف تعمل محركات الاستدلال على تعزيز الذكاء الاصطناعي من خلال تقديم تنبؤات في الوقت الفعلي، وتحسين النماذج، وتمكين النشر عبر المنصات.

تدريب YOLO النماذج
ببساطة مع Ultralytics HUB

التعرف على المزيد

في عالم الذكاء الاصطناعي والتعلم الآلي ( AI) ، يعد محرك الاستدلال مكونًا برمجيًا أو مكونًا حاسماً في مجال الذكاء الاصطناعي (AI) والتعلم الآلي (ML)، وهو مكون برمجي أو مكون أجهزة مهم مسؤول عن تنفيذ النماذج المدربة لإجراء تنبؤات على بيانات جديدة غير مرئية. بعد أن يتعلم النموذج الأنماط خلال مرحلة التدريب، يأخذ محرك الاستدلال هذا النموذج المدرّب ويطبقه على مدخلات العالم الحقيقي. تسمح هذه العملية، المعروفة باسم الاستدلال، لأنظمة الذكاء الاصطناعي بأداء مهام مثل اكتشاف الأجسام أو تصنيف الصور أو معالجة اللغة الطبيعية (NLP) في التطبيقات العملية. إنه في الأساس القلب التشغيلي لنموذج الذكاء الاصطناعي المنتشر، حيث يقوم بترجمة المعرفة المكتسبة إلى مخرجات قابلة للتنفيذ بكفاءة.

كيفية عمل محركات الاستدلال

يستخدم محرك الاستدلال نموذجًا مدربًا مسبقًا، وغالبًا ما يتم تطويره باستخدام أطر التعلم العميق (DL) مثل PyTorch أو TensorFlowالذي يغلف المعرفة اللازمة لمهمة محددة. عندما يتم توفير بيانات جديدة (على سبيل المثال، صورة أو مقطع صوتي أو جملة نصية) كمدخلات، يقوم محرك الاستدلال بمعالجتها من خلال البنية الحسابية للنموذج (غالبًا ما تكون شبكة عصبية). ويؤدي ذلك إلى توليد مخرجات، مثل تحديد الكائنات ذات المربعات المحدودة في صورة أو تدوين الكلام أو تصنيف المشاعر. Ultralytics YOLO على سبيل المثال، تعتمد النماذج على محركات استدلال فعّالة لتحقيق الكشف عن الكائنات وتجزئتها في الوقت الفعلي عبر منصات مختلفة، بدءًا من الخوادم السحابية القوية إلى الأجهزة الطرفية المحدودة الموارد. ويؤثر أداء محرك الاستدلال بشكل مباشر على سرعة التطبيق واستجابته، وغالبًا ما يُقاس ذلك من خلال زمن انتقال الاستدلال والإنتاجية.

التحسينات والميزات الرئيسية

الدور الرئيسي لمحركات الاستدلال الحديثة هو التحسين. قد يكون تشغيل نموذج تعلّم عميق كبير ومدرّب مباشرةً مكلفًا وبطيئًا من الناحية الحسابية. توظف محركات الاستدلال تقنيات مختلفة لجعل النماذج أسرع وأكثر كفاءة، مما يتيح النشر على أجهزة متنوعة. تتضمن استراتيجيات تحسين النماذج الشائعة ما يلي:

  • التكميم الكمي للنموذج: تقليل دقة أوزان النموذج (على سبيل المثال، من 32 بت ذات الفاصلة العائمة إلى 8 بت ذات الأعداد الصحيحة) لتقليل حجم النموذج وتسريع الحساب، وغالبًا ما يكون ذلك بأقل تأثير على الدقة.
  • تشذيب النموذج: إزالة الوصلات (الأوزان) الزائدة أو غير المهمة داخل الشبكة العصبية لإنشاء نموذج أصغر وأسرع.
  • تحسين الرسم البياني: دمج الطبقات أو إعادة ترتيب العمليات في الرسم البياني الحسابي للنموذج لتحسين كفاءة التنفيذ على أجهزة معينة.
  • تسريع الأجهزة: الاستفادة من المعالجات المتخصصة مثل وحدات معالجة الرسومات أو وحدات معالجة الرسومات، أو وحدات معالجة الرسومات، أو مسرعات الذكاء الاصطناعي المخصصة الموجودة في أجهزة مثل Google Edge TPU أو NVIDIA Jetson.

كما تدعم العديد من محركات الاستدلال أيضًا تنسيقات النماذج الموحدة مثل ONNX (Open Neural Network Exchange)، والتي تسمح للنماذج المدربة في إطار واحد (مثل PyTorch) أن يتم تشغيلها باستخدام محرك أو منصة مختلفة. تشمل محركات الاستدلال الشائعة ما يلي NVIDIA TensorRTو OpenVINO منIntel و TensorFlow Lite. تدعم نماذج Ultralytics التصدير إلى تنسيقات مختلفة متوافقة مع هذه المحركات، مفصلة في دليل خيارات نشر النموذج.

محرك الاستدلال مقابل إطار التدريب

من المهم التمييز بين محركات الاستدلال وأطر التدريب.

  • أطر التدريب (على سبيل المثال, PyTorch, TensorFlowو Keras): هذه مكتبات شاملة تُستخدم لبناء نماذج التعلم الآلي وتدريبها والتحقق من صحتها. وهي توفر أدوات لتحديد بنيات الشبكات، وتنفيذ التكاثر العكسي، وإدارة مجموعات البيانات، وحساب دوال الخسارة. ينصب التركيز على المرونة وعملية التعلم.
  • محركات الاستدلال (على سبيل المثال, TensorRT, OpenVINOو ONNX Runtime): هذه أدوات متخصصة مصممة لتشغيل النماذج المدربة مسبقًا بكفاءة لمهام التنبؤ(نشر النموذج). ينصب تركيزها الأساسي على تحسين السرعة(زمن انتقال منخفض)، واستخدام منخفض للذاكرة، والتوافق مع الأجهزة المستهدفة. وغالبًا ما يأخذون النماذج المدربة باستخدام أطر العمل ويحولونها إلى تنسيق محسّن.

التطبيقات الواقعية

تعتبر محركات الاستدلال ضرورية لنشر الذكاء الاصطناعي في السيناريوهات العملية:

  1. المركبات ذاتية القيادة: تعتمد السيارات ذاتية القيادة(مثل تلك التي طورتها شركة Waymo) اعتماداً كبيراً على محركات الاستدلال الفعالة التي تعمل على أجهزة مدمجة(مثل منصات NVIDIA Jetson) لمعالجة بيانات المستشعرات (الكاميرات وLayDAR) في الوقت الحقيقي. تعمل المحركات على تحسين نماذج الرؤية الحاسوبية المعقدة مثل YOLO لمهام مثل اكتشاف الأجسام (اكتشاف السيارات والمشاة واللافتات) والتجزئة الدلالية (فهم تخطيط الطريق) بأقل قدر من التأخير، وهو أمر بالغ الأهمية للسلامة. استكشف المزيد حول الذكاء الاصطناعي في حلول السيارات.
  2. تحليل الصور الطبية: تعمل محركات الاستدلال على تسريع تحليل الفحوصات الطبية (الأشعة السينية والتصوير المقطعي المحوسب والتصوير بالرنين المغناطيسي) لمهام مثل اكتشاف الأورام(انظر مجموعة بيانات أورام الدماغ) أو الحالات الشاذة. يمكن تشغيل النماذج المحسّنة التي يتم نشرها عبر محركات الاستدلال بسرعة على خوادم المستشفيات أو الأجهزة الطبية المتخصصة، مما يساعد أخصائيي الأشعة(اقرأ عن الذكاء الاصطناعي في الأشعة) من خلال توفير تشخيصات أسرع أو آراء ثانية. اطلع على الذكاء الاصطناعي في حلول الرعاية الصحية.

من حيث الجوهر، تعمل محركات الاستدلال على سد الفجوة بين نماذج الذكاء الاصطناعي المدربة وتطبيقها العملي، مما يضمن إمكانية تقديم قدرات الذكاء الاصطناعي المتطورة بكفاءة وفعالية عبر مجموعة واسعة من الأجهزة والمنصات، بما في ذلك إدارة النماذج عبر منصات مثل Ultralytics HUB.

قراءة الكل