يولو فيجن شنتشن
شنتشن
انضم الآن
مسرد المصطلحات

تقديم النموذج (Model Serving)

تعرف على أساسيات تقديم النموذج - نشر نماذج الذكاء الاصطناعي للتنبؤات في الوقت الفعلي، وقابلية التوسع، والتكامل السلس في التطبيقات.

خدمة النماذج هي عملية إتاحة نموذج تعلم آلي (ML) مُدرَّب لاستقبال بيانات الإدخال وإرجاع التنبؤات في بيئة إنتاج. بمجرد تدريب النموذج والتحقق من صحته، تصبح خدمة النموذج هي الخطوة الحاسمة التي تحوله من ملف ثابت إلى أداة تشغيلية نشطة يمكنها تشغيل تطبيقات العالم الحقيقي. وهي تنطوي على نشر النموذج على خادم وإنشاء واجهة، عادةً ما تكون واجهة برمجة تطبيقات (API)، تسمح لأنظمة البرامج الأخرى بالاتصال بها لإجراء الاستدلال في الوقت الفعلي.

في حين أنها وثيقة الصلة، فإن تقديم النموذج هو مكون محدد ضمن العملية الأوسع لـ نشر النموذج. يشمل النشر سير العمل بأكمله لدمج نموذج في بيئة إنتاج، بما في ذلك إعداد البنية التحتية والمراقبة. يشير تقديم النموذج تحديدًا إلى جزء تلك البنية التحتية المسؤول عن تشغيل النموذج والتعامل مع طلبات الاستدلال بكفاءة.

المكونات الرئيسية لتقديم النموذج

يتكون نظام خدمة النماذج القوي من عدة مكونات متكاملة تعمل معًا لتقديم تنبؤات سريعة وموثوقة.

  • تنسيق النموذج: قبل تقديم النموذج، يجب تعبئته في تنسيق قياسي. تضمن تنسيقات مثل ONNX إمكانية التشغيل البيني عبر الأطر المختلفة. لتحقيق أقصى قدر من الأداء، يمكن تحسين النماذج باستخدام أدوات مثل TensorRT لوحدات معالجة الرسومات NVIDIA.
  • إطار عمل التقديم: برنامج متخصص يقوم بتحميل النموذج وإدارة موارد الأجهزة مثل وحدات معالجة الرسومات (GPUs) ومعالجة طلبات الاستدلال. تتضمن الأطر الشائعة TensorFlow Serving و PyTorch Serve و NVIDIA Triton Inference Server عالي الأداء، والذي يمكن استخدامه مع نماذج Ultralytics عبر دليل تكامل Triton الخاص بنا.
  • نقطة نهاية واجهة برمجة التطبيقات: هذه هي بوابة الاتصال التي تسمح لتطبيقات العميل بإرسال البيانات (مثل صورة أو نص) وتلقي تنبؤ النموذج. REST و gRPC هما بروتوكولا واجهة برمجة تطبيقات شائعة تستخدم لهذا الغرض.
  • البنية التحتية: الأجهزة المادية أو الافتراضية التي يتم تشغيل النموذج عليها. يمكن أن يتراوح هذا من الخوادم المحلية إلى منصات الحوسبة السحابية مثل Amazon SageMaker و Google Cloud AI Platform. بالنسبة للتطبيقات التي تتطلب زمن انتقال منخفض، غالبًا ما يتم تقديم النماذج على أجهزة الذكاء الاصطناعي الطرفية. الحاويات باستخدام أدوات مثل Docker ضرورية لإنشاء بيئات خدمة محمولة وقابلة للتطوير.
  • المراقبة والتسجيل: تتبع مستمر لأداء النموذج وصحة النظام. يتضمن ذلك مراقبة مقاييس مثل زمن الوصول للاستدلال والإنتاجية، بالإضافة إلى مراقبة مشكلات مثل انحراف البيانات، مما قد يؤدي إلى تدهور دقة النموذج بمرور الوقت. يمكنك معرفة المزيد في دليل مراقبة النموذج الخاص بنا.

تطبيقات واقعية

تعتبر خدمة النماذج المحرك الأساسي وراء عدد لا يحصى من الميزات المدعومة بالذكاء الاصطناعي.

  1. إدارة المخزون المدعومة بالذكاء الاصطناعي: تستخدم شركة بيع بالتجزئة نموذج Ultralytics YOLO11 لـ إدارة المخزون في الوقت الفعلي. يتم تجميع النموذج بتنسيق ONNX وتقديمه على جهاز حافة صغير داخل المتجر. ترسل الكاميرا تغذية فيديو إلى نقطة النهاية التي تقوم بتنفيذ اكتشاف الكائنات لحساب العناصر الموجودة على الرفوف وإرسال تنبيهات عندما يكون المخزون منخفضًا.
  2. تحليل الصور الطبية في السحابة: يقوم نظام مستشفى بنشر رؤية حاسوبية متطورة لـ تحليل الصور الطبية. نظرًا لكبر حجم النموذج والاحتياجات الحسابية، يتم تقديمه على خادم سحابي قوي مزود بوحدات معالجة رسومات متعددة. يقوم أخصائيو الأشعة بتحميل فحوصات عالية الدقة من خلال بوابة آمنة، والتي تستدعي واجهة برمجة التطبيقات (API) للخدمة. يُرجع النموذج تنبؤات تساعد في تحديد الحالات الشاذة المحتملة، مما يحسن سرعة التشخيص ودقته.

دور MLOps

تعتبر خدمة النماذج حجر الزاوية في عمليات تعلم الآلة (MLOps). تضمن استراتيجية MLOps الجيدة أن دورة الحياة بأكملها —من معالجة البيانات الأولية و تدريب النموذج إلى خدمة النموذج و المراقبة—تتم بشكل آلي وموثوق و قابل للتطوير. تم تصميم منصات مثل Ultralytics HUB لتبسيط سير العمل بأكمله، وتوفير حل متكامل لتدريب نماذج الرؤية الحاسوبية وإصدارها وتقديمها بفعالية.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن
تم نسخ الرابط إلى الحافظة