Yolo فيجن شنتشن
شنتشن
انضم الآن
مسرد المصطلحات

تقديم النموذج (Model Serving)

تعرف على أساسيات تقديم النموذج - نشر نماذج الذكاء الاصطناعي للتنبؤات في الوقت الفعلي، وقابلية التوسع، والتكامل السلس في التطبيقات.

خدمة النموذج هي المرحلة الحرجة في دورة حياة التعلم الآلي حيث يتم استضافة نموذج مدرب على خادم أو أو جهاز للتعامل مع طلبات الاستدلال في الوقت الحقيقي. بمجرد الانتهاء من تدريب نموذج التعلم الآلي (ML) تم تدريبه والتحقق من صحته، يجب دمجه في بيئة الإنتاج لتوفير القيمة. تعمل الخدمة كجسر بين ملف النموذج الثابت وتطبيقات المستخدم النهائي، حيث تستمع إلى البيانات الواردة - مثل الصور أو نصية عبر واجهة برمجة التطبيقات وإرجاع تنبؤات النموذج. هذه العملية تسمح لأنظمة البرمجيات بالاستفادة من قدرات النمذجة التنبؤية على الفور وعلى على نطاق واسع.

تتطلب خدمة النماذج الفعالة بنية برمجية قوية قادرة على تحميل النموذج في الذاكرة، وإدارة موارد الأجهزة مثل وحدات معالجة الرسومات ومعالجة الطلبات بكفاءة. في حين أن البرامج النصية البسيطة يمكن أن تؤدي الاستدلال، إلا أن خدمة الإنتاج غالباً ما تستخدم أطر عمل متخصصة مثل NVIDIA Triton Inference Server أو TorchServe. وقد تم تحسين هذه الأدوات للتعامل مع الإنتاجية العالية و منخفضة، مما يضمن أن التطبيقات تظل مستجيبة حتى في ظل أحمال المستخدم الثقيلة.

المكونات الأساسية لبنية الخدمة

يتضمن إعداد الخدمة الشاملة عدة طبقات متميزة تعمل في انسجام تام لتقديم تنبؤات موثوقة.

  • محرك الاستدلال: البرنامج الأساسي المسؤول عن تنفيذ العمليات الرياضية للنموذج. غالبًا ما يتم تحسين المحركات لأجهزة معينة، مثل TensorRT لوحدات معالجة الرسومات NVIDIA أو OpenVINO لوحدات المعالجة المركزية Intel لتحقيق أقصى قدر من الأداء.
  • واجهة API: تتواصل التطبيقات مع النموذج المخدوم من خلال بروتوكولات محددة. تعد واجهات برمجة التطبيقات REST API شائعة لتكامل الويب نظرًا لبساطتها، بينما يُفضَّل استخدام gRPC للخدمات المصغرة الداخلية التي تتطلب أداءً عاليًا ووقت استجابة منخفض. ووقت استجابة منخفض.
  • سجل النماذج: مستودع مركزي لإدارة الإصدارات المختلفة من النماذج المدربة. وهذا يضمن يضمن سهولة عودة نظام العرض إلى الإصدارات السابقة إذا أدى نشر نموذج جديد إذا أدى نشر نموذج جديد إلى مشاكل غير متوقعة.
  • الحاويات: أدوات مثل Docker تحزم النموذج مع تبعياته في حاويات معزولة. وهذا يضمن الاتساق عبر بيئات مختلفة، من حاسوب المطور إلى مجموعة مجموعة Kubernetes في السحابة.
  • موازن التحميل: في سيناريوهات حركة المرور العالية، يقوم يوزع موازن التحميل طلبات الاستدلال الواردة عبر عدة نسخ متماثلة للنماذج لمنع أي خادم واحد من أن يصبح عنق الزجاجة، مما يضمن قابلية التوسع.

التنفيذ العملي

لخدمة نموذج ما بشكل فعال، غالبًا ما يكون من المفيد تصديره إلى تنسيق موحد مثل ONNXالذي يعزز قابلية التشغيل البيني بين أطر التدريب المختلفة ومحركات العرض. يوضح المثال التالي كيفية تحميل YOLO11 وتشغيل الاستدلال، ومحاكاة المنطق الموجود داخل نقطة نهاية العرض.

from ultralytics import YOLO

# Load the YOLO11 model (this would happen once when the server starts)
model = YOLO("yolo11n.pt")

# Simulate an incoming request with an image source
image_source = "https://ultralytics.com/images/bus.jpg"

# Run inference to generate predictions
results = model.predict(source=image_source)

# Process and return the results (e.g., bounding boxes)
for box in results[0].boxes:
    print(f"Class: {box.cls}, Confidence: {box.conf}")

تطبيقات واقعية

تعمل خدمة النماذج على تشغيل ميزات الذكاء الاصطناعي في كل مكان في مختلف الصناعات من خلال تمكين اتخاذ القرارات الفورية بناءً على البيانات.

  • البيع بالتجزئة الذكي: يستخدم تجار التجزئة الذكاء الاصطناعي في البيع بالتجزئة لأتمتة عمليات الدفع. الكاميرات التي تخدمها نماذج الكشف عن الأشياء تحديد المنتجات الموجودة على الحزام الناقل في الوقت الفعلي، وحساب التكلفة الإجمالية دون مسح الباركود.
  • ضمان الجودة: في البيئات الصناعية, يستخدم الذكاء الاصطناعي في أنظمة التصنيع نماذج مخدومة لفحص خطوط التجميع. تُرسَل صور عالية الدقة للمكونات إلى خادم حافة محلي، حيث يقوم يكتشف النموذج عيوبًا مثل الخدوش أو المحاذاة الخاطئة، مما يؤدي إلى إطلاق تنبيهات فورية لإزالة العناصر المعيبة.
  • كشف الاحتيال المالي: تستخدم البنوك نماذج الكشف عن الحالات الشاذة التي يتم تقديمها عبر واجهات برمجة تطبيقات آمنة لتحليل بيانات المعاملات عند حدوثها. إذا كانت إحدى المعاملات تتوافق مع نمط نشاط احتيالي، يمكن للنظام منعها على الفور لمنع الخسارة المالية.

خدمة النموذج مقابل نشر النموذج

على الرغم من استخدامهما بالتبادل في كثير من الأحيان، إلا أنه من الضروري التمييز بين خدمة النموذج و نشر النموذج. يشير النشر إلى العملية الأوسع الأوسع نطاقًا لإصدار نموذج في بيئة إنتاج، والتي تتضمن خطوات مثل الاختبار والتعبئة وإعداد البنية التحتية. خدمة النموذج هي الجانب الخاص بوقت التشغيل من عملية النشر - عملية التشغيل الفعلي للنموذج والتعامل مع الطلبات.

كما تتطلب الخدمة الفعالة أيضًا مراقبة النموذج detect انحراف البيانات، حيث يتباعد توزيع البيانات الواردة عن بيانات التدريب، مما قد تدهور الدقة. تهدف المنصات الحديثة، مثل Ultralytics Platform القادمة، تهدف إلى توحيد هذه المراحل، مما يوفر انتقالات سلسة الانتقال السلس من التدريب إلى العرض والمراقبة.

اختيار الاستراتيجية الصحيحة

يعتمد اختيار استراتيجية التقديم بشكل كبير على حالة الاستخدام. توفر الخدمة عبر الإنترنت للتطبيقات التي تواجه المستخدم ولكنها تتطلب وقت استجابة منخفض. وعلى العكس، تعالج الخدمة المجمعة كميات كبيرة من البيانات دون اتصال بالإنترنت، وهي مناسبة لمهام مثل إنشاء التقارير الليلية حيث تكون الاستجابة الفورية ليست حرجة. للتطبيقات المنشورة على الأجهزة البعيدة، مثل الطائرات بدون طيار أو الهواتف المحمولة, تنقل تقنية Edge AI عملية التقديم مباشرةً إلى الجهاز, التخلص من الاعتماد على الاتصال السحابي وتقليل تكاليف النطاق الترددي.

يساعد استخدام أدوات مثل Prometheus لجمع المقاييس و Grafana للتصور يساعد الفرق الهندسية على track سلامة الخاصة بهم، مما يضمن استمرار النماذج في تقديم موثوقة بعد فترة طويلة من إطلاقها الأولي.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن