تعرف على أساسيات تقديم النموذج - نشر نماذج الذكاء الاصطناعي للتنبؤات في الوقت الفعلي، وقابلية التوسع، والتكامل السلس في التطبيقات.
خدمة النموذج هي المرحلة الحرجة في دورة حياة التعلم الآلي حيث يتم استضافة نموذج مدرب على خادم أو أو جهاز للتعامل مع طلبات الاستدلال في الوقت الحقيقي. بمجرد الانتهاء من تدريب نموذج التعلم الآلي (ML) تم تدريبه والتحقق من صحته، يجب دمجه في بيئة الإنتاج لتوفير القيمة. تعمل الخدمة كجسر بين ملف النموذج الثابت وتطبيقات المستخدم النهائي، حيث تستمع إلى البيانات الواردة - مثل الصور أو نصية عبر واجهة برمجة التطبيقات وإرجاع تنبؤات النموذج. هذه العملية تسمح لأنظمة البرمجيات بالاستفادة من قدرات النمذجة التنبؤية على الفور وعلى على نطاق واسع.
تتطلب خدمة النماذج الفعالة بنية برمجية قوية قادرة على تحميل النموذج في الذاكرة، وإدارة موارد الأجهزة مثل وحدات معالجة الرسومات ومعالجة الطلبات بكفاءة. في حين أن البرامج النصية البسيطة يمكن أن تؤدي الاستدلال، إلا أن خدمة الإنتاج غالباً ما تستخدم أطر عمل متخصصة مثل NVIDIA Triton Inference Server أو TorchServe. وقد تم تحسين هذه الأدوات للتعامل مع الإنتاجية العالية و منخفضة، مما يضمن أن التطبيقات تظل مستجيبة حتى في ظل أحمال المستخدم الثقيلة.
يتضمن إعداد الخدمة الشاملة عدة طبقات متميزة تعمل في انسجام تام لتقديم تنبؤات موثوقة.
لخدمة نموذج ما بشكل فعال، غالبًا ما يكون من المفيد تصديره إلى تنسيق موحد مثل ONNXالذي يعزز قابلية التشغيل البيني بين أطر التدريب المختلفة ومحركات العرض. يوضح المثال التالي كيفية تحميل YOLO11 وتشغيل الاستدلال، ومحاكاة المنطق الموجود داخل نقطة نهاية العرض.
from ultralytics import YOLO
# Load the YOLO11 model (this would happen once when the server starts)
model = YOLO("yolo11n.pt")
# Simulate an incoming request with an image source
image_source = "https://ultralytics.com/images/bus.jpg"
# Run inference to generate predictions
results = model.predict(source=image_source)
# Process and return the results (e.g., bounding boxes)
for box in results[0].boxes:
print(f"Class: {box.cls}, Confidence: {box.conf}")
تعمل خدمة النماذج على تشغيل ميزات الذكاء الاصطناعي في كل مكان في مختلف الصناعات من خلال تمكين اتخاذ القرارات الفورية بناءً على البيانات.
على الرغم من استخدامهما بالتبادل في كثير من الأحيان، إلا أنه من الضروري التمييز بين خدمة النموذج و نشر النموذج. يشير النشر إلى العملية الأوسع الأوسع نطاقًا لإصدار نموذج في بيئة إنتاج، والتي تتضمن خطوات مثل الاختبار والتعبئة وإعداد البنية التحتية. خدمة النموذج هي الجانب الخاص بوقت التشغيل من عملية النشر - عملية التشغيل الفعلي للنموذج والتعامل مع الطلبات.
كما تتطلب الخدمة الفعالة أيضًا مراقبة النموذج detect انحراف البيانات، حيث يتباعد توزيع البيانات الواردة عن بيانات التدريب، مما قد تدهور الدقة. تهدف المنصات الحديثة، مثل Ultralytics Platform القادمة، تهدف إلى توحيد هذه المراحل، مما يوفر انتقالات سلسة الانتقال السلس من التدريب إلى العرض والمراقبة.
يعتمد اختيار استراتيجية التقديم بشكل كبير على حالة الاستخدام. توفر الخدمة عبر الإنترنت للتطبيقات التي تواجه المستخدم ولكنها تتطلب وقت استجابة منخفض. وعلى العكس، تعالج الخدمة المجمعة كميات كبيرة من البيانات دون اتصال بالإنترنت، وهي مناسبة لمهام مثل إنشاء التقارير الليلية حيث تكون الاستجابة الفورية ليست حرجة. للتطبيقات المنشورة على الأجهزة البعيدة، مثل الطائرات بدون طيار أو الهواتف المحمولة, تنقل تقنية Edge AI عملية التقديم مباشرةً إلى الجهاز, التخلص من الاعتماد على الاتصال السحابي وتقليل تكاليف النطاق الترددي.
يساعد استخدام أدوات مثل Prometheus لجمع المقاييس و Grafana للتصور يساعد الفرق الهندسية على track سلامة الخاصة بهم، مما يضمن استمرار النماذج في تقديم موثوقة بعد فترة طويلة من إطلاقها الأولي.