تعرف على كيفية سد الفجوة بين النماذج المدربة والإنتاج من خلال تقديم النماذج. استكشف استراتيجيات النشر لـ Ultralytics على Ultralytics .
خدمة النموذج هي عملية استضافة نموذج تعلم آلي مدرب وإتاحة وظائفه لتطبيقات البرامج عبر واجهة شبكة. وهي تعمل كجسر بين ملف نموذج ثابت محفوظ على قرص ونظام حي يعالج بيانات العالم الحقيقي. بمجرد أن يكمل النموذج مرحلة تدريب التعلم الآلي (ML) ، يجب دمجه في بيئة إنتاجية حيث يمكنه تلقي المدخلات — مثل الصور أو النصوص أو البيانات الجدولية — و إرجاع التنبؤات. يتم تحقيق ذلك عادةً عن طريق تغليف النموذج في واجهة برمجة التطبيقات (API)، مما يسمح له بالتواصل مع خوادم الويب أو تطبيقات الأجهزة المحمولة أو أجهزة إنترنت الأشياء.
الهدف الأساسي من تقديم النماذج هو تفعيل قدرات النمذجة التنبؤية بفعالية. بينما يركز التدريب على الدقة وتقليل الخسائر، يركز تقديم النماذج على مقاييس الأداء مثل الكمون (مدى سرعة إرجاع التنبؤ) والإنتاجية (عدد الطلبات التي يمكن معالجتها في الثانية). تضمن البنية التحتية القوية للخدمة أن تظل أنظمة الرؤية الحاسوبية (CV) موثوقة تحت الأحمال الثقيلة. وغالبًا ما تتضمن تقنيات مثل التعبئة في حاويات باستخدام أدوات مثل Docker، التي تحزم النموذج مع تبعياته لضمان سلوك متسق عبر بيئات الحوسبة المختلفة.
تعمل خدمة النماذج على تشغيل ميزات الذكاء الاصطناعي في كل مكان في مختلف الصناعات من خلال تمكين اتخاذ القرارات الفورية بناءً على البيانات.
لتقديم خدمة فعالة للنموذج، غالبًا ما يكون من المفيد تصدير النماذج إلى تنسيق موحد مثل ONNX، الذي يعزز قابلية التشغيل البيني بين أطر التدريب ومحركات الخدمة المختلفة. يوضح المثال التالي كيفية تحميل نموذج وتشغيل الاستدلال، ومحاكاة المنطق الذي سيكون موجودًا داخل نقطة نهاية الخدمة باستخدام Python.
from ultralytics import YOLO
# Load the YOLO26 model (this typically happens once when the server starts)
model = YOLO("yolo26n.pt")
# Simulate an incoming API request with an image source URL
image_source = "https://ultralytics.com/images/bus.jpg"
# Run inference to generate predictions for the user
results = model.predict(source=image_source)
# Process results (e.g., simulating a JSON response to a client)
print(f"Detected {len(results[0].boxes)} objects in the image.")
يعتمد اختيار استراتيجية الخدمة بشكل كبير على حالة الاستخدام المحددة. يوفر الخدمة عبر الإنترنت استجابات فورية عبر بروتوكولات مثل REST أو gRPC، وهو أمر ضروري لتطبيقات الويب التي تواجه المستخدم. على العكس من ذلك، تقوم الخدمة المجمعة بمعالجة كميات كبيرة من البيانات في وضع عدم الاتصال بالإنترنت، وهي مناسبة لمهام مثل إنشاء التقارير الليلية . بالنسبة للتطبيقات التي تتطلب الخصوصية أو زمن انتقال منخفض دون الاعتماد على الإنترنت، تنقل Edge AI عملية الخدمة مباشرة إلى الجهاز، باستخدام تنسيقات محسّنة مثل TensorRT لتعظيم الأداء على الأجهزة المقيدة. تستفيد العديد من المؤسسات من Ultralytics لتبسيط نشر هذه النماذج على نقاط نهاية مختلفة، بما في ذلك واجهات برمجة التطبيقات السحابية والأجهزة الطرفية.
على الرغم من ارتباطهما الوثيق، فإن "خدمة النموذج" تختلف عن نشر النموذج والاستدلال .