إمكانية المراقبة
اكتشف كيف تعمل إمكانية المراقبة على تحسين أنظمة الذكاء الاصطناعي/تعلم الآلة مثل Ultralytics YOLO. اكتساب الرؤى وتحسين الأداء وضمان الموثوقية في تطبيقات العالم الحقيقي.
تسمح قابلية الملاحظة للفرق الهندسية بتصحيح الأخطاء وفهم الحالات الداخلية للأنظمة المعقدة بفاعلية بناءً على
على مخرجاتها الخارجية. في مجالات
الذكاء الاصطناعي (AI) و
والتعلم الآلي (ML)، يعد هذا المفهوم أمرًا بالغ الأهمية
لتجاوز عمليات نشر "الصندوق الأسود". بينما يمكن لاختبار البرمجيات التقليدية التحقق من المنطق، فإن نماذج التعلم الآلي
تعمل احتماليًا، مما يجعل من الضروري وجود أنظمة تسمح للمطورين بالتحقق من الأسباب الجذرية
التنبؤات غير المتوقعة، أو تدهور الأداء، أو الفشل بعد
نشر النموذج.
المراقبة مقابل الرصد
على الرغم من أن هذه المصطلحات غالباً ما تُستخدم بالتبادل، إلا أنها تمثل أساليب مختلفة لموثوقية النظام.
-
تركز المراقبة على "المجهول المعروف". ويتضمن تتبع لوحات المعلومات المحددة مسبقًا
وتنبيهات لمقاييس مثل
كمون الاستدلال أو معدلات الخطأ. المراقبة
يجيب على السؤال، "هل النظام سليم؟
-
تعالج قابلية الملاحظة "المجهول المجهول". فهي توفر البيانات التفصيلية اللازمة
لطرح أسئلة جديدة غير متوقعة حول سبب حدوث فشل معين. كما هو موضح في
كتابGoogle SRE، يتيح لك النظام القابل للملاحظة
يمكّنك من فهم السلوكيات الجديدة دون شحن كود جديد. إنه يجيب على السؤال "لماذا يتصرف النظام
يتصرف النظام بهذه الطريقة؟
الركائز الثلاث للمراقبة
لتحقيق رؤى عميقة، تعتمد إمكانية المراقبة على ثلاثة أنواع أساسية من بيانات القياس عن بُعد:
-
السجلات: وهي عبارة عن سجلات ذات طابع زمني غير قابلة للتغيير للأحداث المنفصلة. في
الرؤية الحاسوبية (CV) ، قد يلتقط السجل
التقاط أبعاد الصورة المدخلة أو
أو تكوين ضبط البارامتر الفائق.
يسهّل التسجيل المنظم، الذي غالبًا ما يكون بتنسيق JSON، عملية الاستعلام
الاستعلام عن طريق أدوات تحليل البيانات مثل Splunk.
-
المقاييس: البيانات الرقمية المجمعة التي يتم قياسها بمرور الوقت، مثل
الدقة، أو استهلاك الذاكرة، أو
GPU أو استخدام وحدة معالجة الرسومات. تُستخدم أنظمة مثل
Prometheus تُستخدم على نطاق واسع لتخزين بيانات السلاسل الزمنية هذه، مما يسمح للفرق
تصور الاتجاهات.
-
التتبع: يتبع التتبع دورة حياة الطلب أثناء انتشاره عبر مختلف الخدمات المصغرة.
بالنسبة لتطبيقات الذكاء الاصطناعي الموزعة، يمكن للأدوات المتوافقة مع OpenTelemetry أن ترسم خريطة
مسار الطلب، مع تسليط الضوء على الاختناقات في
محرك الاستدلال أو تأخيرات الشبكة.
لماذا تعتبر قابلية الملاحظة مهمة في الذكاء الاصطناعي
يطرح نشر النماذج في العالم الحقيقي تحديات لا توجد في بيئات التدريب الخاضعة للرقابة.
وتعتبر إمكانية المراقبة ضرورية من أجل:
-
اكتشاف انحراف البيانات: بمرور الوقت، قد تنحرف البيانات المباشرة عن بيانات التدريب
بيانات التدريب، وهي ظاهرة تُعرف باسم
انجراف البيانات. تقوم أدوات الملاحظة بتصور المدخلات
لتنبيه المهندسين عند الحاجة إلى إعادة التدريب.
-
ضمان سلامة الذكاء الاصطناعي: بالنسبة للمجالات ذات المخاطر العالية، يعد فهم قرارات النموذج أمرًا حيويًا من أجل
سلامة الذكاء الاصطناعي. تساعد الرؤى الدقيقة في تدقيق القرارات
التأكد من توافقها مع بروتوكولات السلامة و
العدالة في الذكاء الاصطناعي.
-
تحسين الأداء: من خلال تحليل الآثار التفصيلية,
يمكن لفرق MLOPS تحديد
العمليات الحسابية الزائدة عن الحاجة أو قيود الموارد، وتحسين التكلفة والسرعة.
-
تصحيح أخطاء "الصناديق السوداء": غالباً ما تكون نماذج التعلم العميق مبهمة. تتيح منصات المراقبة
مثل Honeycomb تسمح للمهندسين بتقطيع البيانات عالية الأبعاد إلى شرائح وتقطيعها
تحديد سبب فشل النموذج في حالة محددة.
تطبيقات واقعية
تلعب قابلية الملاحظة دوراً محورياً في ضمان موثوقية حلول الذكاء الاصطناعي الحديثة في مختلف الصناعات.
-
المركبات ذاتية القيادة: في تطوير
المركبات ذاتية القيادة، تسمح إمكانية المراقبة
للمهندسين بإعادة بناء الحالة الدقيقة للنظام خلال حدث فك الارتباط. من خلال ربط
مخرجات الكشف عن الأجسام مع سجلات المستشعرات و
وأوامر التحكم، يمكن للفرق تحديد ما إذا كان خطأ الكبح ناتجاً عن ضوضاء المستشعر أو خطأ في التنبؤ بالنموذج.
-
تشخيص الرعاية الصحية: في
الذكاء الاصطناعي في مجال الرعاية الصحية، فإن التشغيل الموثوق به
أمر بالغ الأهمية. تضمن قابلية الملاحظة أن نماذج التصوير الطبي تعمل بشكل متسق عبر مختلف المستشفيات
المختلفة. إذا انخفض أداء النموذج، يمكن أن تكشف عمليات التتبع ما إذا كانت المشكلة ناجمة عن تغيير في دقة الصورة أو
أو تأخير في خط أنابيب المعالجة المسبقة للبيانات، مما يتيح المعالجة السريعة دون المساس برعاية المرضى.
تنفيذ قابلية الملاحظة باستخدام Ultralytics
تبدأ إمكانية المراقبة الفعالة بالتسجيل المناسب وتتبع التجارب. تتكامل نماذج Ultralytics بسلاسة
مع أدوات مثل MLflow,
Weights & Biasesو
و TensorBoard لتسجيل المقاييس والمعلمات و
والقطع الأثرية تلقائيًا.
يوضح المثال التالي كيفية تدريب
YOLO11 أثناء تنظيم السجلات في مشروع محدد في
محدد، وهو أساس قابلية الملاحظة القائمة على الملفات:
from ultralytics import YOLO
# Load the YOLO11 model
model = YOLO("yolo11n.pt")
# Train the model, saving logs and results to a specific project directory
# This creates structured artifacts useful for post-training analysis
model.train(data="coco8.yaml", epochs=3, project="observability_logs", name="experiment_1")
بالنسبة لبيئات الإنتاج، غالبًا ما تقوم الفرق بتجميع هذه السجلات في منصات مركزية مثل
مثل Datadog أو New Relic أو
أو Elastic Stack للحفاظ على رؤية موحدة لكامل
البنية التحتية للذكاء الاصطناعي بالكامل. يمكن أيضًا تحقيق التصور المتقدم باستخدام لوحات معلومات مفتوحة المصدر مثل
Grafana.