يولو فيجن شنتشن
شنتشن
انضم الآن

قياس أداء الذكاء الاصطناعي لتقييم تأثير ابتكاراتك

أبيرامي فينا

5 دقائق قراءة

22 أغسطس، 2024

يمكنك مراقبة نجاح ابتكارات الذكاء الاصطناعي الخاصة بك باستخدام مؤشرات الأداء الرئيسية (KPIs) ومقاييس الأداء الصحيحة. تعرف على كيفية تتبع وتحسين تأثير تطبيقات الذكاء الاصطناعي.

لقد استكشفنا سابقًا كيف يمكن استخدام الذكاء الاصطناعي في صناعات مختلفة مثل الرعاية الصحية و التصنيع و السياحة. لقد بحثنا أيضًا في كيف يمكن للذكاء الاصطناعي تحسين مهام العمل اليومية وناقشنا أفكار الأعمال التجارية الرائدة في مجال الذكاء الاصطناعي. تؤدي كل هذه المناقشات حتمًا إلى نفس السؤال الرئيسي: كيف يمكننا قياس نجاح عمليات تنفيذ الذكاء الاصطناعي هذه؟ إنه سؤال مهم لأنه ببساطة نشر حلول الذكاء الاصطناعي لا يكفي. إن التأكد من أن هذه الحلول تحقق نتائج بالفعل هو ما يجعلها تغير قواعد اللعبة. 

يمكننا قياس مقاييس أداء الذكاء الاصطناعي لتحديد ما إذا كان نموذج الذكاء الاصطناعي فعالاً حقًا في جعل العمليات أكثر كفاءة أو إطلاق العنان للابتكار أو حل المشكلات. من خلال التركيز على مؤشرات الأداء الرئيسية (KPIs) الصحيحة، يمكننا فهم مدى جودة عمل حل الذكاء الاصطناعي وأين قد يحتاج إلى تحسين.

في هذه المقالة، سنلقي نظرة على كيفية قياس نجاح تطبيقات الذكاء الاصطناعي باستخدام مؤشرات الأداء الرئيسية الأكثر صلة. سنغطي الاختلافات بين مؤشرات الأداء الرئيسية للأعمال ومؤشرات الأداء الرئيسية لأداء الذكاء الاصطناعي، ونستعرض مقاييس رئيسية مثل الدقة والاسترجاع، ونساعدك على اختيار أفضل مؤشرات الأداء الرئيسية لحلول الذكاء الاصطناعي الخاصة بك.

الفرق بين مؤشرات الأداء الرئيسية للأعمال التجارية للذكاء الاصطناعي ومؤشرات الأداء الرئيسية لأداء الذكاء الاصطناعي

__wf_reserved_inherit
الشكل 1. مقارنة بين مؤشرات الأداء الرئيسية للأعمال التجارية التي تعتمد على الذكاء الاصطناعي ومؤشرات أداء الذكاء الاصطناعي.

عندما تفكر في مؤشرات الأداء الرئيسية (KPIs)، فمن الطبيعي أن تفترض أنها تدور حول مقاييس الأعمال مثل عائد الاستثمار (ROI) أو توفير التكاليف أو الإيرادات الناتجة - خاصةً عند الحديث عن الذكاء الاصطناعي للمؤسسات. تقيس مؤشرات الأداء الرئيسية للأعمال التي تعمل بالذكاء الاصطناعي مدى تأثير الذكاء الاصطناعي على النجاح العام للشركة وتتوافق مع أهداف العمل الأوسع. 

ومع ذلك، تركز مؤشرات الأداء الرئيسية للذكاء الاصطناعي على مدى جودة أداء نظام الذكاء الاصطناعي نفسه، باستخدام مقاييس مثل الدقة والاسترجاع والضبط. سنتناول تفاصيل هذه المقاييس أدناه، ولكن بشكل أساسي، بينما تعرض مؤشرات الأداء الرئيسية للأعمال الفوائد المالية والاستراتيجية للذكاء الاصطناعي، فإن مؤشرات الأداء الرئيسية تتأكد من أن نموذج الذكاء الاصطناعي يقوم بعمله بفعالية.

يمكن لبعض المقاييس أن تخدم كلا الغرضين في الواقع. على سبيل المثال، مكاسب الكفاءة، مثل تقليل الوقت أو الموارد المطلوبة لإكمال مهمة ما، يمكن أن تكون مؤشر أداء رئيسي (KPI) للأداء (توضح مدى جودة عمل حل الذكاء الاصطناعي) ومؤشر أداء رئيسي للأعمال (يقيس توفير التكاليف وتحسينات الإنتاجية). رضا العملاء هو مقياس آخر متعدد الجوانب. يمكن أن يعكس نجاح أداة خدمة العملاء المدعومة بالذكاء الاصطناعي من حيث أدائها التقني وتأثيرها على أهداف العمل الشاملة.

فهم مقاييس الأداء الرئيسية للذكاء الاصطناعي

هناك عدد قليل من المقاييس الشائعة المستخدمة لقياس مدى جودة أداء نموذج الذكاء الاصطناعي. أولاً، سنلقي نظرة على تعريفها وكيفية حسابها. ثم، سنرى كيف يمكن مراقبة هذه المقاييس.

الدقة

الدقة هي مقياس يقيس مدى دقة نموذج الذكاء الاصطناعي في تحديد الإيجابيات الحقيقية (الحالات التي يحدد فيها النموذج بشكل صحيح كائنًا أو حالة كما يفترض أن يكون). على سبيل المثال، في نظام التعرف على الوجوه، تحدث إيجابية حقيقية عندما يتعرف النظام بشكل صحيح على وجه شخص تم تدريبه على اكتشافه

لحساب الدقة، ابدأ بحساب عدد الإيجابيات الحقيقية. يمكنك بعد ذلك قسمة هذا على العدد الإجمالي للعناصر التي صنفها النموذج على أنها إيجابية. يشمل هذا المجموع كلاً من التعريفات الصحيحة والأخطاء، والتي تسمى الإيجابيات الكاذبة. بشكل أساسي، تخبرك الدقة عن عدد المرات التي يكون فيها النموذج صحيحًا عندما يدعي أنه تعرف على شيء ما.

__wf_reserved_inherit
الشكل 2. فهم الدقة.

إنه مهم بشكل خاص في السيناريوهات التي يمكن أن تكون فيها عواقب الإيجابيات الكاذبة مكلفة أو مدمرة. على سبيل المثال، في التصنيع الآلي، يشير معدل الدقة العالي إلى أن النظام يمكنه تحديد المنتجات المعيبة بشكل أكثر دقة ومنع التخلص غير الضروري من العناصر الجيدة أو إعادة صياغتها. مثال آخر جيد هو المراقبة الأمنية. تساعد الدقة العالية في تقليل الإنذارات الكاذبة والتركيز فقط على التهديدات الحقيقية التي تحتاج إلى استجابة أمنية.

الاسترجاع

يساعد الاسترجاع (Recall) في قياس قدرة نموذج الذكاء الاصطناعي على تحديد جميع الحالات ذات الصلة، أو الإيجابيات الحقيقية، داخل مجموعة البيانات. ببساطة، فهو يمثل مدى قدرة نظام الذكاء الاصطناعي على التقاط جميع الحالات الفعلية لحالة أو كائن مصمم للكشف عنه. يمكن حساب الاسترجاع عن طريق قسمة عدد الاكتشافات الصحيحة على إجمالي عدد الحالات الإيجابية التي كان ينبغي اكتشافها (وهو يتضمن كلاً من الحالات التي حددها النموذج بشكل صحيح والحالات التي فاتته).

تخيل نظام تصوير طبي مدعوم بالذكاء الاصطناعي يستخدم للكشف عن السرطان. يشير الاسترجاع، في هذا السياق، إلى النسبة المئوية لحالات السرطان الفعلية التي يحددها النظام بشكل صحيح. يعد الاسترجاع العالي أمرًا حيويًا في مثل هذه السيناريوهات لأن فقدان تشخيص السرطان يمكن أن يؤدي إلى عواقب وخيمة على رعاية المرضى.

الدقة مقابل الاسترجاع

تعتبر الدقة والاسترجاع وجهين لعملة واحدة عندما يتعلق الأمر بتقييم أداء نموذج الذكاء الاصطناعي، وغالبًا ما يتطلبان توازنًا. التحدي هو أن تحسين أحد المقاييس غالبًا ما يأتي على حساب الآخر. 

لنفترض أنك تسعى لتحقيق دقة أعلى. قد يصبح النموذج أكثر انتقائية ويكون قادرًا على تحديد الإيجابيات التي هو متأكد جدًا منها فقط. من ناحية أخرى، إذا كنت تهدف إلى تحسين الاسترجاع، فقد يحدد النموذج المزيد من الإيجابيات، ولكن هذا قد يشمل المزيد من الإيجابيات الكاذبة وينتهي به الأمر إلى خفض الدقة. 

يكمن المفتاح في إيجاد التوازن الصحيح بين الدقة والاسترجاع بناءً على الاحتياجات المحددة لتطبيقك. والأداة المفيدة لذلك هي منحنى الدقة والاسترجاع، الذي يوضح العلاقة بين المقاييس عند عتبات مختلفة. من خلال تحليل هذا المنحنى، يمكنك تحديد النقطة المثلى حيث يكون أداء النموذج هو الأفضل لحالة الاستخدام المحددة. يساعد فهم هذا التوازن عند ضبط نماذج الذكاء الاصطناعي بدقة لتحقيق الأداء الأمثل لحالات الاستخدام المقصودة.

__wf_reserved_inherit
الشكل 3. مثال على منحنى الدقة والاسترجاع.

متوسط الدقة المتوسط (mAP)

متوسط الدقة المتوسط (Mean Average Precision (mAP)) هو مقياس يستخدم لتقييم أداء نماذج الذكاء الاصطناعي لمهام مثل اكتشاف الكائنات، حيث يحتاج النموذج إلى تحديد و تصنيف كائنات متعددة داخل الصورة. يمنحك mAP درجة واحدة توضح مدى جودة أداء النموذج عبر جميع الفئات المختلفة التي تم تدريبه على التعرف عليها. دعنا نرى كيف يتم حسابه.

تمثل المساحة الواقعة أسفل منحنى الدقة والاسترجاع (Precision-Recall Curve) الدقة المتوسطة (Average Precision AP) لتلك الفئة. تقيس AP مدى دقة النموذج في إجراء التنبؤات لفئة معينة، مع الأخذ في الاعتبار كلاً من الدقة والاسترجاع عبر مستويات ثقة مختلفة (تشير مستويات الثقة إلى مدى يقين النموذج في تنبؤاته). بمجرد حساب AP لكل فئة، يتم تحديد mAP عن طريق حساب متوسط قيم AP هذه عبر جميع الفئات.

__wf_reserved_inherit
الشكل 4. متوسط دقة الفئات المختلفة.

تعد mAP مفيدة في تطبيقات مثل القيادة الذاتية، حيث يجب اكتشاف كائنات متعددة، مثل المشاة والمركبات وإشارات المرور، في وقت واحد. تعني النتيجة العالية لـ mAP أن النموذج يعمل باستمرار بشكل جيد عبر جميع الفئات، مما يجعله موثوقًا ودقيقًا في مجموعة واسعة من السيناريوهات.

احسب مقاييس الأداء بسهولة

قد تبدو معادلات وطرق حساب مقاييس أداء الذكاء الاصطناعي الرئيسية شاقة. ومع ذلك، يمكن لأدوات مثل حزمة Ultralytics أن تجعل الأمر بسيطًا وسريعًا. سواء كنت تعمل على مهام اكتشاف الكائنات أو التجزئة أو التصنيف، فإن Ultralytics توفر الأدوات المساعدة اللازمة لحساب المقاييس المهمة بسرعة مثل الدقة والاسترجاع ومتوسط الدقة المتوسط (mAP).

للبدء في حساب مقاييس الأداء باستخدام Ultralytics، يمكنك تثبيت حزمة Ultralytics كما هو موضح أدناه.

في هذا المثال، سنقوم بتحميل نموذج YOLOv8 مُدرَّب مسبقًا واستخدامه للتحقق من صحة مقاييس الأداء، ولكن يمكنك تحميل أي من النماذج التي توفرها Ultralytics. إليك كيفية القيام بذلك:

بمجرد تحميل النموذج، يمكنك إجراء التحقق من الصحة على مجموعة البيانات الخاصة بك. ستساعدك مقتطفة التعليمات البرمجية التالية في حساب مقاييس الأداء المختلفة، بما في ذلك الدقة والاسترجاع و mAP:

إن استخدام أدوات مثل Ultralytics يجعل حساب مقاييس الأداء أسهل بكثير، بحيث يمكنك قضاء المزيد من الوقت في تحسين النموذج الخاص بك ووقت أقل في القلق بشأن تفاصيل عملية التقييم.

كيف يتم قياس أداء الذكاء الاصطناعي بعد النشر؟

عند تطوير نموذج الذكاء الاصطناعي الخاص بك، من السهل اختبار أدائه في بيئة محكمة. ومع ذلك، بمجرد نشر النموذج، يمكن أن تصبح الأمور أكثر تعقيدًا. لحسن الحظ، هناك أدوات وأفضل الممارسات التي يمكن أن تساعدك على مراقبة حل الذكاء الاصطناعي الخاص بك بعد النشر

تم تصميم أدوات مثل Prometheus و Grafana و Evidently AI لتتبع أداء النموذج الخاص بك باستمرار. يمكنهم تقديم رؤى في الوقت الفعلي، واكتشاف الحالات الشاذة، وتنبيهك إلى أي مشكلات محتملة. تتجاوز هذه الأدوات المراقبة التقليدية من خلال تقديم حلول آلية وقابلة للتطوير تتكيف مع الطبيعة الديناميكية لنماذج الذكاء الاصطناعي قيد الإنتاج.

لقياس نجاح نموذج الذكاء الاصطناعي الخاص بك بعد النشر، إليك بعض أفضل الممارسات التي يجب اتباعها:

  • حدد مقاييس أداء واضحة: حدد مقاييس رئيسية مثل الدقة والاسترجاع ووقت الاستجابة للتحقق بانتظام من مدى جودة أداء النموذج الخاص بك.
  • تحقق بانتظام من انحراف البيانات: راقب التغييرات في البيانات التي يتعامل معها النموذج الخاص بك، لأن هذا يمكن أن يؤثر على تنبؤاته إذا لم تتم إدارته بشكل صحيح.
  • إجراء اختبار A/B: استخدم اختبار A/B لمقارنة أداء النموذج الحالي الخاص بك مقابل الإصدارات أو التعديلات الجديدة. سيسمح لك هذا بتقييم التحسينات أو الانحدارات في سلوك النموذج كميًا.
  • توثيق أداء النظام ومراجعته: احتفظ بسجلات تفصيلية لمقاييس الأداء والتغييرات التي تم إجراؤها على نظام الذكاء الاصطناعي الخاص بك. إنه أمر بالغ الأهمية لعمليات التدقيق، والامتثال، وتحسين بنية النموذج الخاص بك بمرور الوقت.

إن تحديد مؤشرات الأداء الرئيسية (KPIs) المثالية للذكاء الاصطناعي هو مجرد البداية.

يعتمد نشر وإدارة حلول الذكاء الاصطناعي بنجاح على اختيار مؤشرات الأداء الرئيسية (KPIs) المناسبة وتحديثها باستمرار. بشكل عام، يعد اختيار المقاييس التي تبرز مدى جودة أداء حل الذكاء الاصطناعي من الناحية الفنية ومن حيث التأثير على الأعمال أمرًا حيويًا. مع تغير الأمور، سواء كانت تطورات تكنولوجية أو تحولات في استراتيجية عملك، من المهم مراجعة مؤشرات الأداء الرئيسية هذه وتعديلها. 

من خلال الحفاظ على ديناميكية مراجعات الأداء، يمكنك الحفاظ على نظام الذكاء الاصطناعي الخاص بك وثيق الصلة وفعالًا. من خلال البقاء على اطلاع دائم بهذه المقاييس، ستكتسب رؤى قيمة تساعد في تحسين عملياتك. يضمن النهج الاستباقي أن تكون جهود الذكاء الاصطناعي الخاصة بك ذات قيمة حقيقية وتساعد في دفع عملك إلى الأمام!

انضم إلى مجتمعنا وابتكر معنا! استكشف مستودع GitHub الخاص بنا للاطلاع على أحدث تطورات الذكاء الاصطناعي. تعرف على كيف نعيد تشكيل صناعات مثل التصنيع و الرعاية الصحية بتقنية الذكاء الاصطناعي الرائدة. 🚀

لنبنِ مستقبل
الذكاء الاصطناعي معًا!

ابدأ رحلتك مع مستقبل تعلم الآلة

ابدأ مجانًا
تم نسخ الرابط إلى الحافظة