لقد استكشفنا سابقًا كيف يمكن استخدام الذكاء الاصطناعي في صناعات مختلفة مثل الرعاية الصحية و التصنيع و السياحة. لقد بحثنا أيضًا في كيف يمكن للذكاء الاصطناعي تحسين مهام العمل اليومية وناقشنا أفكار الأعمال التجارية الرائدة في مجال الذكاء الاصطناعي. تؤدي كل هذه المناقشات حتمًا إلى نفس السؤال الرئيسي: كيف يمكننا قياس نجاح عمليات تنفيذ الذكاء الاصطناعي هذه؟ إنه سؤال مهم لأنه ببساطة نشر حلول الذكاء الاصطناعي لا يكفي. إن التأكد من أن هذه الحلول تحقق نتائج بالفعل هو ما يجعلها تغير قواعد اللعبة.

يمكننا قياس مقاييس أداء الذكاء الاصطناعي لتحديد ما إذا كان نموذج الذكاء الاصطناعي فعالاً حقًا في جعل العمليات أكثر كفاءة أو إطلاق العنان للابتكار أو حل المشكلات. من خلال التركيز على مؤشرات الأداء الرئيسية (KPIs) الصحيحة، يمكننا فهم مدى جودة عمل حل الذكاء الاصطناعي وأين قد يحتاج إلى تحسين.

في هذه المقالة، سنلقي نظرة على كيفية قياس نجاح تطبيقات الذكاء الاصطناعي باستخدام مؤشرات الأداء الرئيسية الأكثر صلة. سنغطي الاختلافات بين مؤشرات الأداء الرئيسية للأعمال ومؤشرات الأداء الرئيسية لأداء الذكاء الاصطناعي، ونستعرض مقاييس رئيسية مثل الدقة والاسترجاع، ونساعدك على اختيار أفضل مؤشرات الأداء الرئيسية لحلول الذكاء الاصطناعي الخاصة بك.

الفرق بين مؤشرات الأداء الرئيسية للأعمال التجارية للذكاء الاصطناعي ومؤشرات الأداء الرئيسية لأداء الذكاء الاصطناعي

__wf_reserved_inherit — الشكل 1. مقارنة بين مؤشرات الأداء الرئيسية للأعمال التجارية التي تعتمد على الذكاء الاصطناعي ومؤشرات أداء الذكاء الاصطناعي.

‍

عندما تفكر في مؤشرات الأداء الرئيسية (KPIs)، فمن الطبيعي أن تفترض أنها تدور حول مقاييس الأعمال مثل عائد الاستثمار (ROI) أو توفير التكاليف أو الإيرادات الناتجة - خاصةً عند الحديث عن الذكاء الاصطناعي للمؤسسات. تقيس مؤشرات الأداء الرئيسية للأعمال التي تعمل بالذكاء الاصطناعي مدى تأثير الذكاء الاصطناعي على النجاح العام للشركة وتتوافق مع أهداف العمل الأوسع.

ومع ذلك، تركز مؤشرات الأداء الرئيسية للذكاء الاصطناعي على مدى جودة أداء نظام الذكاء الاصطناعي نفسه، باستخدام مقاييس مثل الدقة والاسترجاع والضبط. سنتناول تفاصيل هذه المقاييس أدناه، ولكن بشكل أساسي، بينما تعرض مؤشرات الأداء الرئيسية للأعمال الفوائد المالية والاستراتيجية للذكاء الاصطناعي، فإن مؤشرات الأداء الرئيسية تتأكد من أن نموذج الذكاء الاصطناعي يقوم بعمله بفعالية.

يمكن لبعض المقاييس أن تخدم كلا الغرضين في الواقع. على سبيل المثال، مكاسب الكفاءة، مثل تقليل الوقت أو الموارد المطلوبة لإكمال مهمة ما، يمكن أن تكون مؤشر أداء رئيسي (KPI) للأداء (توضح مدى جودة عمل حل الذكاء الاصطناعي) ومؤشر أداء رئيسي للأعمال (يقيس توفير التكاليف وتحسينات الإنتاجية). رضا العملاء هو مقياس آخر متعدد الجوانب. يمكن أن يعكس نجاح أداة خدمة العملاء المدعومة بالذكاء الاصطناعي من حيث أدائها التقني وتأثيرها على أهداف العمل الشاملة.

فهم مقاييس الأداء الرئيسية للذكاء الاصطناعي

هناك عدد قليل من المقاييس الشائعة المستخدمة لقياس مدى جودة أداء نموذج الذكاء الاصطناعي. أولاً، سنلقي نظرة على تعريفها وكيفية حسابها. ثم، سنرى كيف يمكن مراقبة هذه المقاييس.

الدقة

الدقة هي مقياس يقيس مدى دقة نموذج الذكاء الاصطناعي في تحديد الإيجابيات الحقيقية (الحالات التي يحدد فيها النموذج كائنًا أو حالة بشكل صحيح كما هو مفترض). على سبيل المثال، في نظام التعرّف على الوجه، قد تحدث النتيجة الإيجابية الحقيقية عندما يتعرّف النظام بشكل صحيح على وجه شخص تم تدريبه على detect.

لحساب الدقة، ابدأ بحساب عدد الإيجابيات الحقيقية. يمكنك بعد ذلك قسمة هذا على العدد الإجمالي للعناصر التي صنفها النموذج على أنها إيجابية. يشمل هذا المجموع كلاً من التعريفات الصحيحة والأخطاء، والتي تسمى الإيجابيات الكاذبة. بشكل أساسي، تخبرك الدقة عن عدد المرات التي يكون فيها النموذج صحيحًا عندما يدعي أنه تعرف على شيء ما.

‍

إنه مهم بشكل خاص في السيناريوهات التي يمكن أن تكون فيها عواقب الإيجابيات الكاذبة مكلفة أو مدمرة. على سبيل المثال، في التصنيع الآلي، يشير معدل الدقة العالي إلى أن النظام يمكنه تحديد المنتجات المعيبة بشكل أكثر دقة ومنع التخلص غير الضروري من العناصر الجيدة أو إعادة صياغتها. مثال آخر جيد هو المراقبة الأمنية. تساعد الدقة العالية في تقليل الإنذارات الكاذبة والتركيز فقط على التهديدات الحقيقية التي تحتاج إلى استجابة أمنية.

الاسترجاع

يساعد الاستدعاء في قياس قدرة نموذج الذكاء الاصطناعي على تحديد جميع الحالات ذات الصلة، أو الحالات الإيجابية الحقيقية، ضمن مجموعة بيانات. ببساطة، فهو يمثل ببساطة مدى قدرة نظام الذكاء الاصطناعي على التقاط جميع الحالات الفعلية لحالة أو كائن صُمم detect. يمكن حساب التذكر بقسمة عدد الاكتشافات الصحيحة على العدد الإجمالي للحالات الإيجابية التي كان ينبغي اكتشافها (ويشمل ذلك الحالات التي حددها النموذج بشكل صحيح والحالات التي لم يكتشفها).

تخيل نظام تصوير طبي مدعوم بالذكاء الاصطناعي يستخدم للكشف عن السرطان. يشير الاسترجاع، في هذا السياق، إلى النسبة المئوية لحالات السرطان الفعلية التي يحددها النظام بشكل صحيح. يعد الاسترجاع العالي أمرًا حيويًا في مثل هذه السيناريوهات لأن فقدان تشخيص السرطان يمكن أن يؤدي إلى عواقب وخيمة على رعاية المرضى.

الدقة مقابل الاسترجاع

تعتبر الدقة والاسترجاع وجهين لعملة واحدة عندما يتعلق الأمر بتقييم أداء نموذج الذكاء الاصطناعي، وغالبًا ما يتطلبان توازنًا. التحدي هو أن تحسين أحد المقاييس غالبًا ما يأتي على حساب الآخر.

لنفترض أنك تسعى لتحقيق دقة أعلى. قد يصبح النموذج أكثر انتقائية ويكون قادرًا على تحديد الإيجابيات التي هو متأكد جدًا منها فقط. من ناحية أخرى، إذا كنت تهدف إلى تحسين الاسترجاع، فقد يحدد النموذج المزيد من الإيجابيات، ولكن هذا قد يشمل المزيد من الإيجابيات الكاذبة وينتهي به الأمر إلى خفض الدقة.

يكمن المفتاح في إيجاد التوازن الصحيح بين الدقة والاسترجاع بناءً على الاحتياجات المحددة لتطبيقك. والأداة المفيدة لذلك هي منحنى الدقة والاسترجاع، الذي يوضح العلاقة بين المقاييس عند عتبات مختلفة. من خلال تحليل هذا المنحنى، يمكنك تحديد النقطة المثلى حيث يكون أداء النموذج هو الأفضل لحالة الاستخدام المحددة. يساعد فهم هذا التوازن عند ضبط نماذج الذكاء الاصطناعي بدقة لتحقيق الأداء الأمثل لحالات الاستخدام المقصودة.

‍

متوسط الدقة المتوسطةmAP

متوسط الدقة المتوسطةmAP) هو مقياس يُستخدم لتقييم أداء نماذج الذكاء الاصطناعي لمهام مثل اكتشاف الأجسام، حيث يحتاج النموذج إلى تحديد classify متعدد الكائنات داخل الصورة. يمنحك mAP درجة واحدة تُظهر مدى جودة أداء النموذج عبر جميع الفئات المختلفة التي تم تدريبه على التعرف عليها. دعنا نرى كيف يتم حسابها.

المنطقة تحت منحنى الدقة والاستدعاء تعطي متوسط الدقةAP) لتلك الفئة. يقيس متوسط AP مدى دقة النموذج في إجراء تنبؤات لفئة معينة، مع الأخذ في الاعتبار كلًا من الدقة والاستدعاء عبر مستويات الثقة المختلفة (تشير مستويات الثقة إلى مدى تأكد النموذج من تنبؤاته). بمجرد حساب متوسط AP لكل فئة، يتم تحديد mAP AP لكل فئة من خلال حساب متوسط قيم AP لكل فئة.

‍

تُعد mAP مفيدة في تطبيقات مثل القيادة الذاتية، حيث يجب اكتشاف العديد من الأجسام، مثل المشاة والمركبات وإشارات المرور، في وقت واحد. تعني درجة mAP المرتفعة أن النموذج يؤدي أداءً جيدًا باستمرار في جميع الفئات، مما يجعله موثوقًا ودقيقًا في مجموعة واسعة من السيناريوهات.

احسب مقاييس الأداء بسهولة

قد تبدو معادلات وطرق حساب مقاييس الأداء الرئيسية للذكاء الاصطناعي شاقة. ومع ذلك، يمكن لأدوات مثل حزمةUltralytics أن تجعل الأمر بسيطًا وسريعًا. سواء كنت تعمل على مهام اكتشاف الكائنات أو التجزئة أو التصنيف، توفر Ultralytics الأدوات المساعدة اللازمة لحساب المقاييس المهمة بسرعة مثل الدقة والاستدعاء ومتوسط الدقةmAP).

لبدء حساب مقاييس الأداء باستخدام Ultralytics يمكنك تثبيت حزمة Ultralytics كما هو موضح أدناه.

في هذا المثال، سنقوم في هذا المثال بتحميل نموذج YOLOv8 المدرب مسبقًا واستخدامه للتحقق من صحة مقاييس الأداء، ولكن يمكنك تحميل أي من النماذج المدعومة التي يوفرها Ultralytics. إليك كيفية القيام بذلك:

بمجرد تحميل النموذج، يمكنك إجراء التحقق من صحة مجموعة البيانات الخاصة بك. سيساعدك مقتطف الشيفرة التالي في حساب مقاييس الأداء المختلفة، بما في ذلك الدقة والاستدعاء و mAP:

إن استخدام أدوات مثل Ultralytics يجعل حساب مقاييس الأداء أسهل بكثير، بحيث يمكنك قضاء المزيد من الوقت في تحسين نموذجك ووقت أقل في القلق بشأن تفاصيل عملية التقييم.

كيف يتم قياس أداء الذكاء الاصطناعي بعد النشر؟

عند تطوير نموذج الذكاء الاصطناعي الخاص بك، من السهل اختبار أدائه في بيئة محكمة. ومع ذلك، بمجرد نشر النموذج، يمكن أن تصبح الأمور أكثر تعقيدًا. لحسن الحظ، هناك أدوات وأفضل الممارسات التي يمكن أن تساعدك على مراقبة حل الذكاء الاصطناعي الخاص بك بعد النشر.

صُممت أدوات مثل Prometheus وGrafana وEvidently AI track أداء نموذجك باستمرار. ويمكنها تقديم رؤى في الوقت الحقيقي، detect الحالات الشاذة، وتنبيهك إلى أي مشاكل محتملة. تتجاوز هذه الأدوات المراقبة التقليدية من خلال تقديم حلول آلية قابلة للتطوير تتكيف مع الطبيعة الديناميكية لنماذج الذكاء الاصطناعي في الإنتاج.

لقياس نجاح نموذج الذكاء الاصطناعي الخاص بك بعد النشر، إليك بعض أفضل الممارسات التي يجب اتباعها:

حدد مقاييس أداء واضحة: حدد مقاييس رئيسية مثل الدقة والاسترجاع ووقت الاستجابة للتحقق بانتظام من مدى جودة أداء النموذج الخاص بك.
‍
تحقق بانتظام من انحراف البيانات: راقب التغييرات في البيانات التي يتعامل معها النموذج الخاص بك، لأن هذا يمكن أن يؤثر على تنبؤاته إذا لم تتم إدارته بشكل صحيح.
‍
إجراء اختبار A/B: استخدم اختبار A/B لمقارنة أداء النموذج الحالي الخاص بك مقابل الإصدارات أو التعديلات الجديدة. سيسمح لك هذا بتقييم التحسينات أو الانحدارات في سلوك النموذج كميًا.
‍
توثيق أداء النظام ومراجعته: احتفظ بسجلات تفصيلية لمقاييس الأداء والتغييرات التي تم إجراؤها على نظام الذكاء الاصطناعي الخاص بك. إنه أمر بالغ الأهمية لعمليات التدقيق، والامتثال، وتحسين بنية النموذج الخاص بك بمرور الوقت.

إن تحديد مؤشرات الأداء الرئيسية (KPIs) المثالية للذكاء الاصطناعي هو مجرد البداية.

يعتمد نشر وإدارة حلول الذكاء الاصطناعي بنجاح على اختيار مؤشرات الأداء الرئيسية (KPIs) المناسبة وتحديثها باستمرار. بشكل عام، يعد اختيار المقاييس التي تبرز مدى جودة أداء حل الذكاء الاصطناعي من الناحية الفنية ومن حيث التأثير على الأعمال أمرًا حيويًا. مع تغير الأمور، سواء كانت تطورات تكنولوجية أو تحولات في استراتيجية عملك، من المهم مراجعة مؤشرات الأداء الرئيسية هذه وتعديلها.

من خلال الحفاظ على ديناميكية مراجعات الأداء، يمكنك الحفاظ على نظام الذكاء الاصطناعي الخاص بك وثيق الصلة وفعالًا. من خلال البقاء على اطلاع دائم بهذه المقاييس، ستكتسب رؤى قيمة تساعد في تحسين عملياتك. يضمن النهج الاستباقي أن تكون جهود الذكاء الاصطناعي الخاصة بك ذات قيمة حقيقية وتساعد في دفع عملك إلى الأمام!

انضم إلى مجتمعنا وابتكر معنا! استكشف مستودع GitHub الخاص بنا للاطلاع على أحدث تطورات الذكاء الاصطناعي. تعرف على كيف نعيد تشكيل صناعات مثل التصنيع و الرعاية الصحية بتقنية الذكاء الاصطناعي الرائدة. 🚀

قياس أداء الذكاء الاصطناعي لتقييم تأثير ابتكاراتك

الفرق بين مؤشرات الأداء الرئيسية للأعمال التجارية للذكاء الاصطناعي ومؤشرات الأداء الرئيسية لأداء الذكاء الاصطناعي