Yolo فيجن شنتشن
شنتشن
انضم الآن

5 أسباب لفشل نماذج الرؤية الحاسوبية في مرحلة الإنتاج

تعرف على أسباب فشل نماذج الرؤية الحاسوبية في مرحلة الإنتاج، بدءًا من عدم توافق البيانات وصولاً إلى زمن الاستجابة، وكيف يمكن للفرق تحسين أداء النماذج في أنظمة الذكاء الاصطناعي للرؤية في العالم الواقعي.

قم بتوسيع نطاق مشاريع الرؤية الحاسوبية الخاصة بك باستخدام Ultralytics

ابدأ

أصبحت الرؤية الحاسوبية اليوم إحدى التقنيات الرئيسية في مجال الذكاء الاصطناعي، حيث يتم اعتمادها في معظم القطاعات، مما يمكّن الآلات من تفسير البيانات المرئية وتحليلها لأداء مجموعة متنوعة من المهام. وتدعم هذه الأنظمة العديد من التطبيقات العملية، بدءًا من التصوير الطبي والروبوتات وصولاً إلى التصنيع وأتمتة عمليات البيع بالتجزئة.

ومع ذلك، فإن بناء نظام للرؤية الحاسوبية ليس بالأمر السهل دائمًا. فعادةً ما يتطلب ذلك تطوير نموذج ذكاء اصطناعي للرؤية يتم تدريبه على التعرف على الأنماط في الصور ومقاطع الفيديو لدعم مهام مثل اكتشاف الأجسام وتتبعها.

الشكل 1. مثال على اكتشاف الأجسام وتتبعها (المصدر)

على الرغم من التطور الذي شهدته نماذج الرؤية الحاسوبية على مر السنين، إلا أنها لا تزال تتصرف بشكل مختلف أثناء مرحلة التطوير مقارنةً بما بعد نشرها في بيئات العمل الفعلية. ويرجع ذلك إلى أن نشر النماذج خارج بيئات التطوير الخاضعة للرقابة يطرح تحديات جديدة وغالبًا ما تكون غير متوقعة.

قد تؤدي عوامل مثل قلة التنوع في مجموعات البيانات، وسوء مراقبة النماذج، والقيود المتعلقة بالبنية التحتية، إلى اختلاف سلوك النموذج نفسه في الواقع بعد نشره. 

في هذا المقال، سنتناول خمسة أسباب شائعة قد تؤدي إلى فشل نماذج الرؤية الحاسوبية في بيئة الإنتاج. فلنبدأ!

الفجوة بين تدريب النموذج والإنتاج 

يتم تدريب النماذج عادةً في بيئة خاضعة للرقابة. وخلال هذه المرحلة، يعمل مطورو الذكاء الاصطناعي على مجموعات بيانات تدريبية تم إعدادها بعناية. 

تتضمن هذه المجموعات الضخمة من البيانات المرئية تعليقات توضيحية منظمة بشكل جيد، أو علامات تصف محتوى كل صورة. كما يتم التدريب في ظل ظروف ثابتة، مما يتيح لنماذج الذكاء الاصطناعي الخاصة بالرؤية تعلم الأنماط المرئية بفعالية.

لضمان تعلم هذه الأنماط بشكل صحيح، يمكن تقييم النماذج بشكل منهجي أثناء التطوير باستخدام مقاييس تقييم قياسية ومجموعات بيانات مرجعية. وعلى غرار مجموعات بيانات التدريب، يتم إعداد مجموعات البيانات المرجعية هذه بعناية أيضًا. 

ومع ذلك، قد تختلف البيانات التي تواجهها أنظمة الرؤية الحاسوبية في العالم الواقعي اختلافًا كبيرًا عن البيانات المستخدمة أثناء التدريب والتقييم. وبمجرد نشرها، نادرًا ما تعمل هذه النماذج في ظل ظروف خاضعة للرقابة.

قد يضطرون في نهاية المطاف إلى معالجة الصور ومقاطع الفيديو الواردة من بيئات غير متوقعة، حيث تتغير الإضاءة باستمرار، وتتبدل زوايا الكاميرا، وتتنوع الخلفيات بمرور الوقت. على سبيل المثال، قد يواجه نموذج الذكاء الاصطناعي البصري المُدرَّب على كشف حركة المرور صعوبة في detect ليلاً إذا كان قد تم تدريبه وتقييمه بشكل أساسي على صور التقطت في وضح النهار.

الشكل 2. حتى بعد تحسين الجودة، تظل الصور الليلية صعبة التفسير بالنسبة للنماذج التي تم تدريبها على الصور النهارية. (المصدر)

هذا الاختلاف بين مرحلة التطوير ومرحلة النشر الفعلي يُعرف بالفجوة بين بيئة التدريب وبيئة الإنتاج. وبسبب هذه الفجوة، لا تظهر العديد من حالات فشل النماذج إلا بعد النشر، مما يجعل الإدراك المبكر لهذه الحالات أمراً ضرورياً لبناء أنظمة رؤية حاسوبية أكثر موثوقية وقوة.

5 أسباب شائعة لفشل نماذج الرؤية الحاسوبية في مرحلة الإنتاج

بعد ذلك، دعونا نلقي نظرة عن كثب على خمسة أسباب شائعة لفشل نماذج الرؤية الحاسوبية في مرحلة الإنتاج.

1. مجموعات بيانات التدريب منخفضة الجودة 

تلعب مجموعات البيانات دورًا محوريًا في تدريب نماذج الرؤية الحاسوبية، لأنها تحدد ما يتعلمه النموذج أثناء التدريب وكيف يستجيب للمدخلات الواقعية بعد نشره. ويكتسب هذا الأمر أهمية خاصة في التعلم الخاضع للإشراف، حيث تتعلم النماذج من أمثلة مصنفة توضح ما تمثله كل صورة. 

تعتمد العديد من نماذج التعلم العميق، بما في ذلك الشبكات العصبية التلافيفية (CNN)، على هذه الأمثلة المصنفة للتعرف على الأنماط في البيانات المرئية. ومع ذلك، عندما لا تعكس مجموعة بيانات التدريب الظروف الواقعية، قد يتعلم النموذج أنماطًا لا تمثل تمامًا كيف تظهر الكائنات خارج نطاق بيانات التدريب. 

على سبيل المثال، قد لا detect النموذج الذي تم تدريبه على مجموعة بيانات تحتوي على عيوب شقوق كبيرة detect نادر من الشقوق الطفيفة في عمليات التصنيع الفعلية. وبالمثل، يمكن أن تؤثر جودة التعليقات التوضيحية أيضًا على سلوك النموذج. فقد تؤدي التسميات غير المتسقة أو التفاصيل المفقودة في البيانات المصنفة إلى تعلم النموذج لمعلومات غير صحيحة أثناء التدريب. 

الشكل 3. نظرة على التعليقات التوضيحية للصور (المصدر)

بشكل عام، تعد جودة بيانات التدريب وتنوعها عاملين حاسمين، ويمكن أن يحددا مدى جودة أداء النموذج في التطبيقات العملية. فعندما تكون مجموعات البيانات ممثلة للواقع ومصنفة بدقة، يكون أداء النموذج عمومًا أكثر موثوقية عند نشره.

2. الإفراط في التكييف والتعميم

تتعلم نماذج التعلم الآلي، مثل نماذج الرؤية، الأنماط من مجموعات البيانات التدريبية. لكن في بعض الأحيان، قد يعتمد النموذج بشكل مفرط على عدد قليل من الأنماط. 

بدلاً من تعلم العلاقات البصرية الأوسع نطاقاً، قد ينتهي الأمر به إلى حفظ الأنماط المحدودة الموجودة في بيانات التدريب. ويُعرف هذا السلوك باسم «التكيف المفرط».

عادةً ما يحدث الإفراط في الملاءمة عندما تكون مجموعات البيانات المستخدمة في التدريب صغيرة الحجم أو تفتقر إلى التنوع الكافي في البيانات. وفي مثل هذه الحالات، يصبح النموذج بارعًا في التعرف على الصور التي سبق له رؤيتها، لكنه يواجه صعوبة في تفسير البيانات الجديدة أو المدخلات غير المألوفة.

ونتيجة لذلك، قد يُظهر النموذج أداءً جيدًا عند اختباره بمدخلات اختبارية (نظرًا لتشابهها مع بيانات التدريب)، لكنه قد يتصرف بشكل مختلف في ظل ظروف جديدة بعد نشره. ولهذا السبب، يُعد مفهوم التعميم أمرًا بالغ الأهمية. وببساطة، فهو يصف مدى قدرة النماذج على تطبيق ما تعلمته أثناء التدريب على سيناريوهات جديدة. 

للحد من ظاهرة «التكيف المفرط»، غالبًا ما يقوم عشاق الذكاء الاصطناعي بتدريب النماذج على مجموعات بيانات أكثر تنوعًا، كما يطبقون «تكثيف البيانات»، وهي طريقة تعمل على تعديل الصور المستخدمة في التدريب بشكل طفيف لإحداث مزيد من التنوع في البيانات. وبدون مراعاة هذه العوامل، قد ينخفض أداء النموذج بسرعة بمجرد بدء تشغيل النظام في بيئات واقعية.

الشكل 4. يمكن أن تساعد عملية توسيع البيانات في إنشاء أشكال متنوعة لنفس الصورة ضمن مجموعة البيانات. (المصدر)

3. الحالات الاستثنائية الخفية في البيئات الواقعية

حتى عندما تتمكن نماذج الرؤية الحاسوبية من التعميم بشكل جيد على البيانات الجديدة، قد تظهر في البيئات الواقعية حالات استثنائية غير متوقعة. وهذه هي المواقف غير المعتادة التي تختلف عن الأنماط النموذجية التي يتعلمها النموذج أثناء التدريب. 

يصعب التقاط العديد من هذه السيناريوهات أثناء مرحلة التطوير لأنها نادرة الحدوث، أو يصعب إعادة تمثيلها، أو قد يكون جمعها كبيانات تدريب مكلفًا. على سبيل المثال، قد تظهر الأجسام بأشكال غير معتادة، أو تتحرك بطريقة غير متوقعة، أو تصبح مخفية جزئيًا خلف أجسام أخرى. 

كما أن التغيرات في الإضاءة أو زوايا الكاميرا أو ظروف الخلفية قد تؤدي إلى ظهور حالات تجعل عملية التعرف أكثر صعوبة. وغالبًا ما لا تظهر هذه الحالات الاستثنائية إلا بعد نشر النظام في التطبيقات العملية. 

في مجال الروبوتات وأتمتة التصنيع، على سبيل المثال، قد يتم وضع العناصر أو ترتيبها بطريقة تختلف عما هو متوقع، مما يؤدي إلى ظهور مواقف لم يُصمم النموذج للتعامل معها. وفي النهاية، قد تصبح التوقعات التي بدت موثوقة أثناء الاختبار أقل اتساقًا بمجرد بدء تشغيل النظام في بيئات واقعية.

4. عدم وجود مراقبة وتصحيح للأخطاء بعد النشر 

بالإضافة إلى تطوير نموذج الذكاء الاصطناعي للرؤية، من الضروري مراقبة أدائه وتحسينه. ومع ذلك، فبمجرد بدء تشغيل النظام، غالبًا ما يتحول التركيز إلى مجرد الحفاظ على استمرار عمله بدلاً من المتابعة الدقيقة لأدائه بمرور الوقت. ونتيجة لذلك، قد تمر التغيرات في سلوك النموذج دون أن يلاحظها أحد.

وفي الوقت نفسه، يمكن لعوامل مثل التغيرات في البيانات الواردة أو إعدادات الكاميرا أو بيئات التشغيل أن تؤثر تدريجيًا على دقة اكتشاف النموذج للأشياء أو تصنيفها. وهذه التغيرات ليست دائمًا واضحة وقد تمر دون أن يلاحظها أحد أثناء التشغيل اليومي.

يمكن أن تساعد مراقبة مخرجات النماذج وسلوك النظام بشكل عام الفرق على اكتشاف هذه المشكلات في مرحلة مبكرة. وتتيح عمليات الفحص المنتظمة وإجراءات التحقق من الصحة وسير عمل تصحيح الأخطاء للفرق التحقيق في النتائج غير المعتادة وفهم الأسباب المحتملة وراءها. 

لنأخذ قطاعات مثل التصنيع على سبيل المثال؛ فقد يحدث أن يخطئ النموذج فجأة في التعرف على الأجسام الموجودة على خط التجميع بعد إجراء تغيير في إعدادات الكاميرا. track نظام الذكاء الاصطناعي للرؤية بعد نشره يجعل من الأسهل الاستجابة لهذه التغييرات والحفاظ على أداء مستقر في البيئات الواقعية.

5. قيود البنية التحتية وزمن الاستجابة

تحتاج العديد من أنظمة الرؤية الحاسوبية إلى العمل في الوقت الفعلي، مما قد يضع ضغطًا كبيرًا على الأجهزة والشبكات ومسارات المعالجة. وعندما تكون الموارد محدودة، قد تحدث تأخيرات في الحساب أو في زمن انتقال الشبكة، مما يؤدي إلى وصول التنبؤات ببطء شديد ويؤثر على الأداء العام للنظام.

في بعض الحالات، قد تتسبب نماذج التعلم العميق المتقدمة أيضًا في ظهور تحديات على صعيد البنية التحتية. فعلى سبيل المثال، صُممت البنى القائمة على «المحول» (Transformer) لمعالجة كميات ضخمة من البيانات المرئية وتعلم العلاقات المعقدة داخل الصور، لكنها غالبًا ما تتطلب موارد حاسوبية ضخمة. وقد يتطلب تشغيل هذه النماذج أجهزة أكثر قوة أو أعلى تكلفة.

بدون التحسين المناسب، قد تتباطأ أداء النماذج التي تعمل بسرعة أثناء الاختبار أو تتصرف بشكل غير متسق بعد النشر. وللتصدي لهذه المشكلة، غالبًا ما تعمل الفرق على تحسين مسارات العمل، وتقليل تعقيد النماذج حيثما أمكن، وتحقيق التوازن بين الدقة والسرعة. 

ويمكن أن يشمل ذلك ضغط النماذج الكبيرة إلى نسخ أخف وزناً، أو استخدام بنى أكثر كفاءة، أو معالجة الصور بدقة أقل حتى يعمل النظام بسلاسة على الأجهزة المتاحة. وفي كثير من الحالات، تختار الفرق أيضاً نماذج خفيفة الوزن وأسرع مثل Ultralytics للمساعدة في تلبية متطلبات النشر.

أفضل الممارسات لمنع فشل نماذج الرؤية الحاسوبية

فيما يلي بعض أفضل الممارسات التي يمكن أن تساعد في تقليل حالات الفشل عند نشر نماذج الرؤية الحاسوبية في بيئة الإنتاج:

  • استخدم استراتيجيات النشر التدريجي: قم بإدخال النماذج إلى بيئة الإنتاج بشكل تدريجي حتى تتمكن الفرق من مراقبة أدائها وإجراء التعديلات عند الحاجة.
  • دمج حلقات التغذية الراجعة: اجمع صورًا جديدة وراجع التنبؤات غير الصحيحة لإعادة تدريب النماذج باستخدام مجموعات بيانات محدثة وتحسين الأداء بمرور الوقت.
  • قيود نموذج الوثيقة: قم بتوثيق الحالات التي قد يواجه فيها النموذج صعوبات بشكل واضح، حتى تتمكن الفرق من توقع المشكلات المحتملة أثناء النشر.
  • التصميم لمراعاة التباينات في العالم الواقعي: يمكن أن يساعد التخطيط المسبق لمراعاة التباينات في الإضاءة وزوايا الكاميرا وموضع الكائنات أو ظروف الخلفية في ضمان استقرار النماذج في سيناريوهات التشغيل المختلفة.

النقاط الرئيسية

نادراً ما تفشل نماذج الرؤية الحاسوبية بسبب ضعف الخوارزميات نفسها. ففي معظم الحالات، يكمن التحدي الحقيقي في البيئات التي تعمل فيها هذه الأنظمة. فالنماذج التي تحقق أداءً جيداً أثناء التدريب غالباً ما تواجه ظروفاً غير متوقعة في العالم الواقعي قد تؤثر على سلوكها.

ولهذا السبب، فإن بناء أنظمة ذكاء اصطناعي موثوقة في مجال الرؤية يتطلب أكثر من مجرد تدريب النموذج. فهو ينطوي أيضًا على إعداد مجموعات البيانات بعناية، ومراقبة أداء النموذج بعد نشره، وتكييف الأنظمة باستمرار مع الظروف الواقعية. 

هل ترغب في استكشاف المزيد عن الذكاء الاصطناعي في مجال الرؤية؟ انضم إلى مجتمعنا واقرأ عن تطبيقات مثل الذكاء الاصطناعي في قطاع السيارات والرؤية الحاسوبية في مجال الخدمات اللوجستية. اطلع على خيارات الترخيص المتاحة لدينا لبدء العمل في مشاريع الرؤية الحاسوبية. تفضل بزيارة مستودع GitHub الخاص بنا لمعرفة المزيد. 

لنبني مستقبل الذكاء الاصطناعي معًا!

ابدأ رحلتك مع مستقبل تعلم الآلة