تحسين نماذج الذكاء الاصطناعي مع التقليم - تقليل التعقيد وتعزيز الكفاءة والنشر بشكل أسرع على الأجهزة المتطورة دون التضحية بالأداء.
التقليم هو تقنية تحسين النموذج المستخدمة لتقليل الحجم والتعقيد الحسابي للشبكة العصبية المدربة (NN). تتضمن هذه العملية تحديد وإزالة المعلمات الزائدة أو الأقل أهمية (الأوزان) أو البنى (الخلايا العصبية أو القنوات أو الطبقات) من النموذج. والهدف من ذلك هو إنشاء نموذج أصغر وأسرع وأكثر كفاءة في استخدام الطاقة يحافظ على مستوى دقة مماثل للنموذج الأصلي. وهذا أمر بالغ الأهمية بشكل خاص لنشر نماذج ذكاء اصطناعي معقدة في بيئات محدودة الموارد، مثل الأجهزة المتطورة.
تبدأ عملية التقليم عادةً بعد تدريب نموذج التعلم العميق بشكل كامل. وتعمل هذه العملية على مبدأ أن العديد من النماذج الكبيرة تكون مفرطة المعالم، مما يعني أنها تحتوي على العديد من الأوزان والخلايا العصبية التي لا تساهم إلا بالقليل جداً في التنبؤ النهائي. هناك طريقة شائعة لتحديد هذه المكونات غير المهمة من خلال تحليل حجمها؛ حيث تُعتبر المعلمات ذات القيم القريبة من الصفر أقل أهمية. وبمجرد تحديدها، يتم إزالة هذه المعلمات أو تعيينها إلى الصفر. بعد عملية التقليم، عادةً ما تخضع الشبكة الأصغر الآن لعملية ضبط دقيق، والتي تتضمن إعادة تدريب النموذج لبضع دورات تدريبية أخرى. تساعد هذه الخطوة المعلمات المتبقية على التكيف مع التغييرات المعمارية واستعادة أي أداء قد يكون فُقد أثناء عملية التقليم. يمكن تكرار هذه العملية التكرارية للتشذيب والضبط الدقيق لتحقيق التوازن المطلوب بين حجم النموذج والأداء، كما هو موضح في الأوراق البحثية التأسيسية مثل"الضغط العميق".
يمكن تصنيف تقنيات التقليم بشكل عام بناءً على ما تتم إزالته من الشبكة:
تقدم أطر عمل التعلم الآلي الرئيسية مثل PyTorch و TensorFlow أدوات مساعدة مدمجة وبرامج تعليمية لتنفيذ التقليم.
يعد التقليم ضروريًا لنشر نماذج الذكاء الاصطناعي القوية في السيناريوهات العملية حيث تكون الموارد الحاسوبية محدودة.
التقليم هو أحد الأساليب العديدة لتحسين النموذج، وغالبًا ما يُستخدم إلى جانب أساليب أخرى. من المهم تمييزه عن المفاهيم ذات الصلة:
هذه التقنيات لا يستبعد بعضها بعضاً. يتمثل سير العمل الشائع في تشذيب النموذج أولاً لإزالة المعلمات الزائدة عن الحاجة، ثم تطبيق التكميم على النموذج المشذّب لتحقيق أقصى قدر من الكفاءة. يمكن بعد ذلك تصدير النماذج المحسّنة إلى تنسيقات قياسية مثل ONNX باستخدام وظيفة تصدير Ultralytics للنشر على نطاق واسع عبر محركات الاستدلال المختلفة. يمكن أن تساعد المنصات مثل Ultralytics HUB في إدارة دورة الحياة بأكملها، بدءًا من التدريب وحتى نشر النموذج الأمثل.