Pruning
تعرف على كيفية قيام التقليم بتحسين الشبكات العصبية مثل Ultralytics YOLO26 عن طريق إزالة المعلمات الزائدة. استكشف الأساليب المنظمة وغير المنظمة لذكاء الحافة.
التقليم هو تقنية استراتيجية لـ تحسين النموذج تُستخدم لتقليل حجم وتعقيد الشبكات العصبية من خلال إزالة المعلمات غير الضرورية. ومثلما يقوم البستاني بتقليم الفروع الميتة أو الزائدة لمساعدة الشجرة على النمو، تحدد خوارزميات التقليم الأوزان والانحيازات الزائدة التي لا تساهم كثيرًا في القدرة التنبؤية للنموذج وتزيلها. الهدف الأساسي هو إنشاء نموذج مضغوط و"متناثر" يحافظ على الدقة العالية مع استهلاك طاقة وذاكرة أقل بكثير. هذا الاختزال ضروري لتحسين زمن انتقال الاستدلال، مما يسمح للبنى المتقدمة بالعمل بكفاءة على الأجهزة ذات الموارد المحدودة مثل الهواتف المحمولة والأجهزة المدمجة.
Link to this sectionالآليات والمنهجية#
غالبًا ما تكون نماذج التعلم العميق الحديثة مفرطة في المعلمات، مما يعني أنها تحتوي على اتصالات أكثر بكثير مما هو ضروري لحل مهمة معينة. يستغل التقليم ذلك عن طريق إزالة الاتصالات التي لها قيم قريبة من الصفر، بافتراض أن لها تأثيرًا ضئيلًا على المخرجات. بعد إزالة المعلمات، يخضع النموذج عادةً لعملية ضبط دقيق، حيث يتم إعادة تدريبه لفترة وجيزة لضبط الأوزان المتبقية واستعادة أي أداء مفقود. يرتبط هذا المفهوم ارتباطًا وثيقًا بـ فرضية تذكرة اليانصيب، التي تشير إلى أن الشبكات الكبيرة تحتوي على شبكات فرعية أصغر وعالية الكفاءة قادرة على الوصول إلى دقة مماثلة.
هناك فئتان رئيسيتان لاستراتيجيات التقليم:
- التقليم غير الهيكلي: تزيل هذه الطريقة الأوزان الفردية بناءً على حجمها، بغض النظر عن موقعها. ورغم أنها تقلل من إجمالي عدد المعلمات بشكل فعال، إلا أنها تنشئ مصفوفات متناثرة غير منتظمة قد تجد وحدات المعالجة المركزية (CPUs) ووحدات معالجة الرسومات (GPUs) صعوبة في معالجتها بكفاءة بدون برامج متخصصة.
- التقليم الهيكلي: يزيل هذا النهج هياكل هندسية كاملة، مثل العصبونات، أو القنوات، أو الطبقات داخل شبكة عصبية تلافيفية (CNN). من خلال الحفاظ على بنية المصفوفة، يتوافق التقليم الهيكلي بشكل كبير مع مسرعات الأجهزة القياسية، مما يؤدي غالبًا إلى تسريع فوري لـ الاستدلال في الوقت الفعلي.
Link to this sectionتطبيقات العالم الحقيقي#
يعد التقليم أمرًا لا غنى عنه لتمكين ذكاء الحافة (Edge AI) عبر مختلف الصناعات التي تكون فيها موارد الأجهزة محدودة:
-
الطائرات بدون طيار المستقلة: تعتمد المركبات الجوية غير المأهولة المستخدمة في عمليات البحث والإنقاذ على الرؤية الحاسوبية للتنقل في البيئات المعقدة. تسمح نماذج اكتشاف الأشياء المُقلّمة لهذه الأجهزة بمعالجة موجزات الفيديو محليًا في الوقت الفعلي، مما يتجنب مشاكل زمن الانتقال المرتبطة بالاتصال السحابي.
-
الرعاية الصحية المتنقلة: تستخدم الأجهزة الطبية المحمولة لـ تحليل الموجات فوق الصوتية نماذج مُقلّمة لاكتشاف الشذوذات مباشرة على الجهاز. وهذا يضمن خصوصية بيانات المريض ويمكّن من إجراء تشخيصات متطورة في المناطق النائية التي لا تتوفر فيها خدمة إنترنت.
Link to this sectionمثال على التنفيذ#
في حين أن النماذج الحديثة مثل YOLO26 مصممة لتحقيق الكفاءة، يمكن للمطورين تطبيق التقليم لتحسين الطبقات بشكل أكبر باستخدام مكتبات مثل PyTorch. يوضح المثال التالي كيفية تطبيق التقليم غير الهيكلي على طبقة تلافيفية.
import torch
import torch.nn.utils.prune as prune
# Initialize a standard convolutional layer
layer = torch.nn.Conv2d(in_channels=3, out_channels=32, kernel_size=3)
# Apply L1 unstructured pruning to remove 30% of weights with the lowest magnitude
prune.l1_unstructured(layer, name="weight", amount=0.3)
# Verify sparsity (percentage of zero parameters)
sparsity = 100.0 * float(torch.sum(layer.weight == 0)) / layer.weight.nelement()
print(f"Sparsity achieved: {sparsity:.2f}%")Link to this sectionالتقليم مقابل تقنيات التحسين ذات الصلة#
لتحسين نموذج من أجل النشر بشكل فعال، من المفيد التمييز بين التقليم والاستراتيجيات الأخرى:
- تكميم النموذج: على عكس التقليم، الذي يزيل الاتصالات، يقلل التكميم من دقة الأوزان (على سبيل المثال، تحويل أرقام الفاصلة العائمة 32-بت إلى أعداد صحيحة 8-بت). يمكن استخدام كلتا التقنيتين معًا لتحقيق أقصى قدر من الكفاءة على الأنظمة المدمجة.
- تقطير المعرفة: يتضمن هذا تدريب نموذج "طالب" أصغر لتقليد سلوك نموذج "معلم" أكبر. يعدل التقليم النموذج الأصلي مباشرةً، بينما يقوم التقطير بتدريب بنية جديدة ومدمجة.
لإدارة دورة حياة شاملة، بما في ذلك التدريب، والتعليق التوضيحي، ونشر النماذج المحسنة، يمكن للمستخدمين الاستفادة من منصة Ultralytics. هذا يبسط سير العمل من إدارة مجموعة البيانات إلى تصدير النماذج بتنسيقات صديقة للأجهزة مثل ONNX أو TensorRT.






