Yolo فيجن شنتشن
شنتشن
انضم الآن
مسرد المصطلحات

التقليم (Pruning)

حسّن نماذج الذكاء الاصطناعي باستخدام التقليم - قلل التعقيد، وعزز الكفاءة، وانشر بشكل أسرع على الأجهزة الطرفية دون التضحية بالأداء.

يعد التقليم تقنية مهمة في يهدف إلى تقليل الحجم و والتعقيد الحسابي للشبكة الشبكة العصبية (NN) عن طريق إزالة المعلمات غير الضرورية غير ضرورية. يشبه إلى حد كبير تشذيب الأغصان الميتة من الشجرة لتشجيع النمو السليم، حيث يحدد تشذيب النموذج ويزيل أوزان النموذج أو الوصلات التي التي تساهم بالحد الأدنى في مخرجات النظام. الهدف الأساسي هو إنشاء نموذج متناثر يحافظ على دقة عالية دقة عالية مع تقليل استخدام الذاكرة بشكل كبير وتحسين زمن الاستنتاج. هذه العملية ضرورية لنشر البنى المعقدة، مثل Ultralytics YOLO11على أجهزة محدودة الموارد حيث تكون حيث تكون طاقة التخزين والمعالجة محدودة.

كيف يعمل التقليم؟

تبدأ العملية عادةً بنموذج مدرب مسبقاً. تقوم الخوارزميات بتحليل الشبكة للعثور على المعلمات - غالباً ما تكون على شكل موتر - لها قيم قريبة من الصفر أو ذات تأثير محدود على التنبؤ النهائي. ثم يتم ثم يتم إزالتها أو "تصفيرها". نظرًا لأن إزالة الاتصالات يمكن أن يقلل من الأداء مؤقتًا، فإن النموذج عادةً ما يخضع النموذج لعملية تسمى الضبط الدقيق، حيث يتم يتم إعادة تدريبه لبضع حقب زمنية للسماح للأوزان المتبقية المتبقية لضبط واستعادة الدقة المفقودة.

هناك فئتان رئيسيتان للتقليم:

  • تشذيب غير منظم: تزيل هذه الطريقة الأوزان الفردية في أي مكان في الشبكة بناءً على الحجم. على الرغم من فعاليتها في تقليل عدد المعلمات، إلا أنها تخلق أنماط وصول غير منتظمة للذاكرة قد لا تسفر عن تحسينات في السرعة على وحدات المعالجة المركزية القياسية دون دعم متخصص برامج أو دعم أجهزة متخصصة، مثل ميزات التباعد فيNVIDIA.
  • التقليم الهيكلي: يزيل هذا النهج مكونات هيكلية كاملة، مثل الخلايا العصبية أو القنوات أو الطبقات داخل الشبكة العصبية التلافيفية (CNN). من خلال الحفاظ على بنية المصفوفة، تكون هذه الطريقة أكثر ملاءمةً للأجهزة القياسية وعادةً ما تؤدي إلى تسريع فوري أثناء الاستدلال في الوقت الحقيقي.

التقليم مقابل التقطير الكمي مقابل التقطير الكمي

من المهم التمييز بين التقليم من استراتيجيات عن استراتيجيات تحسين النموذج الأخرى, على الرغم من أنها غالبًا ما تُستخدم جنبًا إلى جنب:

  • تكميم النموذج: بدلاً من إزالة المعلمات بدلاً من إزالة المعلمات، يقلل التكميم من دقة الأوزان (على سبيل المثال، التحويل من 32 بت 32 بت إلى أعداد صحيحة 8 بت).
  • تقطير المعرفة: يتضمن ذلك تدريب نموذج "طالب" أصغر لمحاكاة سلوك نموذج "معلم" أكبر الأكبر، بدلاً من تعديل النموذج الأكبر مباشرةً.
  • التقليم: يركز على وجه التحديد على إزالة الوصلات أو البنى لإحداث التشتت.

تطبيقات واقعية

يلعب التقليم دورًا حيويًا في تمكين الذكاء الاصطناعي المتطور عبر مختلف الصناعات:

  1. الروبوتات المستقلة: الروبوتات التي تستخدم الرؤية الحاسوبية للملاحة تحتاج إلى معالجة البيانات المرئية محلياً لتجنب التأخير. يسمح التقليم بتشذيب المعقدة للكشف عن الأجسام بالتشغيل على المدمجة في الطائرات بدون طيار أو روبوتات التوصيل، مما يضمن السلامة والكفاءة. اقرأ المزيد عن دمج الرؤية الحاسوبية في الروبوتات.
  2. تشخيصات الرعاية الصحية المتنقلة: غالباً ما تتطلب التطبيقات الطبية تحليل فحوصات عالية الدقة مباشرةً على الأجهزة اللوحية أو الهواتف الذكية لحماية خصوصية بيانات المريض. تمكّن النماذج المشذبة هذه الأجهزة من أداء مهام مثل الكشف عن الأورام دون تحميل البيانات الحساسة إلى السحابة. انظر كيف يُحدث الذكاء الاصطناعي في مجال الرعاية الصحية تحولاً في التشخيص.

مثال عملي

في حين أن Ultralytics YOLO مُحسَّنة للغاية خارج الصندوق, يمكن للمطورين تجربة التقليم باستخدام أدوات PyTorch المساعدة القياسية. يوضح المثال التالي كيفية تطبيق التقليم غير المهيكل على طبقة التلافيف القياسية الموجودة في نماذج الرؤية الحاسوبية.

import torch
import torch.nn.utils.prune as prune
from ultralytics.nn.modules import Conv

# Initialize a standard convolutional block used in YOLO models
layer = Conv(c1=64, c2=128)

# Apply L1 unstructured pruning to remove 30% of the lowest magnitude weights
prune.l1_unstructured(layer.conv, name="weight", amount=0.3)

# Verify the sparsity (percentage of zero weights)
sparsity = float(torch.sum(layer.conv.weight == 0)) / layer.conv.weight.nelement()
print(f"Layer sparsity achieved: {sparsity:.2%}")

تهدف التطورات المستقبلية في الهندسة المعمارية الفعالة، مثل YOLO26 القادم، إلى دمج هذه مبادئ التحسين هذه في الأصل، مما يؤدي إلى إنشاء نماذج أصغر وأسرع وأكثر دقة حسب التصميم.

المفاهيم والموارد الرئيسية

  • التباعد: هي الحالة التي تحتوي فيها المصفوفة على قيم صفرية في الغالب، وهي نتيجة مباشرة للتشذيب المكثف التقليم العنيف.
  • فرضية تذكرة اليانصيب: مفهوم أساسي من باحثون في معهد ماساتشوستس للتكنولوجيا يقترحون أن الشبكات الكثيفة تحتوي على شبكات فرعية أصغر شبكات فرعية أصغر (التذاكر الفائزة) يمكنها أن تضاهي الدقة الأصلية عند تدريبها بمعزل عن غيرها.
  • الضبط الدقيق: عملية إعادة تدريب النموذج النموذج المشذّب لتكييف الأوزان المتبقية مع البنية الجديدة المبسطة.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن