Yolo فيجن شنتشن
شنتشن
انضم الآن
مسرد المصطلحات

تكميم النموذج (Model Quantization)

حسّن أداء الذكاء الاصطناعي باستخدام تكميم النموذج. قلل الحجم، وعزز السرعة، وحسّن كفاءة الطاقة لعمليات النشر في العالم الحقيقي.

تعد تكمية النموذج عملية تحسين حاسمة في مجال التعلم الآلي، حيث تقلل من دقة الأرقام المستخدمة لتمثيل معلمات النموذج. من خلال تحويل هذه المعلمات — وتحديدًا الأوزان والتفعيلات — من أرقام عائمة عالية الدقة (عادةً 32 بت، تُعرف باسم FP32) إلى تنسيقات أقل دقة مثل الأعداد الصحيحة 8 بت (INT8)، يمكن للمطورين تقليل حجم الذاكرة وتعقيد الحساب للنموذج بشكل كبير. هذا التحويل ضروري لنشر شبكات عصبية متطورة على أجهزة ذات موارد محدودة ، مما يضمن تشغيل تطبيقات الذكاء الاصطناعي بكفاءة على كل شيء بدءًا من الهواتف الذكية إلى أجهزة استشعار إنترنت الأشياء المدمجة.

آليات التكمية

في جوهره، يقوم التكمية بتعيين مجموعة كبيرة من القيم المستمرة إلى مجموعة أصغر من القيم المنفصلة. خلال مرحلة التدريب، تتطلب النماذج عادة دقة عالية لالتقاط التفاصيل الدقيقة في البيانات وتحديث التدرجات بدقة. ومع ذلك، أثناء الاستدلال - المرحلة التي يولد فيها النموذج التنبؤات - غالبًا ما يكون هذا المستوى من الدقة زائدًا عن الحاجة.

من خلال ضغط هذه القيم، يقلل التكمية من حجم نطاق التردد التذكيري اللازم لجلب أوزان النموذج ويسرع العمليات الحسابية . الأجهزة الحديثة، مثل CPU والمسرعات المتخصصة مثل TPUs، غالبًا ما تتضمن مجموعات تعليمات مخصصة لحساب الأعداد الصحيحة. هذه التعليمات أسرع وأكثر كفاءة في استخدام الطاقة من عمليات النقاط العائمة، مما يساعد على تقليل زمن الاستدلال والحفاظ على عمر البطارية في التطبيقات المحمولة.

المناهج الأولية

هناك استراتيجيتان رئيسيتان لتطبيق التكمية، اعتمادًا على وقت حدوث التحسين في دورة حياة التطوير :

  • التكمية بعد التدريب (PTQ): يتم تطبيق هذه الطريقة بعد اكتمال تدريب النموذج. وهي تستخدم مجموعة بيانات معايرة صغيرة لتحديد النطاق الديناميكي للتنشيطات والأوزان، وتعيينها إلى أعداد صحيحة. وهي طريقة سريعة وفعالة لتحسين النماذج لمنصات مثل TensorFlow .
  • التدريب المدرك للتكمية (QAT): في هذا النهج، يحاكي النموذج تأثيرات التكمية (مثل أخطاء التقريب) أثناء عملية التدريب نفسها. وهذا يسمح للشبكة بتكييف أوزانها مع الدقة الأقل، مما يؤدي غالبًا إلى احتفاظ أعلى بالدقة مقارنةً بـ PTQ، خاصةً بالنسبة للبنى المدمجة.

مقارنة مع المفاهيم ذات الصلة

من المهم التمييز بين التكمية وتقنيات التحسين الأخرى، لأنها تعدل النموذج بطرق مختلفة :

  • التكمية مقابل التقليم: بينما تقلل التكمية حجم الملف عن طريق خفض عرض بتات المعلمات، فإن تقليم النموذج ينطوي على إزالة الوصلات غير الضرورية (الأوزان) بالكامل لإنشاء شبكة متفرقة. يؤدي التقليم إلى تغيير بنية النموذج، بينما تؤدي التكمية إلى تغيير نوع البيانات.
  • التكمية مقابل تقطير المعرفة: تقطير المعرفة هو تقنية تدريب حيث يتعلم نموذج "طالب" صغير محاكاة نموذج "معلم" كبير. غالبًا ما يتم تطبيق التكمية على نموذج الطالب بعد التقطير لتعزيز أداء الذكاء الاصطناعي المتطور.

تطبيقات واقعية

يتيح التكمية استخدام الرؤية الحاسوبية والذكاء الاصطناعي في مختلف الصناعات التي تعتبر الكفاءة فيها أمراً بالغ الأهمية.

  1. الأنظمة المستقلة: في صناعة السيارات، يجب أن تعالج المركبات المستقلة البيانات المرئية من الكاميرات و LiDAR في الوقت الفعلي. النماذج المقيسة المطبقة على NVIDIA TensorRT تسمح لهذه المركبات detect والعوائق بزمن انتقال يبلغ أجزاء من الألف من الثانية، مما يضمن سلامة الركاب.
  2. الزراعة الذكية: تستخدم الطائرات بدون طيار المزودة بكاميرات متعددة الأطياف نماذج كمية للكشف عن الأجسام لتحديد أمراض المحاصيل أو مراقبة مراحل النمو. ويؤدي تشغيل هذه النماذج محليًا على الأنظمة المدمجة في الطائرات بدون طيارإلى التخلص من الحاجة إلى الاتصالات الخلوية غير الموثوقة في الحقول النائية.

تنفيذ التحويل الكمي باستخدام Ultralytics

تسهل Ultralytics عملية التصدير، مما يتيح للمطورين تحويل نماذج مثل YOLO11 أو النموذج المتطور YOLO26 إلى تنسيقات مكمّنة. يوضح المثال التالي كيفية تصدير نموذج إلى TFLite تمكين التكمية INT8، التي تتعامل تلقائيًا مع المعايرة.

from ultralytics import YOLO

# Load a standard YOLO11 model
model = YOLO("yolo11n.pt")

# Export to TFLite format with INT8 quantization
# The 'int8' argument triggers Post-Training Quantization
model.export(format="tflite", int8=True, data="coco8.yaml")

غالبًا ما يتم نشر النماذج المحسّنة باستخدام معايير قابلة للتشغيل البيني مثل ONNX أو محركات الاستدلال عالية الأداء مثل OpenVINO، مما يضمن توافقًا واسعًا عبر أنظمة الأجهزة المتنوعة.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن