Yolo فيجن شنتشن
شنتشن
انضم الآن
مسرد المصطلحات

تكميم النموذج (Model Quantization)

حسّن أداء الذكاء الاصطناعي باستخدام تكميم النموذج. قلل الحجم، وعزز السرعة، وحسّن كفاءة الطاقة لعمليات النشر في العالم الحقيقي.

تكميم النموذج هو تقنية تحويلية في في التعلم الآلي المصمم لتقليل التكاليف الحسابية وتكاليف الذاكرة لتشغيل الشبكات العصبية. عن طريق تحويل معلمات النموذج النموذج - وتحديداً الأوزان والتفعيلات - من أرقام ذات فاصلة عائمة عالية الدقة (عادةً 32 بت، والمعروفة باسم FP32) إلى تنسيقات ذات دقة أقل مثل الأعداد الصحيحة 8 بت (INT8)، يمكن للمطورين تقليص حجم ملف النموذج. هذه العملية ضرورية لتمكين النشر الفعال للنماذج على الأجهزة ذات موارد محدودة، مما يضمن إمكانية تشغيل قدرات الذكاء الاصطناعي المتطورة بسلاسة على كل شيء من الهواتف الذكية إلى أجهزة الاستشعار الصناعية.

كيفية عمل تكميم النموذج

تتضمَّن الآلية الأساسية للتحويل الكمي تعيين نطاق كبير من القيم المتصلة إلى مجموعة أصغر من القيم المتقطعة من القيم المنفصلة. في نموذج التعلم العميق النموذجي، يتم تخزين المعلمات كأرقام ذات فاصلة عائمة 32 بت للحفاظ على دقة عالية أثناء مرحلة التدريب. ومع ذلك، أثناء الاستدلال - المرحلة التي يقوم فيها النموذج بعمل تنبؤات - فإن هذا المستوى من الدقة غالباً ما يكون غير ضروري.

يعمل التكميم على ضغط هذه القيم، مما يقلل من عرض النطاق الترددي للذاكرة المطلوب لجلب أوزان النماذج وتسريع العمليات الحسابية العمليات الحسابية. الأجهزة الحديثة، بما في ذلك وحدات المعالجة المركزية والمسرعات المتخصصة المتخصصة مثل وحدات معالجة الرسوميات، غالبًا ما تحتوي على مجموعات تعليمات مخصصة لحساب الأعداد الصحيحة التي تكون أسرع وأكثر كفاءة في استخدام الطاقة من نظيراتها ذات الفاصلة العائمة نظيراتها من الفاصلة العائمة. يساعد هذا التحسين على تقليل وقت الاستجابة للاستدلال، مما يوفر تجربة مستخدم أسرع في تطبيقات الوقت الحقيقي.

أنواع التحويل الكمي

هناك طريقتان أساسيتان لتطبيق هذا التحسين، تخدم كل منهما مراحل مختلفة من التطوير دورة حياة التطوير:

  • التكميم اللاحق للتدريب (PTQ): يتم تطبيق هذه الطريقة بعد تدريب النموذج بشكل كامل. وهي تتطلب مجموعة بيانات معايرة لتحديد النطاق الديناميكي للتنشيطات والأوزان. أدوات مثل يوفر TensorFlow Lite دعماً قوياً قوية ل PTQ، مما يجعلها خيارًا شائعًا للتحسينات السريعة.
  • التدريب الواعي بالتقدير الكمي (QAT): في هذا النهج، يقوم النموذج بمحاكاة تأثيرات التكميم أثناء عملية التدريب نفسها. من خلال تقديم عقد تكميم "وهمية"، تتعلم الشبكة أن تتعلم التكيف مع الدقة المنخفضة، مما يؤدي غالبًا إلى الاحتفاظ بدقة أفضل مقارنةً بالتدريب الواعي بالتقدير الكمي. يمكنك معرفة المزيد حول هذه التقنية المحددة على التدريب الواعي بالتقدير الكمي (QAT) الخاصة بنا.

تطبيقات واقعية

يُعد التحويل الكمي حجر الزاوية في الذكاء الاصطناعي المتطور، مما يتيح تنفيذ المهام المعقدة محليًا على الأجهزة دون الاعتماد على الاتصال السحابي.

  1. رؤية الكمبيوتر المحمول: تعتمد تطبيقات الهواتف الذكية التي تقدم ميزات مثل ضبابية الخلفية في الوقت الحقيقي أو أو مرشحات الوجه تعتمد على النماذج الكمية. على سبيل المثال، يتطلب تشغيل نموذج نموذج اكتشاف الأجسام على الهاتف يتطلب كفاءة عالية كفاءة عالية لمنع استنزاف البطارية والسخونة الزائدة.
  2. إنترنت الأشياء الصناعية والروبوتات: في الروبوتات، غالبًا ما تعمل الوحدات المستقلة على طاقة البطارية وتستخدم معالجات مدمجة مثل NVIDIA Jetson. تسمح النماذج الكمية لهذه الروبوتات هذه الروبوتات بمعالجة البيانات المرئية للملاحة وتجنب العوائق بأقل قدر من التأخير، وهو أمر بالغ الأهمية للسلامة في المركبات ذاتية القيادة.

تنفيذ التكميم مع Ultralytics YOLO

يعمل إطار Ultralytics على تبسيط عملية تصدير النماذج إلى تنسيقات ملائمة للتقدير الكمي. يوضح المثال التالي مثال يوضح كيفية تصدير نموذج YOLO11 إلى TFLite مع تمكين التكميم INT8. تتعامل هذه العملية تلقائيًا مع المعايرة باستخدام البيانات المحددة.

from ultralytics import YOLO

# Load the standard YOLO11 model
model = YOLO("yolo11n.pt")

# Export to TFLite format with INT8 quantization
# The 'data' argument provides calibration images
model.export(format="tflite", int8=True, data="coco8.yaml")

القياس الكمي مقابل تقنيات التحسين الأخرى

من المفيد التمييز بين التكميم عن استراتيجيات عن استراتيجيات تحسين النموذج الأخرى, لأنها غالبًا ما تُستخدم جنبًا إلى جنب ولكنها تعمل بشكل مختلف:

  • التكميم مقابل التقليم: بينما يقلل التكميم من دقة الأوزان, يتضمن تشذيب النموذج إزالة الروابط (الأوزان) غير الضرورية غير الضرورية (الأوزان) بالكامل لإنشاء شبكة متناثرة. يغيّر التقليم الهيكل، في حين أن التكميم يغير نوع البيانات.
  • التقطير الكمي مقابل التقطير الكمي يعمل التقطير المعرفي على تدريب أصغر حجمًا ليحاكي نموذجًا أكبر للمعلم. يمكن تطبيق التقطير الكمي على نموذج الطالب بعد ذلك لزيادة تقليل حجمه بشكل أكبر.
  • التكميم مقابل الدقة المختلطة: الدقة المختلطة هي في المقام الأول تقنية تدريب التي تستخدم مزيجًا من FP16 و FP32 لتسريع التدريب وتقليل استخدام الذاكرة على وحدات معالجة الرسومات، في حين أن التكميم هو عادةً تحسين وقت الاستدلال باستخدام الأعداد الصحيحة.

التطورات المستقبلية

مع زيادة تخصص مسرّعات الأجهزة، تستمر أهمية التكميم في النمو. تهدف Ultralytics المستقبلية المستقبلي، مثل YOLO26 القادم، إلى تعزيز الكفاءة إلى أبعد من ذلك من خلال تصميم معماريات قوية أصلاً في التكميم القوي، مما يضمن أن رؤية حاسوبية عالية الأداء تظل متاحة حتى على أصغر الأجهزة المتطورة.

للتوافق الأوسع، غالبًا ما يتم نشر النماذج الكمية باستخدام معايير قابلة للتشغيل البيني مثل ONNX أو محركات الاستدلال المحسّنة المحسّنة مثل TensorRT و OpenVINO.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن