Model Quantization
تعرف على كيفية تحسين تكميم النموذج (model quantization) لنموذج Ultralytics YOLO26 من أجل الذكاء الاصطناعي على الحافة. اكتشف كيفية تقليل الذاكرة، وخفض زمن الوصول، وتصدير نماذج INT8 لاستدلال أسرع.
يعد تكميم النموذج تقنية متطورة لـ تحسين النموذج تُستخدم لتقليل التكاليف الحسابية وتكاليف الذاكرة لتشغيل نماذج التعلم العميق. في سير عمل التدريب القياسي، تقوم الشبكات العصبية عادةً بتخزين المعلمات (الأوزان والتحيزات) وخرائط التنشيط باستخدام أرقام الفاصلة العائمة ذات 32 بت (FP32). وعلى الرغم من أن هذه الدقة العالية تضمن حسابات دقيقة أثناء التدريب، إلا أنها غالبًا ما تكون غير ضرورية للاستدلال. يقوم التكميم بتحويل هذه القيم إلى تنسيقات ذات دقة أقل، مثل الفاصلة العائمة ذات 16 بت (FP16) أو الأعداد الصحيحة ذات 8 بت (INT8)، مما يؤدي إلى تقليل حجم النموذج وتسريع سرعة التنفيذ بفعالية دون المساس بـ الدقة بشكل كبير.
Link to this sectionلماذا يعد التكميم مهماً#
المحرك الرئيسي للتكميم هو الحاجة إلى نشر ذكاء اصطناعي قوي على أجهزة ذات موارد محدودة. ومع ازدياد تعقيد نماذج الرؤية الحاسوبية مثل YOLO26، تزداد متطلباتها الحسابية. يعالج التكميم ثلاثة اختناقات حرجة:
- بصمة الذاكرة: من خلال تقليل عرض البت للأوزان (على سبيل المثال، من 32 بت إلى 8 بت)، يتم تقليل متطلبات تخزين النموذج بما يصل إلى 4 أضعاف. هذا أمر حيوي لتطبيقات الهاتف المحمول حيث يكون حجم التطبيق مقيداً.
- زمن انتقال الاستدلال: العمليات ذات الدقة المنخفضة أقل تكلفة حسابياً. يمكن للمعالجات الحديثة، وخاصة تلك التي تحتوي على وحدات معالجة عصبية (NPUs) متخصصة، تنفيذ عمليات INT8 بشكل أسرع بكثير من FP32، مما يقلل بشكل كبير من زمن انتقال الاستدلال.
- استهلاك الطاقة: إن نقل بيانات أقل عبر الذاكرة وإجراء عمليات حسابية أبسط يستهلك طاقة أقل، مما يطيل عمر البطارية في الأجهزة المحمولة والمركبات ذاتية القيادة.
Link to this sectionمقارنة بالمفاهيم ذات الصلة#
من المهم التمييز بين التكميم وتقنيات التحسين الأخرى، حيث أنها تعدل النموذج بطرق متميزة:
- التكميم مقابل التقليم: بينما يقلل التكميم من حجم الملف عن طريق خفض عرض البت للمعلمات، يتضمن تقليم النموذج إزالة الاتصالات غير الضرورية (الأوزان) بالكامل لإنشاء شبكة متناثرة. يغير التقليم بنية النموذج، بينما يغير التكميم تمثيل البيانات.
- التكميم مقابل تقطير المعرفة: تقطير المعرفة هو تقنية تدريب حيث يتعلم نموذج "طالب" صغير محاكاة نموذج "معلم" كبير. غالباً ما يتم تطبيق التكميم على نموذج الطالب بعد التقطير لتعزيز أداء الذكاء الاصطناعي عند الحافة بشكل أكبر.
Link to this sectionتطبيقات العالم الحقيقي#
يُمكّن التكميم الرؤية الحاسوبية والذكاء الاصطناعي عبر مختلف الصناعات التي تكون فيها الكفاءة أمراً بالغ الأهمية.
-
الأنظمة المستقلة: في صناعة السيارات، يجب على السيارات ذاتية القيادة معالجة البيانات المرئية من الكاميرات وLiDAR في الوقت الفعلي. تسمح النماذج المكممة المنتشرة على محركات NVIDIA TensorRT لهذه المركبات باكتشاف المشاة والعقبات بزمن انتقال بالمللي ثانية، مما يضمن سلامة الركاب.
-
الزراعة الذكية: تستخدم الطائرات بدون طيار المجهزة بكاميرات متعددة الأطياف نماذج اكتشاف الكائنات المكممة لتحديد أمراض المحاصيل أو مراقبة مراحل النمو. إن تشغيل هذه النماذج محلياً على الأنظمة المدمجة الخاصة بالطائرة بدون طيار يلغي الحاجة إلى اتصالات خلوية غير موثوقة في الحقول النائية.
Link to this sectionتنفيذ التكميم باستخدام Ultralytics#
تعمل مكتبة Ultralytics على تبسيط عملية التصدير، مما يسمح للمطورين بتحويل نماذج مثل YOLO26 المتطور إلى تنسيقات مكممة. توفر منصة Ultralytics أيضاً أدوات لإدارة عمليات النشر هذه بسلاسة.
يوضح المثال التالي كيفية تصدير نموذج إلى TFLite مع تمكين تكميم INT8. تتضمن هذه العملية خطوة معايرة حيث يراقب النموذج بيانات العينة لتحديد النطاق الديناميكي الأمثل للقيم المكممة.
from ultralytics import YOLO
# Load a standard YOLO26 model
model = YOLO("yolo26n.pt")
# Export to TFLite format with INT8 quantization
# The 'int8' argument triggers Post-Training Quantization
# 'data' provides the calibration dataset needed for mapping values
model.export(format="tflite", int8=True, data="coco8.yaml")يتم نشر النماذج المحسنة بشكل متكرر باستخدام معايير قابلة للتشغيل البيني مثل ONNX أو محركات استدلال عالية الأداء مثل OpenVINO، مما يضمن توافقاً واسعاً عبر أنظمة أجهزة متنوعة.






