Quantization-Aware Training (QAT)
تعرف على كيفية قيام التدريب الواعي بالتكميم (QAT) بتحسين نماذج Ultralytics YOLO26 لنشر الحافة. اكتشف كيفية الحفاظ على دقة عالية بدقة INT8.
التدريب الواعي بالكمية (QAT) هو تقنية متخصصة تُستخدم خلال مرحلة تدريب نماذج تعلم الآلة لإعدادها للبيئات ذات الدقة المنخفضة. في سير عمل التعلم العميق القياسي، تعمل النماذج عادةً باستخدام أرقام الفاصلة العائمة عالية الدقة 32-بت (FP32). على الرغم من أن هذه الدقة توفر دقة ممتازة، إلا أنها قد تكون مكلفة حاسوبيًا وتستهلك الكثير من الذاكرة، خاصة على أجهزة الحافة. يحاكي QAT تأثيرات الكمية — أي تقليل الدقة إلى تنسيقات مثل الأعداد الصحيحة 8-بت (INT8) — بينما لا يزال النموذج قيد التدريب. من خلال إدخال أخطاء الكمية هذه أثناء عملية التعلم، يتعلم النموذج تكييف أوزانه واستعادة الدقة بفعالية التي قد تضيع بخلاف ذلك أثناء التحويل بعد التدريب.
Link to this sectionلماذا يهم QAT لنشر أجهزة الحافة#
غالبًا ما يتطلب نشر نماذج الرؤية الحاسوبية على الأجهزة ذات الموارد المحدودة توازنًا بين السرعة والأداء. تطبق طرق الكمية القياسية، المعروفة باسم الكمية بعد التدريب (PTQ)، تقليل الدقة فقط بعد تدريب النموذج بالكامل. على الرغم من أن PTQ سريعة، إلا أنها قد تؤدي أحيانًا إلى تدهور دقة النماذج الحساسة لأن أوزان الشبكة العصبية يتم تغييرها بشكل كبير دون فرصة للتعديل.
يحل QAT هذه المشكلة من خلال السماح للنموذج "بالتدرب" على كونه كميًا. أثناء التمرير الأمامي للتدريب، تتم محاكاة الأوزان والتنشيطات كقيم منخفضة الدقة. وهذا يسمح لعملية الانحدار التدرجي بتحديث معلمات النموذج بطريقة تقلل الخسارة خصيصًا للحالة الكمية. النتيجة هي نموذج قوي يحتفظ بدقة عالية حتى عند نشره على أجهزة مثل المتحكمات الدقيقة أو معالجات الهواتف المحمولة.
Link to this sectionالتمييز بين QAT والكمية بعد التدريب (PTQ)#
من المفيد التمييز بين QAT وكمية النموذج، وتحديدًا الكمية بعد التدريب (PTQ):
- الكمية بعد التدريب (PTQ): يتم تدريب النموذج بشكل طبيعي في FP32. بعد اكتمال التدريب، يتم تحويل الأوزان إلى INT8. هذه العملية أسرع ولا تتطلب إعادة تدريب ولكنها قد تؤدي إلى فقدان أكبر في الدقة للمعمارية المعقدة.
- التدريب الواعي بالكمية (QAT): يتم محاكاة عملية الكمية خلال مرحلة الضبط الدقيق. يقوم النموذج بتعديل معلماته الداخلية لاستيعاب الضوضاء الناتجة عن الدقة المنخفضة، مما يؤدي عادةً إلى دقة أفضل من PTQ.
Link to this sectionتطبيقات العالم الحقيقي#
يعد QAT ضروريًا للصناعات التي يكون فيها الاستدلال في الوقت الفعلي على أجهزة الحافة أمرًا بالغ الأهمية.
- الطائرات بدون طيار المستقلة: في عمليات الطائرات بدون طيار القائمة على الذكاء الاصطناعي، يكون عمر البطارية وقوة المعالجة على متن الطائرة محدودًا للغاية. يمكن للطائرات بدون طيار التي تستخدم نماذج محسنة عبر QAT اكتشاف العوائق أو تتبع الأشياء بدقة عالية أثناء استخدام مسرعات INT8، مما يطيل أوقات الطيران بشكل كبير مقارنة بنماذج FP32.
- كاميرات التجزئة الذكية: تستخدم محلات السوبر ماركت الرؤية الحاسوبية في التجزئة لمراقبة مخزون الأرفف أو إدارة خطوط الدفع. تعمل هذه الأنظمة غالبًا على بوابات حافة منخفضة الطاقة. يضمن QAT أن نماذج اكتشاف الأشياء التي تعمل على هذه الأجهزة تحافظ على الدقة اللازمة للتمييز بين المنتجات المتشابهة دون الحاجة إلى اتصال سحابي باهظ الثمن.
Link to this sectionتنفيذ QAT مع Ultralytics#
تدعم منصة Ultralytics ونظام YOLO البيئي تصدير النماذج إلى تنسيقات كمية. على الرغم من أن QAT هو إجراء تدريب معقد، إلا أن الأطر الحديثة تسهل إعداد النماذج للاستدلال الكمي.
فيما يلي مثال على كيفية تصدير نموذج YOLO26 مدرب إلى تنسيق TFLite كمي INT8، والذي يستخدم مبادئ الكمية لنشر فعال على الحافة.
from ultralytics import YOLO
# Load a trained YOLO26 model
model = YOLO("yolo26n.pt")
# Export the model to TFLite format with INT8 quantization
# This prepares the model for efficient execution on edge devices
model.export(format="tflite", int8=True)Link to this sectionالتكامل مع أنظمة الحافة البيئية#
تم تصميم النماذج المحسنة عبر تقنيات الكمية لتعمل على محركات استدلال متخصصة. غالبًا ما يتم نشر النماذج المدربة بـ QAT باستخدام ONNX Runtime للتوافق عبر الأنظمة الأساسية أو OpenVINO للتحسين على أجهزة Intel. وهذا يضمن أنه سواء كان الهدف هو Raspberry Pi أو Edge TPU مخصص، فإن النموذج يعمل بأعلى كفاءة وسرعة ممكنة.
Link to this sectionالمفاهيم الرئيسية المتعلقة بـ QAT#
لفهم QAT بالكامل، من المفيد أن تكون على دراية بالعديد من مفاهيم تعلم الآلة ذات الصلة:
- الدقة: تشير إلى مستوى التفاصيل المستخدم لتمثيل الأرقام. الدقة النصفية (FP16) و INT8 هي أهداف شائعة للكمية.
- المعايرة: عملية تحديد نطاق قيم التنشيط الديناميكية (الحد الأدنى/الحد الأقصى) لتعيين أرقام الفاصلة العائمة إلى أعداد صحيحة بفعالية. هذه خطوة حاسمة في نشر نماذج YOLO الكمية.
- زمن استجابة الاستدلال: إحدى الفوائد الأساسية لـ QAT هي تقليل زمن استجابة الاستدلال، مما يسمح باتخاذ قرارات أسرع في الأنظمة في الوقت الفعلي.
- الضبط الدقيق: غالبًا ما يتم إجراء QAT كخطوة ضبط دقيق على نموذج مدرب مسبقًا بدلاً من التدريب من الصفر، مما يوفر الموارد الحسابية.
من خلال دمج التدريب الواعي بالكمية في خط أنابيب MLOps، يمكن للمطورين سد الفجوة بين نماذج الأبحاث عالية الدقة وتطبيقات الذكاء الاصطناعي على الحافة عالية الكفاءة والجاهزة للإنتاج.






