Yolo فيجن شنتشن
شنتشن
انضم الآن
مسرد المصطلحات

التدريب المدرك للتكميم (QAT)

تعرف على كيفية قيام التدريب المدرك للتكمية (QAT) بتحسين نماذج Ultralytics من أجل النشر المتطور. اكتشف كيفية الحفاظ على دقة عالية باستخدام دقة INT8.

التدريب المدرك للتكمية (QAT) هو تقنية متخصصة تُستخدم خلال مرحلة تدريب نماذج التعلم الآلي لإعدادها لبيئات أقل دقة. في سير عمل التعلم العميق القياسي، تعمل النماذج عادةً باستخدام أرقام عائمة 32 بت عالية الدقة (FP32). على الرغم من أن هذه الدقة توفر دقة ممتازة، إلا أنها قد تكون مكلفة من الناحية الحسابية وتستهلك الكثير من الذاكرة، خاصة على الأجهزة الطرفية. يحاكي QAT تأثيرات التكمية - تقليل الدقة إلى تنسيقات مثل الأعداد الصحيحة 8 بت (INT8) - بينما لا يزال النموذج قيد التدريب. من خلال إدخال أخطاء التكمية هذه أثناء عملية التعلم، يتعلم النموذج كيفية تكييف أوزانه و استعادة الدقة بشكل فعال والتي قد تضيع أثناء التحويل بعد التدريب.

لماذا تعتبر QAT مهمة لنشر الحافة

غالبًا ما يتطلب نشر نماذج الرؤية الحاسوبية على الأجهزة ذات الموارد المحدودة تحقيق توازن بين السرعة والأداء. طرق التكمية القياسية، المعروفة باسم التكمية بعد التدريب (PTQ)، لا تطبق تخفيض الدقة إلا بعد تدريب النموذج بالكامل. على الرغم من أن PTQ سريعة، إلا أنها قد تؤدي في بعض الأحيان إلى انخفاض دقة النماذج الحساسة لأن أوزان الشبكة العصبية تتغير بشكل كبير دون فرصة للتعديل.

يحل QAT هذه المشكلة من خلال السماح للنموذج "بالتدرب" على التكمية. أثناء التمرير الأمامي للتدريب، يتم محاكاة الأوزان والتفعيلات كقيم منخفضة الدقة. وهذا يسمح لعملية التدرج التنازلي بتحديث معلمات النموذج بطريقة تقلل الخسارة بشكل خاص للحالة المكانية. والنتيجة هي نموذج قوي يحتفظ بدقة عالية حتى عند نشره على أجهزة مثل الميكروكونترولر أو المعالجات المحمولة.

التمييز بين QAT والتكمية بعد التدريب (PTQ)

من المفيد التمييز بين QAT و تكمية النموذج، وتحديداً التكمية بعد التدريب (PTQ):

  • التكمية بعد التدريب (PTQ): يتم تدريب النموذج بشكل طبيعي في FP32. بعد اكتمال التدريب ، يتم تحويل الأوزان إلى INT8. هذا أسرع ولا يتطلب إعادة تدريب ولكنه قد يؤدي إلى فقدان دقة أعلى للبنى المعقدة.
  • التدريب المدرك للتكمية (QAT): يتم محاكاة عملية التكمية أثناء مرحلة الضبط الدقيق. يقوم النموذج بضبط معلماته الداخلية لاستيعاب الضوضاء الناتجة عن الدقة المنخفضة، مما يؤدي عادةً إلى دقة أفضل من PTQ.

تطبيقات واقعية

تعد تقنية QAT ضرورية للصناعات التي تعتمد بشكل كبير على الاستدلال في الوقت الفعلي على الأجهزة الطرفية.

  • الطائرات بدون طيار المستقلة: في عمليات الطائرات بدون طيار التي تعمل بالذكاء الاصطناعي، تكون مدة عمل البطارية وقدرة المعالجة على متن الطائرة محدودة للغاية. يمكن للطائرات بدون طيار التي تستخدم نماذج مُحسّنة عبر QAT detect العوائق أو track بدقة عالية أثناء استخدام مسرعات INT8، مما يطيل وقت الطيران بشكل كبير مقارنةً بنماذج FP32.
  • الكاميرات الذكية للبيع بالتجزئة: تستخدم المتاجر الكبرى الرؤية الحاسوبية في البيع بالتجزئة لمراقبة مخزون الرفوف أو إدارة طوابير الدفع. غالبًا ما تعمل هذه الأنظمة على بوابات حافة منخفضة الطاقة. تضمن QAT أن نماذج الكشف عن الأشياء التي تعمل على هذه الأجهزة تحافظ على الدقة اللازمة للتمييز بين المنتجات المماثلة دون الحاجة إلى اتصال سحابي باهظ الثمن.

تنفيذ QAT باستخدام Ultralytics

تدعم Ultralytics YOLO تصدير النماذج إلى تنسيقات محددة. في حين أن QAT هو إجراء تدريب معقد، فإن الأطر الحديثة تسهل إعداد النماذج للاستدلال المحدد.

فيما يلي مثال على كيفية تصدير نموذج YOLO26 مدرب إلى TFLite المكبّر INT8، والذي يستخدم مبادئ التكبير من أجل نشر فعال للحواف.

from ultralytics import YOLO

# Load a trained YOLO26 model
model = YOLO("yolo26n.pt")

# Export the model to TFLite format with INT8 quantization
# This prepares the model for efficient execution on edge devices
model.export(format="tflite", int8=True)

التكامل مع أنظمة Edge Ecosystems

تم تصميم النماذج المحسّنة عبر تقنيات التكمية لتعمل على محركات استدلال متخصصة. غالبًا ما يتم نشر النماذج المدربة على QAT باستخدام ONNX من أجل التوافق عبر الأنظمة الأساسية أو OpenVINO للتحسين على Intel . وهذا يضمن أن النموذج يعمل بأعلى كفاءة وسرعة ممكنة، سواء كان الهدف هو Raspberry Pi أو Edge TPU مخصص.

المفاهيم الأساسية المتعلقة بـ QAT

لفهم QAT بشكل كامل، من المفيد أن تكون على دراية بعدة مفاهيم ذات صلة بالتعلم الآلي:

  • الدقة: تشير إلى مستوى التفاصيل المستخدمة لتمثيل الأرقام. نصف الدقة (FP16) و INT8 هما هدفان شائعان للتكمية.
  • المعايرة: عملية تحديد نطاق قيم التنشيط الديناميكي (الحد الأدنى/الحد الأقصى) لتعيين الأرقام العائمة إلى أعداد صحيحة بشكل فعال. هذه خطوة حاسمة في نشر YOLO المكانية.
  • زمن الاستدلال: إحدى المزايا الأساسية لـ QAT هي تقليل زمن الاستدلال، مما يتيح اتخاذ قرارات أسرع في الأنظمة التي تعمل في الوقت الفعلي.
  • الضبط الدقيق: غالبًا ما يتم تنفيذ QAT كخطوة ضبط دقيق على نموذج مدرب مسبقًا بدلاً من التدريب من الصفر، مما يوفر الموارد الحاسوبية.

من خلال دمج التدريب المدرك للتكمية في خط أنابيب MLOps، يمكن للمطورين سد الفجوة بين نماذج البحث عالية الدقة وتطبيقات الذكاء الاصطناعي المتطورة عالية الكفاءة والجاهزة للإنتاج.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن