Mixed Precision
تعرف على كيفية تسريع الدقة المختلطة للتدريب وتقليل الذاكرة لنماذج مثل Ultralytics YOLO26. استكشف فوائد FP16 وFP32 لرؤى ذكاء اصطناعي أسرع.
تعد الدقة المختلطة تقنية محورية في تحسين النماذج تُستخدم لتسريع تدريب نماذج التعلم العميق مع تقليل استهلاك الذاكرة. ومن خلال الجمع الاستراتيجي بين تنسيقات رقمية مختلفة—عادةً أنواع الفاصلة العائمة 16-بت و32-بت—تسمح هذه الطريقة لخوارزميات التعلم الآلي بإجراء الحسابات بشكل أسرع دون التضحية بدقة النموذج النهائية. وقد أصبحت ممارسة قياسية في تطوير الذكاء الاصطناعي الحديث، لا سيما للمهام كثيفة الموارد مثل تدريب بنية YOLO26 على مجموعات بيانات ضخمة.
Link to this sectionكيف تعمل الدقة المختلطة#
في سير عمل التعلم العميق التقليدي، عادةً ما تُجري النماذج الحسابات باستخدام تنسيق الفاصلة العائمة أحادي الدقة (FP32). يتطلب كل رقم في FP32 ذاكرة قدرها 32 بت. وعلى الرغم من دقته العالية، يمكن أن يكون هذا التنسيق مكلفاً حسابياً ويستهلك الكثير من الذاكرة.
تُدخل الدقة المختلطة استخدام نصف الدقة (FP16)، والتي تستخدم 16 بت فقط. ومع ذلك، يمكن أن يؤدي استخدام FP16 فقط إلى عدم استقرار عددي بسبب النطاق الديناميكي الأصغر. ولحل هذه المشكلة، تحافظ طرق الدقة المختلطة على "نسخة رئيسية" من أوزان النموذج بتنسيق FP32 لضمان الاستقرار، بينما تستخدم FP16 للعمليات الرياضية الثقيلة، مثل الالتفافات وعمليات ضرب المصفوفات.
تتضمن العملية بشكل عام ثلاث خطوات رئيسية:
-
التحويل (Casting): تحويل مدخلات النموذج وتنشيطاته إلى FP16 لتسريع التنفيذ على الأجهزة المتوافقة، مثل NVIDIA Tensor Cores.
-
قياس الخسارة (Loss Scaling): تضخيم قيم دالة الخسارة لمنع "الفيض الناقص" (underflow)، حيث تصبح تحديثات التدرج الصغيرة أصفاراً في تنسيق FP16.
-
التراكم (Accumulation): إجراء العمليات الحسابية في FP16 ولكن تراكم النتائج في FP32 للحفاظ على المعلومات الضرورية قبل تحديث الأوزان الرئيسية.
Link to this sectionفوائد التدريب في الذكاء الاصطناعي#
يوفر اعتماد الدقة المختلطة مزايا كبيرة للمطورين والباحثين الذين يستخدمون الموارد الحسابية بفعالية:
- سرعة تدريب أسرع: تتطلب العمليات في FP16 عرض نطاق ترددي أقل للذاكرة، وتتم معالجتها بشكل أسرع بواسطة وحدات معالجة الرسومات الحديثة. وهذا يمكن أن يقلل الوقت المطلوب لـ الحقبة بهوامش كبيرة.
- تقليل استخدام الذاكرة: نظراً لأن موترات FP16 تستهلك نصف ذاكرة FP32، يمكن للمطورين مضاعفة حجم الدفعة لديهم فعلياً. غالباً ما تؤدي أحجام الدفعات الأكبر إلى تقديرات تدرج أكثر استقراراً وتقارباً أسرع.
- كفاءة الطاقة: يترجم تقليل الحمل الحسابي إلى استهلاك أقل للطاقة، وهو أمر بالغ الأهمية لعمليات التدريب السحابي واسعة النطاق.
Link to this sectionتطبيقات العالم الحقيقي#
تُستخدم الدقة المختلطة عبر مختلف الصناعات للتعامل مع النماذج المعقدة ومجموعات البيانات الكبيرة بكفاءة.
Link to this sectionالقيادة الذاتية#
في تطوير المركبات ذاتية القيادة، يجب على المهندسين تدريب نماذج اكتشاف الكائنات على ملايين إطارات الفيديو عالية الدقة. يسمح لهم استخدام الدقة المختلطة بتدريب أحدث النماذج مثل YOLO26 بكفاءة. يتيح انخفاض استهلاك الذاكرة معالجة مدخلات ذات دقة أعلى، وهو أمر بالغ الأهمية لاكتشاف الأشياء الصغيرة مثل إشارات المرور أو المشاة على مسافة بعيدة.
Link to this sectionتحليل الصور الطبية#
غالباً ما يتضمن تحليل الصور الطبية بيانات حجمية ثلاثية الأبعاد من فحوصات التصوير بالرنين المغناطيسي أو الأشعة المقطعية، والتي تستهلك الكثير من الذاكرة. غالباً ما يؤدي تدريب نماذج التجزئة على هذه البيانات بدقة FP32 الكاملة إلى أخطاء "نفاد الذاكرة" (OOM). تُمكّن الدقة المختلطة الباحثين من ملاءمة هذه النماذج الثقيلة في ذاكرة وحدة معالجة الرسومات، مما يسهل تطوير ذكاء اصطناعي يمكنه مساعدة الأطباء في تشخيص الأمراض في وقت أبكر.
Link to this sectionتنفيذ الدقة المختلطة مع Ultralytics#
تتعامل الأطر الحديثة مثل PyTorch عادةً مع تعقيدات الدقة المختلطة تلقائياً عبر ميزة تسمى الدقة المختلطة التلقائية (AMP). تعمل حزمة ultralytics على تمكين AMP افتراضياً أثناء التدريب لضمان الأداء الأمثل.
فيما يلي مثال موجز لكيفية بدء التدريب باستخدام YOLO26، حيث تكون الدقة المختلطة نشطة افتراضياً (يمكن التحكم فيها عبر الوسيط amp):
from ultralytics import YOLO
# Load the latest YOLO26 model
model = YOLO("yolo26n.pt")
# Train the model on the COCO8 dataset
# amp=True is the default setting for mixed precision training
results = model.train(data="coco8.yaml", epochs=5, imgsz=640, amp=True)Link to this sectionالدقة المختلطة مقابل المفاهيم ذات الصلة#
من المفيد التمييز بين الدقة المختلطة والمصطلحات المماثلة في المسرد لتجنب الارتباك:
- تكميم النموذج: بينما تستخدم الدقة المختلطة أرقام فاصلة عائمة أقل دقة (FP16) أثناء التدريب، يقوم التكميم عادةً بتحويل الأوزان إلى أعداد صحيحة (مثل INT8) بعد التدريب للنشر. يركز التكميم بشكل أساسي على زمن انتقال الاستدلال على الأجهزة الطرفية، بينما تركز الدقة المختلطة على سرعة التدريب واستقراره.
- نصف الدقة: يشير هذا تحديداً إلى تنسيق بيانات FP16 نفسه. الدقة المختلطة هي التقنية لاستخدام كل من FP16 وFP32 معاً. يؤدي استخدام نصف الدقة الخالص بدون "النسخة الرئيسية" المختلطة FP32 غالباً إلى نماذج تفشل في التقارب بسبب الأخطاء العددية.
Link to this sectionالخلاصة#
لقد أحدثت الدقة المختلطة ثورة في كيفية تدريب الشبكات العصبية، حيث تعمل كعامل تمكين حاسم للنماذج التأسيسية الضخمة وأنظمة الرؤية التي نراها اليوم. من خلال موازنة الحاجة إلى الدقة الرياضية مع قيود سرعة الأجهزة والذاكرة، فهي تسمح للمطورين بالتكرار بشكل أسرع وبناء حلول ذكاء اصطناعي أكثر قدرة.
بالنسبة لأولئك الذين يتطلعون إلى إدارة مجموعات البيانات وتدريب النماذج المحسنة بسلاسة، توفر منصة Ultralytics بيئة شاملة تستفيد من تقنيات التحسين الحديثة هذه تلقائياً.






