مسرد المصطلحات

النقرات المسطحة

افهم الفلوب في التعلم الآلي! تعلم كيف يقيس تعقيد النموذج، ويؤثر على الكفاءة، ويساعد في اختيار الأجهزة.

عمليات الفاصلة العائمة، أو العمليات ذات النقاط العائمة، هي مقياس أساسي يُستخدم في التعلم الآلي (ML) لقياس التعقيد الحسابي للنموذج. عملية الفاصلة العائمة هي أي عملية حسابية - مثل الجمع أو الطرح أو الضرب أو القسمة - تتضمن أرقامًا ذات نقاط عشرية، وهي قياسية في الشبكات العصبية. في حين أن المصطلح يمكن أن يشير تقنيًا إلى العمليات في الثانية الواحدة، إلا أنه في سياق التعلّم العميق، عادةً ما تحدد عمليات الفاصلة العائمة العدد الإجمالي لهذه العمليات المطلوبة لتمرير أمامي واحد للنموذج. ويوفر هذا المقياس طريقة لا تعتمد على الأجهزة لتقدير مدى كثافة النموذج من الناحية الحسابية أثناء الاستدلال. وغالبًا ما تكون الأرقام كبيرة جدًا بحيث يتم التعبير عنها بوحدة GigaFLOPs (GFLOPs)، وهي مليارات العمليات، أو TeraFLOPs (TFLOPs)، وهي تريليونات العمليات.

لماذا تعتبر الآلات المتعثرة مهمة في التعلم الآلي؟

تعد وحدات FLOP مؤشرًا حاسمًا لكفاءة النموذج. يشير عدد وحدات FLOP الأقل عموماً إلى أن النموذج سيكون أسرع ويتطلب طاقة حاسوبية أقل للتشغيل. هذا الأمر مهم بشكل خاص للتطبيقات التي تكون فيها الموارد محدودة، كما هو الحال في الذكاء الاصطناعي المتطور وعلى الأجهزة المحمولة. من خلال تحليل FLOPs، يمكن للمطورين:

  • مقارنة بنيات النماذج: عند الاختيار بين النماذج المختلفة، مثل تلك الموجودة في صفحات المقارنة بين النماذج، تقدم FLOPs طريقة موحدة لتقييم الكفاءة الحسابية إلى جانب الدقة.
  • التحسين للنشر: من أجل نشر النموذج على أجهزة مثل Raspberry Pi أو NVIDIA Jetson، يعد اختيار نموذج بعدد FLOP مناسب أمرًا ضروريًا لتحقيق مستويات الأداء المطلوبة.
  • تصميم النموذج الإرشادي: غالبًا ما يتعامل الباحثون الذين يطورون بنيات جديدة، مثل تلك الموجودة في سلسلة Ultralytics YOLO، مع تقليل عدد وحدات FLOP كقيد تصميم رئيسي. تركز التقنيات المستكشفة في نماذج مثل EfficientNet على تقليل التكلفة الحسابية دون التضحية بالأداء.

التطبيقات الواقعية

تُعد وحدات FLOP مقياسًا عمليًا يُستخدم يوميًا في تطوير حلول الذكاء الاصطناعي ونشرها.

  1. تطبيقات رؤية الهاتف المحمول: يجب على المطور الذي ينشئ ميزة اكتشاف الأجسام في الوقت الحقيقي لتطبيق هاتف ذكي أن يختار نموذجاً يمكن تشغيله بسرعة دون استنزاف البطارية. من خلال مقارنة النماذج الخفيفة الوزن مثل متغير Ultralytics YOLO11 الصغير مع نماذج أخرى، يمكنهم اختيار نموذج يوفر توازناً جيداً بين السرعة والدقة لوحدة المعالجة المركزية أو وحدة معالجة الرسومات في الجهاز.

  2. المركبات ذاتية القيادة: في القيادة الذاتية، يجب أن تعالج النماذج الإدراكية في القيادة الذاتية موجزات الكاميرا بزمن استجابة منخفض للغاية. يقوم المهندسون الذين يصممون هذه الأنظمة بتحليل وحدات FLOP للنماذج المختلفة لضمان إمكانية تشغيل البنية المختارة على الأجهزة المتخصصة في السيارة. قد يتم اختيار نموذج مثل YOLO11 بدلاً من نموذج أكثر تعقيداً إذا كانت وحدات FLOP المنخفضة تسمح له بتلبية متطلبات التوقيت الصارمة للتشغيل الآمن.

النقطتان المتذبذبة مقابل المقاييس ذات الصلة

من المهم التمييز بين مقاييس FLOPs والمقاييس الشائعة الأخرى:

  • البارامترات مقابل الأوزان الترجيحية: يشير عدد أوزان النموذج (المعلمات) إلى حجم النموذج من حيث تخزين الذاكرة. من ناحية أخرى، يقيس عدد العمليات التشغيلية المتعرجة العمل الحسابي. يمكن أن يحتوي النموذج على عدد قليل من المعلمات ولكن عدد العمليات الحسابية المكثفة إذا تم إعادة استخدام هذه المعلمات عدة مرات في العمليات الحسابية المكثفة.
  • MACs مقابل FLOPs: عمليات MACs، أو عمليات الضرب والجمع، هي عملية شائعة في الشبكات العصبية. وغالباً ما تعتبر عملية MAC واحدة مكافئة لعمليتي FLOP (عملية ضرب واحدة وعملية جمع واحدة). قد تشير بعض الأوراق البحثية وأطر العمل إلى التكلفة الحسابية في MACs، والتي تبلغ تقريبًا نصف قيمة FLOPs. يمكنك رؤية هذا التمييز في موارد مثل الأوراق ذات الرموز.
  • الكمون مقابل FLOPs: الكمون الاستدلالي هو الوقت الفعلي الذي يستغرقه النموذج لإجراء تنبؤ. بينما توفر FLOPs تقديرًا نظريًا جيدًا، يتأثر زمن الاستجابة في العالم الحقيقي بعوامل لا تلتقطها FLOPs، مثل عرض النطاق الترددي للذاكرة، وتوازي الأجهزة، وكفاءة مكتبات البرامج مثل PyTorch.

القيود

على الرغم من فائدتها، إلا أن لها قيوداً:

  • فهي لا تأخذ في الحسبان تكاليف الوصول إلى الذاكرة، والتي يمكن أن تكون عنق زجاجة كبير.
  • فهي لا تستوعب درجة التوازي الممكنة في العمليات.
  • يعتمد الأداء الفعلي اعتمادًا كبيرًا على التحسينات الخاصة بالأجهزة وكفاءة مكتبات البرامج الأساسية(cuDNN، Intel MKL).
  • تحتوي بعض العمليات (مثل دوال التنشيط مثل ReLU) على عدد عمليات FLOP منخفضة ولكن لا يزال بإمكانها التأثير على زمن الاستجابة.

ولذلك، ينبغي النظر في النماذج التي تعمل بنظام FLOP إلى جانب مقاييس الأداء الأخرى والمعلمات والمعايير الواقعية للحصول على صورة كاملة لكفاءة النموذج. يمكن أن تساعد أدوات مثل Ultralytics HUB في إدارة النماذج وتتبع جوانب الأداء المختلفة أثناء التطوير والنشر.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون ونمو مع المبتكرين العالميين

انضم الآن
تم نسخ الرابط إلى الحافظة