Yolo فيجن شنتشن
شنتشن
انضم الآن
مسرد المصطلحات

FLOPs

فهم FLOPs في تعلم الآلة! تعرف على كيفية قياس تعقيد النموذج، وتأثيره على الكفاءة، والمساعدة في اختيار الأجهزة.

تعمل عمليات النقطة العائمة، أو عمليات النقطة العائمة، كمقياس أساسي لقياس التعقيد الحسابي لنماذج نماذج التعلم الآلي، وتحديداً في مجال التعلّم العميق. يحسب هذا المقياس العدد الإجمالي للعمليات الحسابية - مثل الجمع والطرح والضرب والقسمة التي تتضمن عمليات الجمع, والطرح والضرب والقسمة التي تنطوي على أرقام عشرية - المطلوبة لإكمال تمريرة أمامية واحدة من شبكة عصبية. من خلال تحديد عدد العمليات الحسابية FLOPs يمكن للمهندسين تقدير قوة المعالجة اللازمة لتنفيذ نموذج ما، مما يجعلها إحصائية حيوية للأجهزة للاختيار والتحسين. على الرغم من اختلافها عن حجم الملف أو عدد البارامترات، إلا أن FLOPs توفر خط أساس نظري ل لمدى "ثقل" النموذج، وهو ما يرتبط مباشرةً باستهلاك الطاقة وسرعة التنفيذ على المعالجات مثل CPU أو GPU.

أهمية الآلات القابلة للطي في تطوير الذكاء الاصطناعي

يعد فهم التكلفة الحسابية للنموذج أمرًا ضروريًا لتحقيق الكفاءة في الذكاء الاصطناعي الفعال. يشير انخفاض عدد العمليات الحسابية يشير عمومًا إلى أن النموذج يتطلب عمليات حسابية أقل لإنتاج تنبؤ، وهو أمر بالغ الأهمية في البيئات ذات الموارد المحدودة.

  • اختيار الأجهزة: تسمح معرفة وحدات FLOP للمطوّرين بمطابقة النماذج مع إمكانيات أجهزة معيّنة، مثل سلسلة NVIDIA Jetson أو المتحكمات الدقيقة المدمجة القياسية.
  • كفاءة النموذج: عند المقارنة بين البنى، مثل التحقق من مقاييس أداءYOLO11 توفر FLOPs طريقة لا تعتمد على الأجهزة لقياس الكفاءة إلى جانب الدقة.
  • استهلاك الطاقة: في الأجهزة التي تعمل بالبطاريات، يُترجم تقليل عدد عمليات التشغيل التي تعمل بالبطارية مباشرةً إلى إطالة عمر البطارية، حيث يؤدي المعالج عملاً أقل في كل إطار.

تطبيقات واقعية

يظهر التأثير العملي لوحدات FLOPs أكثر وضوحًا عندما تنتقل النماذج من بيئات البحث إلى بيئات الإنتاج حيث يكون زمن الاستجابة والطاقة محدودة.

  1. اكتشاف كائن الهاتف الذكي: بالنسبة لتطبيق الهاتف المحمول الذي يقوم بإجراء الاستدلال في الوقت الحقيقي، يجب أن يعالج الجهاز إطارات الفيديو على الفور دون ارتفاع درجة حرارة البطارية أو استنزافها. قد يختار المطورون نموذجًا خفيف الوزن مثل نسخة النانو من YOLO11 لأن عدد عملياته المنخفضة من FLOPs يضمن الأداء السلس على المعالجات المحمولة مثل مثل Qualcomm Snapdragon أو Apple Silicon.
  2. الملاحة الذاتية للطائرات بدون طيار: تعتمد الطائرات بدون طيار المستخدمة في الزراعة الدقيقة تعتمد على detect العقبات ورسم خرائط للتضاريس. نظرًا لأن هذه الأجهزة لها حدود وزن صارمة تقيد البطارية فإن المهندسين يحسّنون من حجم البطارية من أجل الحصول على قدرات منخفضة في تحديد العوائق ورسم خرائط التضاريس. اللازمة لاكتشاف الأجسام.

حساب الترجيح باستخدام Python

يمكنك تحديد التعقيد الحسابي لنموذج Ultralytics باستخدام أدوات التنميط المدمجة. يقوم المقتطف المقتطف التالي بتحميل نموذج وحساب وحدات FLOP المطلوبة لحجم إدخال معين.

from ultralytics import YOLO

# Load the YOLO11 nano model
model = YOLO("yolo11n.pt")

# Profile the model to see FLOPs, parameters, and speed
# The 'imgsz' argument defines the input resolution (e.g., 640x640)
model.profile(imgsz=640)

تُخرِج هذه الطريقة جدولًا ملخصًا يتضمن عدد المعلمات والتدرجات و GFLOPs (GigaFLOPs، أو مليارات العمليات)، مما يساعدك على تقييم ما إذا كان النموذج يناسب قيود النشر الخاصة بك.

FLOPs مقابل المقاييس ذات الصلة

من المهم التمييز بين وحدات FLOPs والمقاييس الأخرى التي تصف حجم النموذج وسرعته، حيث إنها تقيس مختلفة من الأداء.

  • البارامترات مقابل الآلات المفلطحة: تحدد أوزان تحدد أوزان النموذج، أو المعلمات، مقدار الذاكرة الذاكرة (ذاكرة الوصول العشوائي) اللازمة لتخزين النموذج. على النقيض من ذلك، تقيس وحدات FLOP العمل الحسابي المطلوب لتشغيله. A يمكن أن يكون النموذج صغيراً في التخزين لكنه مكلف حسابياً إذا كان يعيد استخدام المعلمات بشكل متكرر، كما هو الحال في الشبكات العصبية المتكررة (RNNs).
  • MACs مقابل FLOPs: غالبًا ما تشير مواصفات الأجهزة إلى عمليات الضرب والجمع (MACs). عادةً ما تتضمن عملية MAC واحدة عملية ضرب متبوعة بعملية جمع، حيث يتم احتساب عمليتي تعويم. لذلك، فإن 1 GigaMAC يعادل تقريبًا 2 GFLOP.
  • الكمون مقابل FLOPs: بينما تمثل وحدات FLOP الجهد النظري, كمون الاستدلال هو الوقت الفعلي (بالمللي ثانية) الذي تستغرقه معالجة المدخلات بالمللي ثانية) الذي تستغرقه معالجة المدخلات. يتأثر الكمون بالعمليات الفلوب ولكن أيضًا بعرض النطاق الترددي للذاكرة، ومكتبات التحسين البرمجية مثل مكتبات التحسين مثل TensorRTوالأجهزة والأجهزة.

حدود المقياس

على الرغم من أن النماذج FLOPs توفر خط أساس مفيد، إلا أنها لا تروي القصة الكاملة لأداء النموذج. فهي لا تأخذ في الحسبان تكاليف الوصول إلى الذاكرة (الطاقة والوقت اللازمين لنقل البيانات إلى المعالج)، والتي غالبًا ما تكون عنق الزجاجة في أنظمة التعلم العميق الحديثة. بالإضافة إلى ذلك، فإن العمليات مثل دوال التنشيط (مثل ReLU) أو طبقات التطبيع لها عدد عمليات FLOP منخفضة ولكنها لا تزال تستهلك الوقت. ولذلك، يجب استخدام FLOPs بالاقتران مع مع القياس المعياري في العالم الحقيقي على الأجهزة المستهدفة، مثل Raspberry Pi، للحصول على صورة دقيقة عن الأداء.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن