ما هي EfficientNet؟ نظرة عامة سريعة
افهم بنية EfficientNet وسحر التحجيم المركب! استكشف EfficientNet B0-B7 لتحقيق كفاءة عالية في تصنيف الصور وتجزئتها.

في عام 2019، قدم باحثون في Google AI نموذج EfficientNet، وهو نموذج متطور في رؤية الحاسوب صُمم للتعرف على الكائنات والأنماط في الصور. لقد صُمم في المقام الأول لتصنيف الصور، وهو ما يتضمن تخصيص صورة لواحدة من عدة فئات محددة مسبقًا. ومع ذلك، تعمل EfficientNet اليوم أيضًا كعمود فقري لمهام أكثر تعقيدًا مثل اكتشاف الكائنات، والتجزئة، والتعلم بنقل المعرفة.
قبل ظهور EfficientNet، كانت نماذج التعلم الآلي ورؤية الحاسوب تحاول تحسين الدقة عن طريق إضافة المزيد من الطبقات أو زيادة حجم تلك الطبقات. الطبقات هي الخطوات في نموذج الشبكة العصبية (نوع من نماذج التعلم العميق المستوحاة من الدماغ البشري) التي تعالج البيانات لتعلم الأنماط وتحسين الدقة.
خلقت هذه التغييرات مقايضة، مما جعل نماذج الذكاء الاصطناعي التقليدية أكبر وأبطأ، في حين أن الزيادة في الدقة كانت غالبًا ضئيلة مقارنة بالزيادة الكبيرة في قوة الحوسبة المطلوبة.
اتبعت EfficientNet نهجًا مختلفًا. فقد زادت العمق (عدد الطبقات)، والعرض (عدد الوحدات في كل طبقة)، ودقة الصورة (مستوى تفاصيل الصور المدخلة) معًا بطريقة متوازنة. هذه الطريقة، التي تسمى القياس المركب، تستخدم بشكل موثوق كل قوة المعالجة المتاحة. والنتيجة النهائية هي نموذج أصغر وأسرع يمكنه أداء أفضل من النماذج الأقدم مثل ResNet أو DenseNet.
اليوم، توفر نماذج رؤية الحاسوب الأحدث مثل Ultralytics YOLO11 دقة وسرعة وكفاءة أكبر. ومع ذلك، تظل EfficientNet علامة فارقة مهمة أثرت في تصميم العديد من البنيات المتقدمة.
في هذه المقالة، سنشرح EfficientNet في خمس دقائق، ونغطي كيفية عملها، وما يجعلها فريدة من نوعها، ولماذا لا تزال مهمة في رؤية الحاسوب. لنبدأ!
Link to this sectionما هي EfficientNet؟#
قبل تصميم EfficientNet، كانت معظم نماذج التعرف على الصور تحسن الدقة عن طريق ضبط طبقاتها أو زيادة حجم الصورة المدخلة لالتقاط المزيد من التفاصيل. بينما حسنت هذه الاستراتيجيات النتائج، إلا أنها جعلت النماذج أثقل وأكثر تطلبًا. وهذا يعني أنها كانت تحتاج إلى مزيد من الذاكرة وأجهزة أفضل.
بدلاً من تغيير الطبقات الفردية، تقوم EfficientNet بتوسيع العمق والعرض ودقة الصورة معًا باستخدام طريقة تسمى القياس المركب. يسمح هذا النهج للنموذج بالنمو بكفاءة دون تحميل أي جانب واحد بشكل زائد.
تعالج بنية EfficientNet الصور من خلال سلسلة من الكتل، كل منها مبني من وحدات أصغر. يعتمد عدد الوحدات في كل كتلة على حجم النموذج.

الشكل 1. اللبنات الأساسية لـ EfficientNet. (المصدر)
تستخدم الإصدارات الأصغر وحدات أقل، بينما تكرر الإصدارات الأكبر الوحدات بشكل متكرر. يتيح هذا التصميم المرن لـ EfficientNet تقديم دقة وكفاءة عاليتين عبر مجموعة واسعة من التطبيقات، من الأجهزة المحمولة إلى الأنظمة واسعة النطاق.
Link to this sectionكيف يعمل القياس المركب#
توسع طريقة القياس المركب عمق النموذج وعرضه ودقة صورته ولكنها تحافظ على توازنها. هذا يجعل من الممكن استخدام قوة الحوسبة بكفاءة. تبدأ السلسلة بنموذج أساسي أصغر يسمى EfficientNet-B0، والذي يعمل كأساس لجميع الإصدارات الأخرى.
من B0، تتوسع النماذج إلى متغيرات أكبر تسمى EfficientNet-B1 حتى EfficientNet-B7. مع كل خطوة، تكتسب الشبكة طبقات إضافية، وتزيد من عدد القنوات (الوحدات المستخدمة للمعالجة)، وتتعامل مع صور مدخلة ذات دقة أعلى. يتم تحديد مقدار النمو في كل خطوة بواسطة معلمة تسمى المعامل المركب، والذي يضمن زيادة العمق والعرض والدقة بنسب ثابتة بدلاً من زيادتها بشكل مستقل.

الشكل 2. القياس المركب يزيد من عرض النموذج وعمقه ودقة صورته. (المصدر)
Link to this sectionبنية EfficientNet#
بعد ذلك، دعونا نلقي نظرة على بنية EfficientNet.
إنها تعتمد على MobileNetV2، وهو نموذج رؤية حاسوب خفيف الوزن ومحسن للأجهزة المحمولة والمدمجة. في جوهره يوجد كتلة Mobile Inverted Bottleneck Convolution (MBConv)، وهي طبقة خاصة تعالج بيانات الصورة مثل الالتفاف القياسي ولكن مع حسابات أقل. تجعل هذه الكتلة النموذج سريعًا وأكثر كفاءة في استخدام الذاكرة.
داخل كل من كتل MBConv توجد وحدة squeeze-and-excitation (SE). تقوم هذه الوحدة بضبط قوة القنوات المختلفة في الشبكة. إنها تعزز قوة القنوات الأساسية وتقلل من قوة القنوات الأخرى. تساعد الوحدة الشبكة على التركيز على أهم الميزات في الصورة، مع تجاهل الباقي. يستخدم نموذج EfficientNet أيضًا دالة تنشيط Swish (دالة رياضية تساعد الشبكة على تعلم الأنماط)، والتي تساعده في اكتشاف الأنماط في الصور بشكل أفضل من الطرق القديمة.
علاوة على ذلك، فهي تستخدم DropConnect، حيث يتم إيقاف بعض الاتصالات داخل الشبكة بشكل عشوائي أثناء التدريب. تعمل طريقة التنظيم العشوائي هذه (تقنية عشوائية لمنع النموذج من حفظ بيانات التدريب بدلاً من التعميم) على تقليل الإفراط في التخصيص من خلال إجبار الشبكة على تعلم تمثيلات ميزات أكثر قوة (أنماط أقوى وأكثر عمومية في البيانات) والتي تنتقل بشكل أفضل إلى البيانات غير المرئية.

الشكل 3. بنية EfficientNet-B0 (المصدر)
Link to this sectionنظرة عامة موجزة على متغيرات نموذج EfficientNet#
الآن بعد أن أصبح لدينا فهم أفضل لكيفية عمل نماذج EfficientNet، دعونا نناقش متغيرات النموذج المختلفة.
تتوسع نماذج EfficientNet من B0 إلى B7، بدءًا من B0 كأساس يوازن بين السرعة والدقة. يزيد كل إصدار من العمق والعرض ودقة الصورة، مما يحسن الدقة. ومع ذلك، فهي تتطلب أيضًا المزيد من قوة الحوسبة، من B1 و B2 وصولاً إلى B6 و B7 عالية الأداء.
بينما تحقق نماذج EfficientNet-B3 و EfficientNet-B4 توازناً للصور الأكبر، غالبًا ما يتم اختيار B5 لمجموعات البيانات المعقدة التي تتطلب الدقة. بخلاف هذه النماذج، يمكن لأحدث نموذج، EfficientNet V2، تحسين سرعة التدريب، والتعامل مع مجموعات البيانات الصغيرة بشكل أفضل، كما أنه مُحسَّن للأجهزة الحديثة.
Link to this sectionتطبيقات EfficientNet#
يمكن لـ EfficientNet إنتاج نتائج دقيقة مع استخدام ذاكرة وقوة معالجة أقل من العديد من النماذج الأخرى. وهذا يجعلها مفيدة في العديد من المجالات، من البحث العلمي إلى المنتجات التي يستخدمها الناس يوميًا.
Link to this sectionتحليل الصور الطبية#
غالبًا ما تحتوي الصور الطبية، مثل فحوصات الأشعة المقطعية للرئتين، على تفاصيل دقيقة ضرورية للتشخيص الدقيق. يمكن لنماذج الذكاء الاصطناعي المساعدة في تحليل هذه الصور للكشف عن الأنماط التي قد يصعب على البشر اكتشافها. أحد تكيفات EfficientNet لهذا الغرض هو MONAI (Medical Open Network for AI) EfficientNet، والذي صُمم خصيصًا لـ تحليل الصور الطبية.
بناءً على بنية EfficientNet، طور الباحثون أيضًا Lung-EffNet، وهو نموذج يصنف فحوصات الأشعة المقطعية للرئة للكشف عن الأورام. يمكنه تصنيف الأورام على أنها حميدة أو خبيثة أو طبيعية، محققًا دقة مُبلغ عنها تزيد عن 99% في الإعدادات التجريبية.

الشكل 4. تصنيف صور الأورام باستخدام Lung-EffNet. (المصدر)
Link to this sectionاكتشاف الكائنات في الوقت الفعلي#
اكتشاف الكائنات هو عملية العثور على الكائنات في صورة وتحديد مواقعها. وهو جزء أساسي من تطبيقات مثل أنظمة الأمن، والسيارات ذاتية القيادة، والطائرات بدون طيار.
أصبحت EfficientNet مهمة في هذا المجال لأنها قدمت طريقة فعالة للغاية لاستخراج الميزات من الصور. أظهرت طريقتها في قياس العمق والعرض والدقة كيف يمكن للنماذج أن تكون دقيقة دون أن تكون ثقيلة أو بطيئة للغاية. هذا هو السبب في أن العديد من أنظمة الكشف، مثل EfficientDet، تستخدم EfficientNet كعمود فقري لها.
تشترك النماذج الأحدث، مثل Ultralytics YOLO11، في نفس هدف الجمع بين السرعة والدقة. تأثر هذا الاتجاه نحو النماذج الفعالة بشدة بالأفكار المستمدة من بنيات مثل EfficientNet.
Link to this sectionإيجابيات وسلبيات EfficientNet#
إليك بعض فوائد استخدام EfficientNet في مشاريع رؤية الحاسوب:
- دقة عالية مع عدد أقل من المعلمات: يمكن لـ EfficientNet تقديم دقة مماثلة أو أفضل من النماذج الأقدم مثل ResNet أو DenseNet. ومع ذلك، فهي تستخدم معلمات أقل، مما يجعلها أسرع في التدريب وأسهل في النشر.
- عائلة نماذج قابلة للتوسع: بدءًا من B0 إلى B7، يمكنك اختيار إصدار يتناسب مع أجهزتك ومتطلبات الدقة الخاصة بك دون تغيير الشبكة الأساسية.
- جيدة للتعلم بنقل المعرفة: يمكن لـ EfficientNet تقديم أداء نموذج موثوق به للتعلم بنقل المعرفة، وهي عملية إعادة تدريب نموذج مدرب مسبقًا لمهمة مخصصة. يمكن أن تعمل كعمود فقري لمجموعة متنوعة من مهام رؤية الحاسوب. لقد أظهرت أيضًا نتائج قوية عند ضبطها بدقة. على سبيل المثال، حققت دقة متطورة على CIFAR-100، وهي مجموعة بيانات مستخدمة على نطاق واسع لـ تصنيف الصور، مع عدد معلمات أقل بكثير من النماذج السابقة.
بينما توجد العديد من الفوائد المتعلقة باستخدام EfficientNet، إليك بعض قيود EfficientNet التي يجب وضعها في الاعتبار:
- تتطلب المزيد من الذاكرة: تتطلب إصدارات مثل EfficientNet-B6 و EfficientNet-B7 الكثير من ذاكرة GPU.
- القياس مضبوط لـ ImageNet: صُممت إعدادات القياس لمجموعة بيانات ImageNet، لذا قد ينخفض الأداء في مجموعات البيانات المختلفة جدًا بدون ضبط دقيق. هذا صحيح بشكل خاص لمجموعات البيانات الصغيرة، لأن بنية وقياس EfficientNet صُمما لمجموعة بيانات كبيرة ومتنوعة مثل ImageNet، والتي توفر بيانات كافية لتبرير عمقها وعرضها.
- أبطأ على بعض الأجهزة: تستخدم EfficientNet طبقات تسمى MBConv مصممة للكفاءة على الأجهزة الحديثة. على وحدات GPU أو CPU الأقدم، قد تعمل هذه الطبقات بشكل أبطأ.
Link to this sectionأبرز النقاط#
غيرت EfficientNet كيفية نمو نماذج رؤية الحاسوب من خلال الحفاظ على توازن العمق والعرض ودقة الصورة. لا يزال نموذجًا مهمًا وقد أثر على البنيات الأحدث أيضًا. على وجه الخصوص، تحتل مكانة ذات مغزى في تاريخ رؤية الحاسوب.
انضم إلى مجتمعنا ومستودع GitHub لاستكشاف المزيد عن الذكاء الاصطناعي. تحقق من صفحات الحلول الخاصة بنا للقراءة عن الذكاء الاصطناعي في الرعاية الصحية ورؤية الحاسوب في السيارات. اكتشف خيارات الترخيص الخاصة بنا وابدأ في البناء باستخدام رؤية الحاسوب اليوم!






