مقارنة بين طراز YOLO : YOLOv11 مقابل الطراز السابق

من أتمتة المهام اليومية إلى المساعدة في اتخاذ قرارات مستنيرة في الوقت الفعلي، يعيد الذكاء الاصطناعي (AI) تشكيل مستقبل مختلف الصناعات. أحد المجالات الرائعة بشكل خاص في الذكاء الاصطناعي هو الرؤية الحاسوبية، والمعروفة أيضًا باسم Vision AI. وهي تركز على تمكين الآلات من تحليل وتفسير البيانات المرئية كما يفعل البشر.

وعلى وجه التحديد، تقود نماذج الرؤية الحاسوبية الابتكارات التي تعزز كلاً من السلامة والكفاءة. على سبيل المثال، تُستخدم هذه النماذج في السيارات ذاتية القيادة detect المشاة وفي الكاميرات الأمنية لمراقبة المباني على مدار الساعة.

بعض نماذج الرؤية الحاسوبية الأكثر شهرة هي نماذج YOLO (أنت تنظر مرة واحدة فقط)، والمعروفة بقدراتها على اكتشاف الأجسام في الوقت الحقيقي. بمرور الوقت، تحسنت نماذج YOLO حيث يقدم كل إصدار جديد أداءً أفضل ومرونة أكبر.

الإصدارات الأحدث مثل Ultralytics YOLO11 أن تتعامل مع مجموعة متنوعة من المهام، مثل تجزئة المثيلات، وتصنيف الصور، وتقدير الوضع، وتتبع الأجسام المتعددة، بدقة وسرعة ودقة أفضل من أي وقت مضى.

في هذه المقالة، سنقارن بين Ultralytics YOLOv8و YOLOv9 و YOLOv10 و Ultralytics YOLO11 لتكوين فكرة أفضل عن كيفية تطور هذه النماذج. سنحلل ميزاتها الرئيسية ونتائجها المعيارية واختلافات الأداء. لنبدأ!

نظرة عامة على Ultralytics YOLOv8

يُعدّ YOLOv8 الذي أصدرته شركة Ultralytics في 10 يناير 2023، خطوة كبيرة إلى الأمام مقارنةً بنماذج YOLO السابقة. فهو مُحسَّن للكشف الدقيق في الوقت الحقيقي، ويجمع بين الأساليب التي تم اختبارها جيدًا والتحديثات المبتكرة لتحقيق نتائج أفضل.

بالإضافة إلى اكتشاف الأجسام، فهو يدعم أيضًا مهام الرؤية الحاسوبية التالية: تجزئة النماذج، وتقدير الوضعية، واكتشاف الأجسام في المربعات المحدودة الموجهة (OBB)، وتصنيف الصور. ميزة أخرى مهمة في YOLOv8 هي أنه متاح في خمسة نماذج مختلفة - النانو والصغير والمتوسط والكبير والعاشر - بحيث يمكنك اختيار التوازن الصحيح بين السرعة والدقة بناءً على احتياجاتك.

نظرًا لتعدد استخداماته وأدائه القوي، يمكن استخدام YOLOv8 في العديد من التطبيقات الواقعية، مثل أنظمة الأمن والمدن الذكية والرعاية الصحية والأتمتة الصناعية.

__wf_reserved_inherit — الشكل 1. إدارة مواقف السيارات في المدن الذكية باستخدام YOLOv8.

‍

الميزات الرئيسية لـ YOLOv8

إليك نظرة فاحصة على بعض الميزات الرئيسية الأخرى في YOLOv8:

بنية كشف محسّنة: يستخدم YOLOv8 عمودًا فقريًا محسّنًا لشبكة CSPDarknet. تم تحسين هذا العمود الفقري لاستخراج الميزات - وهي عملية تحديد والتقاط الأنماط أو التفاصيل المهمة من صور الإدخال التي تساعد النموذج على إجراء تنبؤات دقيقة.
رأس الاكتشاف: يستخدم تصميمًا خاليًا من المرساة ومنفصلاً، مما يعني أنه لا يعتمد على أشكال مربعات محددة مسبقًا (مرساة) ويتعلم بدلاً من ذلك التنبؤ بمواقع الكائنات مباشرةً. نظرًا للإعداد المنفصل، تتم معالجة مهام تصنيف ماهية الكائن والتنبؤ بمكانه (الانحدار) بشكل منفصل، مما يساعد على تحسين الدقة وتسريع التدريب.
يوازن بين الدقة والسرعة: يحقق هذا النموذج دقة رائعة مع الحفاظ على أوقات استدلال سريعة، مما يجعله مناسبًا لكل من البيئات السحابية والحافة.
سهولة الاستخدام: تم تصميم YOLOv8 ليكون سهل الاستخدام - يمكنك البدء في التنبؤ ورؤية النتائج في بضع دقائق فقط باستخدام حزمةUltralytics Python .

YOLOv9 على الكفاءة الحسابية

تم إصدار YOLOv9 في 21 فبراير 2024 من قبل تشين ياو وانغ وهونغ يوان مارك لياو من معهد علوم المعلومات، الأكاديمية الصينية في تايوان. وهو يدعم مهام مثل الكشف عن الكائنات وتجزئة المثيل.

يعتمد هذا النموذج على Ultralytics YOLOv5 ويقدم ابتكارين رئيسيين: معلومات التدرج القابلة للبرمجة (PGI) وشبكة تجميع الطبقات الفعالة المعممة (GELAN).

يساعد PGI YOLOv9 على الاحتفاظ بالمعلومات المهمة أثناء معالجة البيانات من خلال طبقاته، مما يؤدي إلى نتائج أكثر دقة. وفي الوقت نفسه، تعمل GELAN على تحسين كيفية استخدام النموذج لطبقاته، مما يعزز الأداء والكفاءة الحسابية. بفضل هذه الترقيات، يمكن لـ YOLOv9 التعامل مع المهام في الوقت الفعلي على الأجهزة المتطورة وتطبيقات الأجهزة المحمولة، حيث تكون موارد الحوسبة محدودة في كثير من الأحيان.

‍

الميزات الرئيسية لـ YOLOv9

إليك لمحة عن بعض الميزات الرئيسية الأخرى في YOLOv8:

دقة عالية مع الكفاءة: يوفر YOLOv9 دقة كشف عالية دون استهلاك الكثير من طاقة الحوسبة، مما يجعله خيارًا رائعًا عندما تكون الموارد محدودة.
‍
نماذج خفيفة الوزن: تم تحسين متغيرات طرازات YOLOv9خفيفة الوزن لعمليات النشر على الحافة والأجهزة المحمولة.
‍
سهل الاستخدام: YOLOv9 مدعوم من حزمة Ultralytics Python لذا من السهل إعداده وتشغيله في بيئات مختلفة، سواء كنت تستخدم التعليمات البرمجية أو سطر الأوامر.

يمكّن YOLOv10 من اكتشاف الأجسام NMS

تم تقديم YOLOv10 في 23 مايو 2024 من قبل باحثين من جامعة تسينغهوا ويركز على اكتشاف الأجسام في الوقت الحقيقي. وهو يعالج القيود التي كانت موجودة في إصدارات YOLO السابقة من خلال إزالة الحاجة إلى الكبح غير الأقصىNMS)، وهي خطوة ما بعد المعالجة تُستخدم لإزالة عمليات الكشف المكررة، وتحسين تصميم النموذج العام. ينتج عن هذا اكتشاف أسرع وأكثر كفاءة للأجسام، مع الاستمرار في تحقيق دقة فائقة.

جزء حيوي مما يجعل هذا الأمر ممكناً هو نهج التدريب المعروف باسم التعيينات المتسقة ثنائية التسمية. فهو يجمع بين استراتيجيتين: إحداهما تسمح بتعلم تنبؤات متعددة من نفس الكائن (واحد إلى متعدد) والأخرى تركز على اختيار أفضل تنبؤ واحد (واحد إلى واحد). نظرًا لأن كلتا الاستراتيجيتين تتبعان نفس قواعد المطابقة، يتعلم النموذج تجنب التكرارات من تلقاء نفسه، لذا فإن NMS غير مطلوب.

‍

كما تستخدم بنية YOLOv10أيضًا العمود الفقري المحسّن لشبكة CSPNet لتعلم الميزات بشكل أكثر فعالية وعنق شبكة تجميع المسار (PAN) الذي يجمع بين المعلومات من طبقات مختلفة، مما يجعله أفضل في اكتشاف الأجسام الصغيرة والكبيرة على حد سواء. هذه التحسينات تجعل من الممكن استخدام YOLOv10 لتطبيقات العالم الحقيقي في التصنيع وتجارة التجزئة والقيادة الذاتية.

الميزات الرئيسية لـ YOLOv10

إليك بعض الميزات البارزة الأخرى في YOLOv10:

التلافيف ذات النواة الكبيرة: يستخدم النموذج تلافيف ذات نواة كبيرة لالتقاط المزيد من السياق من مناطق أوسع من الصورة، مما يساعده على فهم المشهد العام بشكل أفضل.
‍
وحدات الانتباه الذاتي الجزئي: يشتمل النموذج على وحدات انتباه ذاتي جزئي للتركيز على الأجزاء الأكثر أهمية في الصورة دون استخدام الكثير من قوة الحوسبة، مما يعزز الأداء بكفاءة.

إصدار فريد من نوعه: إلى جانب أحجام YOLOv10 المعتادة - النانو والصغير والمتوسط والكبير و X - هناك أيضًا إصدار خاص يسمى YOLOv10b (متوازن). إنه نموذج أعرض، مما يعني أنه يعالج المزيد من الميزات في كل طبقة، مما يساعد على تحسين الدقة مع تحقيق التوازن بين السرعة والحجم.
‍
سهل الاستخدام: يتوافق YOLOv10 مع حزمة Ultralytics Python مما يجعله سهل الاستخدام.

Ultralytics YOLO11: سرعة ودقة محسّنة

في 30 سبتمبر من هذا العام، أطلقت Ultralytics رسميًا في 30 سبتمبر جهاز YOLO11 - أحد أحدث الموديلات في سلسلة YOLO - في حدثها السنوي الهجين YOLO Vision 2024 (YV24).

أدخل هذا الإصدار تحسينات كبيرة على الإصدارات السابقة. YOLO11 أسرع وأكثر دقة وكفاءة عالية. وهو يدعم مجموعة كاملة من مهام الرؤية الحاسوبية التي يعرفها مستخدمو YOLOv8 بما في ذلك اكتشاف الأجسام، وتجزئة النماذج، وتصنيف الصور. كما أنه يحافظ على التوافق مع سير عمل YOLOv8 مما يسهل على المستخدمين الانتقال بسلاسة إلى الإصدار الجديد.

علاوةً على ذلك، تم تصميم YOLO11 لتلبية مجموعة واسعة من احتياجات الحوسبة - بدءًا من الأجهزة المتطورة خفيفة الوزن إلى الأنظمة السحابية القوية. يتوفر النموذج كإصدار مفتوح المصدر وإصدار للمؤسسات، مما يجعله قابلاً للتكيف مع حالات الاستخدام المختلفة.

إنه خيار رائع للمهام الدقيقة مثل التصوير الطبي واكتشاف الأقمار الصناعية، بالإضافة إلى التطبيقات الأوسع في المركبات ذاتية القيادة والزراعة والرعاية الصحية.

‍

الميزات الرئيسية لـ YOLO11

إليك بعض الميزات الفريدة الأخرى في YOLO11:

كشف سريع وفعال: يتميز YOLO11 برأس كشف مصمم لأدنى حد من زمن الاستجابة، مع التركيز على السرعة في طبقات التنبؤ النهائية دون المساس بالأداء.
‍
استخلاص محسّن للميزات: تعمل البنية المحسّنة للعمود الفقري والعنق على تحسين استخلاص الميزات، مما يؤدي إلى تنبؤات أكثر دقة.
‍
نشر سلس عبر المنصات: تم تحسين YOLO11 لتشغيله بكفاءة على الأجهزة المتطورة والمنصات السحابية ووحدات معالجة الرسومات NVIDIA مما يضمن إمكانية التكيف عبر بيئات مختلفة.

مقارنة نماذج YOLO المعيارية على مجموعة بيانات COCO

عند استكشاف النماذج المختلفة، ليس من السهل دائماً المقارنة بينها بمجرد النظر إلى ميزاتها. وهنا يأتي دور المقارنة المعيارية. من خلال تشغيل جميع النماذج على نفس مجموعة البيانات، يمكننا قياس ومقارنة أدائها بشكل موضوعي. لنلقِ نظرة على أداء كل نموذج على مجموعة بياناتCOCO .

عند المقارنة بين نماذج YOLO فإن كل إصدار جديد يجلب تحسينات ملحوظة فيما يتعلق بالدقة والسرعة والمرونة. وعلى وجه الخصوص، يُحقّق YOLO11m قفزة كبيرة هنا لأنه يستخدم معلمات أقل بنسبة 22% من YOLOv8m مما يعني أنه أخف وأسرع في التشغيل. أيضًا، على الرغم من حجمه الأصغر، إلا أنه يحقق متوسطmAP أعلى في مجموعة بيانات COCO . يقيس هذا المقياس مدى جودة اكتشاف النموذج للأجسام وتحديد مواقعها، لذا فإن متوسط mAP الأعلى يعني تنبؤات أكثر دقة.

‍

اختبار نماذج YOLO ومقارنتها على الفيديو

دعنا نستكشف كيف تعمل هذه النماذج في موقف واقعي.

للمقارنة بين YOLOv8 و YOLOv9 و YOLOv10 و YOLO11 تم تشغيل الأربعة على نفس فيديو حركة المرور باستخدام درجة ثقة 0.3 (يعرض النموذج الاكتشافات فقط عندما يكون واثقًا بنسبة 30% على الأقل من أنه حدد الجسم بشكل صحيح) وحجم صورة 640 للتقييم العادل. سلطت نتائج اكتشاف الأجسام وتتبعها الضوء على الاختلافات الرئيسية في دقة الاكتشاف والسرعة والدقة.

منذ الإطار الأول، التقط YOLO11 المركبات الكبيرة مثل الشاحنات التي لم يلتقطها YOLOv10 . وأظهر YOLOv8 و YOLOv9 أداءً جيدًا لكنه تفاوت حسب ظروف الإضاءة وحجم الجسم. ظلت المركبات الأصغر حجماً والبعيدة تمثل تحدياً في جميع النماذج، على الرغم من أن YOLO11 أظهر تحسناً ملحوظاً في عمليات الكشف هذه أيضاً.

‍

من حيث السرعة، عملت جميع الطرازات بين 10 و20 مللي ثانية لكل إطار، وهي سريعة بما يكفي للتعامل مع المهام في الوقت الحقيقي بمعدل يزيد عن 50 إطارًا في الثانية. من ناحية، قدم YOLOv8 و YOLOv9 اكتشافات ثابتة وموثوقة طوال الفيديو. ومن المثير للاهتمام أن YOLOv10 المصمم لوقت استجابة أقل، كان أسرع ولكنه أظهر بعض التناقضات في اكتشاف أنواع معينة من الأجسام.

من ناحية أخرى، تميزت YOLO11 بدقتها، حيث قدمت توازنًا قويًا بين السرعة والدقة. على الرغم من أن أداء أي من الطرازين لم يكن مثاليًا في كل إطار، إلا أن المقارنة جنبًا إلى جنب أظهرت بوضوح أن YOLO11 قدم أفضل أداء عام.

ما هو نموذج YOLO الأفضل لمهام الرؤية الحاسوبية؟

يعتمد اختيار نموذج لمشروع ما على متطلباته المحددة. على سبيل المثال، قد تعطي بعض التطبيقات الأولوية للسرعة، بينما قد تتطلب تطبيقات أخرى دقة أعلى أو تواجه قيودًا على النشر تؤثر على القرار.

العامل المهم الآخر هو نوع مهام الرؤية الحاسوبية التي تحتاج إلى معالجتها. إذا كنت تبحث عن مرونة أوسع في مختلف المهام، فإن YOLOv8 و YOLO11 خياران جيدان.

يعتمد اختيارك ل YOLOv8 أو YOLO11 على احتياجاتك. يعد YOLOv8 خيارًا قويًا إذا كنت جديدًا في مجال الرؤية الحاسوبية وتقدر مجتمعًا أكبر، والمزيد من البرامج التعليمية، والتكاملات الشاملة مع الجهات الخارجية.

من ناحية أخرى، إذا كنت تبحث عن أداء متطور مع دقة وسرعة أفضل، فإن YOLO11 هو الخيار الأفضل، على الرغم من أنه يأتي مع مجتمع أصغر وعدد أقل من عمليات التكامل نظرًا لكونه إصدارًا أحدث.

النقاط الرئيسية

من Ultralytics YOLOv8 إلى Ultralytics YOLO11 يعكس تطور سلسلة نماذج YOLO دفعة ثابتة نحو نماذج رؤية حاسوبية أكثر ذكاءً. يجلب كل إصدار من YOLO ترقيات ذات مغزى من حيث السرعة والدقة والدقة.

مع استمرار تقدم الرؤية الحاسوبية، تقدم هذه النماذج حلولاً موثوقة لتحديات العالم الحقيقي، بدءاً من اكتشاف الأجسام وصولاً إلى الأنظمة المستقلة. يُظهر التطوير المستمر لنماذج YOLO مدى التقدم الذي أحرزه هذا المجال ومدى التقدم الذي يمكن أن نتوقعه في المستقبل.

لمعرفة المزيد حول الذكاء الاصطناعي، تفضل بزيارة مستودع GitHub الخاص بنا وتفاعل مع مجتمعنا. اكتشف التطورات في مختلف الصناعات، من الرؤية الاصطناعية في التصنيع إلى الرؤية الحاسوبية في الرعاية الصحية. تحقق من خيارات الترخيص الخاصة بنا لبدء مشاريع الرؤية الاصطناعية الخاصة بك اليوم.

مقارنة Ultralytics YOLO11 بنماذج YOLO السابقة