يولو فيجن شنتشن
شنتشن
انضم الآن

مقارنة بين Ultralytics YOLOv8 ونماذج YOLO السابقة

أبيرامي فينا

4 دقائق قراءة

2 أبريل، 2025

قارن بين Ultralytics YOLOv8 و YOLOv9 و YOLOv10 و Ultralytics YOLO11 لفهم كيف تطورت هذه النماذج وتحسنت من عام 2023 إلى عام 2025.

من أتمتة المهام اليومية إلى المساعدة في اتخاذ قرارات مستنيرة في الوقت الفعلي، يعيد الذكاء الاصطناعي (AI) تشكيل مستقبل مختلف الصناعات. أحد المجالات الرائعة بشكل خاص في الذكاء الاصطناعي هو الرؤية الحاسوبية، والمعروفة أيضًا باسم Vision AI. وهي تركز على تمكين الآلات من تحليل وتفسير البيانات المرئية كما يفعل البشر. 

على وجه التحديد، تقود نماذج رؤية الكمبيوتر الابتكارات التي تعزز كلاً من السلامة والكفاءة. على سبيل المثال، تُستخدم هذه النماذج في السيارات ذاتية القيادة لاكتشاف المشاة وفي كاميرات المراقبة لمراقبة المباني على مدار الساعة. 

تعد نماذج YOLO (You Only Look Once) من بين نماذج رؤية الكمبيوتر الأكثر شهرة، والمعروفة بقدراتها على الكشف عن الكائنات في الوقت الفعلي. بمرور الوقت، تحسنت نماذج YOLO، حيث يقدم كل إصدار جديد أداءً أفضل ومرونة أكبر.

يمكن للإصدارات الأحدث مثل Ultralytics YOLO11 التعامل مع مجموعة متنوعة من المهام، مثل تجزئة المثيلات وتصنيف الصور وتقدير الوضع وتتبع الكائنات المتعددة، بدقة وسرعة وجودة أفضل من أي وقت مضى.

في هذه المقالة، سنقارن بين Ultralytics YOLOv8 و YOLOv9 و YOLOv10 و Ultralytics YOLO11 للحصول على فكرة أفضل عن كيفية تطور هذه النماذج. سنقوم بتحليل ميزاتها الرئيسية ونتائج المقارنة المعيارية واختلافات الأداء. هيا بنا نبدأ!

نظرة عامة على Ultralytics YOLOv8

كان YOLOv8، الذي تم إصداره بواسطة Ultralytics في 10 يناير 2023، خطوة كبيرة إلى الأمام مقارنة بنماذج YOLO السابقة. إنه مُحسَّن للكشف الدقيق في الوقت الفعلي، ويجمع بين الأساليب التي تم اختبارها جيدًا والتحديثات المبتكرة للحصول على نتائج أفضل.

بالإضافة إلى اكتشاف الكائنات، فإنه يدعم أيضًا مهام رؤية الكمبيوتر التالية: تجزئة المثيلات، وتقدير الوضعية، واكتشاف الكائنات باستخدام الصناديق المحيطة الموجهة (OBB)، وتصنيف الصور. ميزة أخرى مهمة في YOLOv8 هي أنها متاحة بخمسة متغيرات مختلفة للنماذج - Nano و Small و Medium و Large و X - بحيث يمكنك اختيار التوازن الصحيح بين السرعة والدقة بناءً على احتياجاتك.

نظرًا لتعدد استخداماته وأدائه القوي، يمكن استخدام YOLOv8 في العديد من التطبيقات الواقعية، مثل الأنظمة الأمنية والمدن الذكية والرعاية الصحية والأتمتة الصناعية.

__wf_reserved_inherit
الشكل 1. إدارة مواقف السيارات في المدن الذكية باستخدام YOLOv8.

الميزات الرئيسية لـ YOLOv8

إليك نظرة فاحصة على بعض الميزات الرئيسية الأخرى في YOLOv8:

  • هندسة اكتشاف محسنة: يستخدم YOLOv8 هيكلًا خلفيًا مُحسَّنًا من نوع CSPDarknet. تم تحسين هذا الهيكل الخلفي لاستخراج الميزات - عملية تحديد والتقاط الأنماط أو التفاصيل المهمة من الصور المدخلة التي تساعد النموذج على تقديم تنبؤات دقيقة.

  • رأس الاكتشاف: يستخدم تصميمًا خاليًا من المرساة ومنفصلاً، مما يعني أنه لا يعتمد على أشكال مربعات محددة مسبقًا (مرساة) ويتعلم بدلاً من ذلك التنبؤ بمواقع الكائنات مباشرةً. نظرًا للإعداد المنفصل، تتم معالجة مهام تصنيف ماهية الكائن والتنبؤ بمكانه (الانحدار) بشكل منفصل، مما يساعد على تحسين الدقة وتسريع التدريب.

  • يوازن بين الدقة والسرعة: يحقق هذا النموذج دقة رائعة مع الحفاظ على أوقات استدلال سريعة، مما يجعله مناسبًا لكل من البيئات السحابية والحافة.

  • سهل الاستخدام: تم تصميم YOLOv8 ليكون سهل البدء به - يمكنك البدء في التنبؤ ورؤية النتائج في بضع دقائق فقط باستخدام حزمة Ultralytics Python.

يركز YOLOv9 على الكفاءة الحسابية

تم إصدار YOLOv9 في 21 فبراير 2024، بواسطة Chien-Yao Wang و Hong-Yuan Mark Liao من معهد علوم المعلومات، Academia Sinica، تايوان. وهو يدعم مهام مثل اكتشاف الكائنات و تجزئة المثيلات

يعتمد هذا النموذج على Ultralytics YOLOv5 ويقدم ابتكارين رئيسيين: معلومات التدرج القابلة للبرمجة (PGI) وشبكة تجميع الطبقات الفعالة المعممة (GELAN). 

تساعد PGI YOLOv9 في الاحتفاظ بالمعلومات المهمة أثناء معالجة البيانات من خلال طبقاتها، مما يؤدي إلى نتائج أكثر دقة. وفي الوقت نفسه، تعمل GELAN على تحسين كيفية استخدام النموذج لطبقاته، مما يعزز الأداء والكفاءة الحسابية. بفضل هذه الترقيات، يمكن لـ YOLOv9 التعامل مع المهام في الوقت الفعلي على الأجهزة الطرفية وتطبيقات الهاتف المحمول، حيث غالبًا ما تكون موارد الحوسبة محدودة.

__wf_reserved_inherit
الشكل 2. فهم كيف يحسن GELAN دقة YOLOv9.

الميزات الرئيسية لـ YOLOv9

إليك لمحة عن بعض الميزات الرئيسية الأخرى في YOLOv8:

  • دقة عالية مع كفاءة: يوفر YOLOv9 دقة اكتشاف عالية دون استهلاك الكثير من قوة الحوسبة، مما يجعله خيارًا رائعًا عندما تكون الموارد محدودة.
  • نماذج خفيفة الوزن: تم تحسين متغيرات النموذج خفيف الوزن في YOLOv9 لعمليات النشر على الحافة والجوال. 
  • سهل الاستخدام: يدعم حزمة Ultralytics Python YOLOv9، لذا من السهل إعداده وتشغيله في بيئات مختلفة، سواء كنت تستخدم التعليمات البرمجية أو سطر الأوامر.

YOLOv10 يتيح الكشف عن الأجسام بدون NMS

تم تقديم YOLOv10 في 23 مايو 2024، من قبل باحثين من جامعة تسينغهوا ويركز على الكشف عن الأجسام في الوقت الفعلي. يعالج القيود في إصدارات YOLO السابقة عن طريق إزالة الحاجة إلى التثبيط غير الأقصى (NMS)، وهي خطوة معالجة لاحقة تستخدم لإزالة الاكتشافات المكررة، وتحسين تصميم النموذج بشكل عام. ينتج عن هذا كشف أسرع وأكثر كفاءة للأجسام، مع الاستمرار في تحقيق أحدث دقة.

جزء حيوي مما يجعل هذا ممكنًا هو نهج التدريب المعروف باسم تعيينات التسمية المزدوجة المتسقة. فهو يجمع بين استراتيجيتين: إحداهما تسمح لتنبؤات متعددة بالتعلم من نفس الكائن (واحد إلى متعدد) والأخرى تركز على اختيار أفضل تنبؤ واحد (واحد إلى واحد). نظرًا لأن كلتا الاستراتيجيتين تتبعان نفس قواعد المطابقة، فإن النموذج يتعلم تجنب التكرارات من تلقاء نفسه، لذلك ليست هناك حاجة إلى NMS.

__wf_reserved_inherit
الشكل 3. يستخدم YOLOv10 تعيينات متسقة للتسميات الثنائية للتدريب الخالي من NMS.

تستخدم بنية YOLOv10 أيضًا العمود الفقري المحسن CSPNet لتعلم الميزات بشكل أكثر فعالية وعنق PAN (شبكة تجميع المسار) التي تجمع المعلومات من طبقات مختلفة، مما يجعلها أفضل في اكتشاف الأجسام الصغيرة والكبيرة. هذه التحسينات تجعل من الممكن استخدام YOLOv10 للتطبيقات الواقعية في التصنيع والبيع بالتجزئة والقيادة الذاتية.

الميزات الرئيسية لـ YOLOv10

فيما يلي بعض الميزات البارزة الأخرى في YOLOv10:

  • التلافيف ذات النواة الكبيرة: يستخدم النموذج تلافيف ذات نواة كبيرة لالتقاط المزيد من السياق من مناطق أوسع من الصورة، مما يساعده على فهم المشهد العام بشكل أفضل.
  • وحدات الانتباه الذاتي الجزئي: يشتمل النموذج على وحدات انتباه ذاتي جزئي للتركيز على الأجزاء الأكثر أهمية في الصورة دون استخدام الكثير من قوة الحوسبة، مما يعزز الأداء بكفاءة.
  • نوع نموذج فريد: إلى جانب أحجام YOLOv10 المعتادة - Nano و Small و Medium و Large و X - هناك أيضًا إصدار خاص يسمى YOLOv10b (متوازن). إنه نموذج أوسع، مما يعني أنه يعالج المزيد من الميزات في كل طبقة، مما يساعد على تحسين الدقة مع الاستمرار في تحقيق التوازن بين السرعة والحجم.
  • سهل الاستخدام: يتوافق YOLOv10 مع حزمة Ultralytics Python، مما يجعله سهل الاستخدام.

Ultralytics YOLO11: سرعة ودقة محسّنتان

في هذا العام، في 30 سبتمبر، أطلقت Ultralytics رسميًا YOLO11 - أحد أحدث النماذج في سلسلة YOLO - في فعاليتها السنوية الهجينة، YOLO Vision 2024 (YV24).

قدم هذا الإصدار تحسينات كبيرة مقارنة بالإصدارات السابقة. YOLO11 أسرع وأكثر دقة وكفاءة عالية. وهو يدعم النطاق الكامل لـ مهام رؤية الحاسوب التي اعتاد عليها مستخدمو YOLOv8، بما في ذلك اكتشاف الكائنات وتجزئة المثيلات وتصنيف الصور. كما أنه يحافظ على التوافق مع سير عمل YOLOv8، مما يسهل على المستخدمين الانتقال بسلاسة إلى الإصدار الجديد.

بالإضافة إلى ذلك، تم تصميم YOLO11 لتلبية مجموعة واسعة من احتياجات الحوسبة - من الأجهزة الطرفية خفيفة الوزن إلى الأنظمة السحابية القوية. يتوفر النموذج كإصدار مفتوح المصدر وإصدار للمؤسسات، مما يجعله قابلاً للتكيف مع حالات الاستخدام المختلفة.

إنه خيار رائع للمهام الدقيقة مثل التصوير الطبي واكتشاف الأقمار الصناعية، بالإضافة إلى التطبيقات الأوسع في المركبات ذاتية القيادة والزراعة والرعاية الصحية.

__wf_reserved_inherit
الشكل 4. استخدام Ultralytics YOLO11 لاكتشاف حركة المرور وعدها وتتبعها.

الميزات الرئيسية لـ YOLO11

فيما يلي بعض الميزات الفريدة الأخرى في YOLO11:

  • اكتشاف سريع وفعال: يتميز YOLO11 برأس اكتشاف مصمم للحد الأدنى من الكمون، مع التركيز على السرعة في طبقات التنبؤ النهائية دون المساس بالأداء.
  • استخلاص محسّن للميزات: تعمل البنية المحسّنة للعمود الفقري والعنق على تحسين استخلاص الميزات، مما يؤدي إلى تنبؤات أكثر دقة. 
  • نشر سلس عبر الأنظمة الأساسية: تم تحسين YOLO11 ليعمل بكفاءة على الأجهزة الطرفية والمنصات السحابية ووحدات معالجة الرسومات NVIDIA، مما يضمن القدرة على التكيف عبر البيئات المختلفة.

قياس أداء نماذج YOLO على مجموعة بيانات COCO

عند استكشاف نماذج مختلفة، ليس من السهل دائمًا مقارنتها بمجرد النظر إلى ميزاتها. هذا هو المكان الذي يأتي فيه القياس. من خلال تشغيل جميع النماذج على نفس مجموعة البيانات، يمكننا قياس ومقارنة أدائها بشكل موضوعي. دعنا نلقي نظرة على كيفية أداء كل نموذج على مجموعة بيانات COCO.

عند مقارنة نماذج YOLO، تجلب كل نسخة جديدة تحسينات ملحوظة فيما يتعلق بالدقة والسرعة والمرونة. على وجه الخصوص، تحقق YOLO11m قفزة هنا لأنه يستخدم معلمات أقل بنسبة 22٪ من YOLOv8m، مما يعني أنه أخف وزنا وأسرع في التشغيل. أيضًا، على الرغم من صغر حجمه، إلا أنه يحقق متوسط دقة أعلى (mAP) على مجموعة بيانات COCO. يقيس هذا المقياس مدى جودة اكتشاف النموذج للكائنات وتحديد موقعها، لذا فإن ارتفاع mAP يعني تنبؤات أكثر دقة. 

__wf_reserved_inherit
الشكل 5. قياس أداء YOLO11 ونماذج YOLO الأخرى على مجموعة بيانات COCO.

اختبار ومقارنة نماذج YOLO على مقطع فيديو

دعنا نستكشف كيف تعمل هذه النماذج في موقف واقعي.

لمقارنة YOLOv8 و YOLOv9 و YOLOv10 و YOLO11، تم تشغيل النماذج الأربعة على نفس فيديو حركة المرور باستخدام درجة ثقة 0.3 (لا يعرض النموذج عمليات الكشف إلا عندما يكون واثقًا بنسبة 30٪ على الأقل من أنه حدد كائنًا بشكل صحيح) وحجم صورة 640 لتقييم عادل. أبرزت نتائج اكتشاف الأجسام وتتبعها الاختلافات الرئيسية في دقة الاكتشاف والسرعة والدقة. 

من الإطار الأول، التقط YOLO11 المركبات الكبيرة مثل الشاحنات التي فاتها YOLOv10. أظهر YOLOv8 و YOLOv9 أداءً لائقًا ولكنهما اختلفا اعتمادًا على ظروف الإضاءة وحجم الكائن. ظلت المركبات الأصغر والأكثر بعدًا تمثل تحديًا عبر جميع النماذج، على الرغم من أن YOLO11 أظهر تحسينات ملحوظة في عمليات الكشف هذه أيضًا.

__wf_reserved_inherit
الشكل 6. مقارنة بين YOLOv8 و YOLOv9 و YOLOv10 و YOLO11.

من حيث السرعة، عملت جميع النماذج بين 10 و 20 مللي ثانية لكل إطار، وهي سرعة كافية للتعامل مع المهام في الوقت الفعلي بأكثر من 50 إطارًا في الثانية. من ناحية أخرى، قدم YOLOv8 و YOLOv9 عمليات كشف ثابتة وموثوقة طوال الفيديو. ومن المثير للاهتمام أن YOLOv10، المصمم لتقليل زمن الوصول، كان أسرع ولكنه أظهر بعض التناقضات في اكتشاف أنواع معينة من الكائنات. 

من ناحية أخرى، برز YOLO11 لدقته، حيث قدم توازنًا قويًا بين السرعة و الدقة. على الرغم من أن أياً من النماذج لم يعمل بشكل مثالي في كل إطار، إلا أن المقارنة جنبًا إلى جنب أظهرت بوضوح أن YOLO11 قدم أفضل أداء عام. 

أي نماذج YOLO هي الأفضل لمهام الرؤية الحاسوبية؟

يعتمد اختيار نموذج لمشروع ما على متطلباته المحددة. على سبيل المثال، قد تعطي بعض التطبيقات الأولوية للسرعة، بينما قد تتطلب تطبيقات أخرى دقة أعلى أو تواجه قيودًا على النشر تؤثر على القرار. 

هناك عامل مهم آخر هو نوع مهام رؤية الكمبيوتر التي تحتاج إلى معالجتها. إذا كنت تبحث عن مرونة أوسع عبر مهام مختلفة، فإن YOLOv8 و YOLO11 خيارات جيدة.

يعتمد اختيارك بين YOLOv8 أو YOLO11 حقًا على احتياجاتك. YOLOv8 هو خيار قوي إذا كنت جديدًا في مجال الرؤية الحاسوبية وتقدر وجود مجتمع أكبر، والمزيد من الدروس التعليمية، وعمليات تكامل الطرف الثالث واسعة النطاق. 

من ناحية أخرى، إذا كنت تبحث عن أداء متطور مع دقة وسرعة أفضل، فإن YOLO11 هو الخيار الأفضل، على الرغم من أنه يأتي مع مجتمع أصغر وعدد أقل من عمليات التكامل نظرًا لكونه إصدارًا أحدث.

النقاط الرئيسية

من Ultralytics YOLOv8 إلى Ultralytics YOLO11، يعكس تطور سلسلة نماذج YOLO دفعة ثابتة نحو نماذج رؤية حاسوبية أكثر ذكاءً. يجلب كل إصدار من YOLO ترقيات ذات مغزى من حيث السرعة والدقة. 

مع استمرار تطور الرؤية الحاسوبية، تقدم هذه النماذج حلولًا موثوقة للتحديات الواقعية، من اكتشاف الكائنات إلى الأنظمة المستقلة. يوضح التطور المستمر لنماذج YOLO إلى أي مدى وصل هذا المجال وإلى أي مدى يمكن أن نتوقع المزيد في المستقبل.

لمعرفة المزيد حول الذكاء الاصطناعي، تفضل بزيارة مستودع GitHub الخاص بنا وتفاعل مع مجتمعنا. اكتشف التطورات في مختلف الصناعات، من الرؤية الاصطناعية في التصنيع إلى الرؤية الحاسوبية في الرعاية الصحية. تحقق من خيارات الترخيص الخاصة بنا لبدء مشاريع الرؤية الاصطناعية الخاصة بك اليوم.

لنبنِ مستقبل
الذكاء الاصطناعي معًا!

ابدأ رحلتك مع مستقبل تعلم الآلة

ابدأ مجانًا
تم نسخ الرابط إلى الحافظة