قارن بين Ultralytics YOLOv8 و YOLOv9 و YOLOv10 و Ultralytics YOLO11 لفهم كيف تطورت هذه النماذج وتحسنت من عام 2023 إلى عام 2025.

قارن بين Ultralytics YOLOv8 و YOLOv9 و YOLOv10 و Ultralytics YOLO11 لفهم كيف تطورت هذه النماذج وتحسنت من عام 2023 إلى عام 2025.

من أتمتة المهام اليومية إلى المساعدة في اتخاذ قرارات مستنيرة في الوقت الفعلي، يعيد الذكاء الاصطناعي (AI) تشكيل مستقبل مختلف الصناعات. أحد المجالات الرائعة بشكل خاص في الذكاء الاصطناعي هو الرؤية الحاسوبية، والمعروفة أيضًا باسم Vision AI. وهي تركز على تمكين الآلات من تحليل وتفسير البيانات المرئية كما يفعل البشر.
على وجه التحديد، تقود نماذج رؤية الكمبيوتر الابتكارات التي تعزز كلاً من السلامة والكفاءة. على سبيل المثال، تُستخدم هذه النماذج في السيارات ذاتية القيادة لاكتشاف المشاة وفي كاميرات المراقبة لمراقبة المباني على مدار الساعة.
تعد نماذج YOLO (You Only Look Once) من بين نماذج رؤية الكمبيوتر الأكثر شهرة، والمعروفة بقدراتها على الكشف عن الكائنات في الوقت الفعلي. بمرور الوقت، تحسنت نماذج YOLO، حيث يقدم كل إصدار جديد أداءً أفضل ومرونة أكبر.
يمكن للإصدارات الأحدث مثل Ultralytics YOLO11 التعامل مع مجموعة متنوعة من المهام، مثل تجزئة المثيلات وتصنيف الصور وتقدير الوضع وتتبع الكائنات المتعددة، بدقة وسرعة وجودة أفضل من أي وقت مضى.
في هذه المقالة، سنقارن بين Ultralytics YOLOv8 و YOLOv9 و YOLOv10 و Ultralytics YOLO11 للحصول على فكرة أفضل عن كيفية تطور هذه النماذج. سنقوم بتحليل ميزاتها الرئيسية ونتائج المقارنة المعيارية واختلافات الأداء. هيا بنا نبدأ!
كان YOLOv8، الذي تم إصداره بواسطة Ultralytics في 10 يناير 2023، خطوة كبيرة إلى الأمام مقارنة بنماذج YOLO السابقة. إنه مُحسَّن للكشف الدقيق في الوقت الفعلي، ويجمع بين الأساليب التي تم اختبارها جيدًا والتحديثات المبتكرة للحصول على نتائج أفضل.
بالإضافة إلى اكتشاف الكائنات، فإنه يدعم أيضًا مهام رؤية الكمبيوتر التالية: تجزئة المثيلات، وتقدير الوضعية، واكتشاف الكائنات باستخدام الصناديق المحيطة الموجهة (OBB)، وتصنيف الصور. ميزة أخرى مهمة في YOLOv8 هي أنها متاحة بخمسة متغيرات مختلفة للنماذج - Nano و Small و Medium و Large و X - بحيث يمكنك اختيار التوازن الصحيح بين السرعة والدقة بناءً على احتياجاتك.
نظرًا لتعدد استخداماته وأدائه القوي، يمكن استخدام YOLOv8 في العديد من التطبيقات الواقعية، مثل الأنظمة الأمنية والمدن الذكية والرعاية الصحية والأتمتة الصناعية.

إليك نظرة فاحصة على بعض الميزات الرئيسية الأخرى في YOLOv8:
تم إصدار YOLOv9 في 21 فبراير 2024، بواسطة Chien-Yao Wang و Hong-Yuan Mark Liao من معهد علوم المعلومات، Academia Sinica، تايوان. وهو يدعم مهام مثل اكتشاف الكائنات و تجزئة المثيلات.
يعتمد هذا النموذج على Ultralytics YOLOv5 ويقدم ابتكارين رئيسيين: معلومات التدرج القابلة للبرمجة (PGI) وشبكة تجميع الطبقات الفعالة المعممة (GELAN).
تساعد PGI YOLOv9 في الاحتفاظ بالمعلومات المهمة أثناء معالجة البيانات من خلال طبقاتها، مما يؤدي إلى نتائج أكثر دقة. وفي الوقت نفسه، تعمل GELAN على تحسين كيفية استخدام النموذج لطبقاته، مما يعزز الأداء والكفاءة الحسابية. بفضل هذه الترقيات، يمكن لـ YOLOv9 التعامل مع المهام في الوقت الفعلي على الأجهزة الطرفية وتطبيقات الهاتف المحمول، حيث غالبًا ما تكون موارد الحوسبة محدودة.

إليك لمحة عن بعض الميزات الرئيسية الأخرى في YOLOv8:
تم تقديم YOLOv10 في 23 مايو 2024، من قبل باحثين من جامعة تسينغهوا ويركز على الكشف عن الأجسام في الوقت الفعلي. يعالج القيود في إصدارات YOLO السابقة عن طريق إزالة الحاجة إلى التثبيط غير الأقصى (NMS)، وهي خطوة معالجة لاحقة تستخدم لإزالة الاكتشافات المكررة، وتحسين تصميم النموذج بشكل عام. ينتج عن هذا كشف أسرع وأكثر كفاءة للأجسام، مع الاستمرار في تحقيق أحدث دقة.
جزء حيوي مما يجعل هذا ممكنًا هو نهج التدريب المعروف باسم تعيينات التسمية المزدوجة المتسقة. فهو يجمع بين استراتيجيتين: إحداهما تسمح لتنبؤات متعددة بالتعلم من نفس الكائن (واحد إلى متعدد) والأخرى تركز على اختيار أفضل تنبؤ واحد (واحد إلى واحد). نظرًا لأن كلتا الاستراتيجيتين تتبعان نفس قواعد المطابقة، فإن النموذج يتعلم تجنب التكرارات من تلقاء نفسه، لذلك ليست هناك حاجة إلى NMS.

تستخدم بنية YOLOv10 أيضًا العمود الفقري المحسن CSPNet لتعلم الميزات بشكل أكثر فعالية وعنق PAN (شبكة تجميع المسار) التي تجمع المعلومات من طبقات مختلفة، مما يجعلها أفضل في اكتشاف الأجسام الصغيرة والكبيرة. هذه التحسينات تجعل من الممكن استخدام YOLOv10 للتطبيقات الواقعية في التصنيع والبيع بالتجزئة والقيادة الذاتية.
فيما يلي بعض الميزات البارزة الأخرى في YOLOv10:
في هذا العام، في 30 سبتمبر، أطلقت Ultralytics رسميًا YOLO11 - أحد أحدث النماذج في سلسلة YOLO - في فعاليتها السنوية الهجينة، YOLO Vision 2024 (YV24).
قدم هذا الإصدار تحسينات كبيرة مقارنة بالإصدارات السابقة. YOLO11 أسرع وأكثر دقة وكفاءة عالية. وهو يدعم النطاق الكامل لـ مهام رؤية الحاسوب التي اعتاد عليها مستخدمو YOLOv8، بما في ذلك اكتشاف الكائنات وتجزئة المثيلات وتصنيف الصور. كما أنه يحافظ على التوافق مع سير عمل YOLOv8، مما يسهل على المستخدمين الانتقال بسلاسة إلى الإصدار الجديد.
بالإضافة إلى ذلك، تم تصميم YOLO11 لتلبية مجموعة واسعة من احتياجات الحوسبة - من الأجهزة الطرفية خفيفة الوزن إلى الأنظمة السحابية القوية. يتوفر النموذج كإصدار مفتوح المصدر وإصدار للمؤسسات، مما يجعله قابلاً للتكيف مع حالات الاستخدام المختلفة.
إنه خيار رائع للمهام الدقيقة مثل التصوير الطبي واكتشاف الأقمار الصناعية، بالإضافة إلى التطبيقات الأوسع في المركبات ذاتية القيادة والزراعة والرعاية الصحية.

فيما يلي بعض الميزات الفريدة الأخرى في YOLO11:
عند استكشاف نماذج مختلفة، ليس من السهل دائمًا مقارنتها بمجرد النظر إلى ميزاتها. هذا هو المكان الذي يأتي فيه القياس. من خلال تشغيل جميع النماذج على نفس مجموعة البيانات، يمكننا قياس ومقارنة أدائها بشكل موضوعي. دعنا نلقي نظرة على كيفية أداء كل نموذج على مجموعة بيانات COCO.
عند مقارنة نماذج YOLO، تجلب كل نسخة جديدة تحسينات ملحوظة فيما يتعلق بالدقة والسرعة والمرونة. على وجه الخصوص، تحقق YOLO11m قفزة هنا لأنه يستخدم معلمات أقل بنسبة 22٪ من YOLOv8m، مما يعني أنه أخف وزنا وأسرع في التشغيل. أيضًا، على الرغم من صغر حجمه، إلا أنه يحقق متوسط دقة أعلى (mAP) على مجموعة بيانات COCO. يقيس هذا المقياس مدى جودة اكتشاف النموذج للكائنات وتحديد موقعها، لذا فإن ارتفاع mAP يعني تنبؤات أكثر دقة.

دعنا نستكشف كيف تعمل هذه النماذج في موقف واقعي.
لمقارنة YOLOv8 و YOLOv9 و YOLOv10 و YOLO11، تم تشغيل النماذج الأربعة على نفس فيديو حركة المرور باستخدام درجة ثقة 0.3 (لا يعرض النموذج عمليات الكشف إلا عندما يكون واثقًا بنسبة 30٪ على الأقل من أنه حدد كائنًا بشكل صحيح) وحجم صورة 640 لتقييم عادل. أبرزت نتائج اكتشاف الأجسام وتتبعها الاختلافات الرئيسية في دقة الاكتشاف والسرعة والدقة.
من الإطار الأول، التقط YOLO11 المركبات الكبيرة مثل الشاحنات التي فاتها YOLOv10. أظهر YOLOv8 و YOLOv9 أداءً لائقًا ولكنهما اختلفا اعتمادًا على ظروف الإضاءة وحجم الكائن. ظلت المركبات الأصغر والأكثر بعدًا تمثل تحديًا عبر جميع النماذج، على الرغم من أن YOLO11 أظهر تحسينات ملحوظة في عمليات الكشف هذه أيضًا.

من حيث السرعة، عملت جميع النماذج بين 10 و 20 مللي ثانية لكل إطار، وهي سرعة كافية للتعامل مع المهام في الوقت الفعلي بأكثر من 50 إطارًا في الثانية. من ناحية أخرى، قدم YOLOv8 و YOLOv9 عمليات كشف ثابتة وموثوقة طوال الفيديو. ومن المثير للاهتمام أن YOLOv10، المصمم لتقليل زمن الوصول، كان أسرع ولكنه أظهر بعض التناقضات في اكتشاف أنواع معينة من الكائنات.
من ناحية أخرى، برز YOLO11 لدقته، حيث قدم توازنًا قويًا بين السرعة و الدقة. على الرغم من أن أياً من النماذج لم يعمل بشكل مثالي في كل إطار، إلا أن المقارنة جنبًا إلى جنب أظهرت بوضوح أن YOLO11 قدم أفضل أداء عام.
يعتمد اختيار نموذج لمشروع ما على متطلباته المحددة. على سبيل المثال، قد تعطي بعض التطبيقات الأولوية للسرعة، بينما قد تتطلب تطبيقات أخرى دقة أعلى أو تواجه قيودًا على النشر تؤثر على القرار.
هناك عامل مهم آخر هو نوع مهام رؤية الكمبيوتر التي تحتاج إلى معالجتها. إذا كنت تبحث عن مرونة أوسع عبر مهام مختلفة، فإن YOLOv8 و YOLO11 خيارات جيدة.
يعتمد اختيارك بين YOLOv8 أو YOLO11 حقًا على احتياجاتك. YOLOv8 هو خيار قوي إذا كنت جديدًا في مجال الرؤية الحاسوبية وتقدر وجود مجتمع أكبر، والمزيد من الدروس التعليمية، وعمليات تكامل الطرف الثالث واسعة النطاق.
من ناحية أخرى، إذا كنت تبحث عن أداء متطور مع دقة وسرعة أفضل، فإن YOLO11 هو الخيار الأفضل، على الرغم من أنه يأتي مع مجتمع أصغر وعدد أقل من عمليات التكامل نظرًا لكونه إصدارًا أحدث.
من Ultralytics YOLOv8 إلى Ultralytics YOLO11، يعكس تطور سلسلة نماذج YOLO دفعة ثابتة نحو نماذج رؤية حاسوبية أكثر ذكاءً. يجلب كل إصدار من YOLO ترقيات ذات مغزى من حيث السرعة والدقة.
مع استمرار تطور الرؤية الحاسوبية، تقدم هذه النماذج حلولًا موثوقة للتحديات الواقعية، من اكتشاف الكائنات إلى الأنظمة المستقلة. يوضح التطور المستمر لنماذج YOLO إلى أي مدى وصل هذا المجال وإلى أي مدى يمكن أن نتوقع المزيد في المستقبل.
لمعرفة المزيد حول الذكاء الاصطناعي، تفضل بزيارة مستودع GitHub الخاص بنا وتفاعل مع مجتمعنا. اكتشف التطورات في مختلف الصناعات، من الرؤية الاصطناعية في التصنيع إلى الرؤية الحاسوبية في الرعاية الصحية. تحقق من خيارات الترخيص الخاصة بنا لبدء مشاريع الرؤية الاصطناعية الخاصة بك اليوم.