استعدوا لـ YOLO Vision 2025!
25 سبتمبر، 2025
10:00 — 18:00 بتوقيت بريطانيا الصيفي
حدث هجين
مؤتمر Yolo Vision 2024

فوائد كون Ultralytics YOLO11 كاشفًا خاليًا من المرساة

أبيرامي فينا

5 دقائق قراءة

5 ديسمبر، 2024

فهم كيف يدعم Ultralytics YOLO11 الكشف عن الأجسام بدون نقاط ارتكاز (anchor-free object detection) والفوائد التي يجلبها تصميم هذا النموذج لمختلف التطبيقات.

إذا ألقينا نظرة على تاريخ نماذج رؤية الذكاء الاصطناعي (Vision AI)، فإن مفهوم اكتشاف الكائنات - وهي مهمة أساسية في رؤية الكمبيوتر تتضمن تحديد وتحديد مواقع الكائنات داخل صورة أو مقطع فيديو - موجود منذ الستينيات. ومع ذلك، فإن السبب الرئيسي لأهميته في الابتكارات المتطورة اليوم هو أن تقنيات اكتشاف الكائنات وهياكل النماذج قد تطورت وتحسنت بسرعة منذ ذلك الحين. 

في مقال سابق، ناقشنا تطور اكتشاف الكائنات والمسار الذي أدى إلى نماذج Ultralytics YOLO. اليوم، سنركز على استكشاف معلمًا أكثر تحديدًا في هذه الرحلة: الانتقال من الكاشفات المستندة إلى المرساة إلى الكاشفات غير المستندة إلى المرساة. 

تعتمد الكاشفات المستندة إلى المرساة على مربعات محددة مسبقًا، تسمى "المرساة"، للتنبؤ بمكان وجود الكائنات في الصورة. في المقابل، تتخطى الكاشفات الخالية من المرساة هذه المربعات المحددة مسبقًا وبدلاً من ذلك تتنبأ بمواقع الكائنات مباشرة.

في حين أن هذا التحول قد يبدو تغييرًا بسيطًا ومنطقيًا، إلا أنه أدى في الواقع إلى تحسينات كبيرة في دقة وكفاءة الكشف عن الكائنات. في هذه المقالة، سنفهم كيف أعادت أجهزة الكشف الخالية من المرساة تشكيل رؤية الكمبيوتر من خلال التطورات مثل Ultralytics YOLO11.

ما هي الكاشفات القائمة على المرساة؟

تستخدم الكاشفات القائمة على المرساة (Anchor-based detectors) مربعات محددة مسبقًا، تُعرف باسم المراسي، للمساعدة في تحديد موقع الكائنات في الصورة. فكر في هذه المراسي على أنها شبكة من المربعات بأحجام وأشكال مختلفة موضوعة فوق الصورة. ثم يقوم النموذج بضبط هذه المربعات لتناسب الكائنات التي يكتشفها. على سبيل المثال، إذا حدد النموذج سيارة، فسيقوم بتعديل مربع المرساة لمطابقة موضع السيارة وحجمها بدقة أكبر.

يرتبط كل مرساة بكائن محتمل في الصورة، وأثناء التدريب، يتعلم النموذج كيفية تعديل مربعات المرساة لتتناسب بشكل أفضل مع موقع الكائن وحجمه ونسبة العرض إلى الارتفاع. يتيح ذلك للنموذج اكتشاف الكائنات بمقاييس واتجاهات مختلفة. ومع ذلك، يمكن أن يستغرق تحديد المجموعة الصحيحة من مربعات المرساة وقتًا طويلاً، ويمكن أن تكون عملية ضبطها الدقيق عرضة للأخطاء.

__wf_reserved_inherit
الشكل 1. ما هو صندوق المرساة؟

في حين أن الكاشفات القائمة على المرساة، مثل YOLOv4، قد عملت بشكل جيد في العديد من التطبيقات، إلا أنها تحتوي على بعض العيوب. على سبيل المثال، لا تتماشى مربعات المرساة دائمًا بشكل جيد مع الكائنات ذات الأشكال أو الأحجام المختلفة، مما يجعل من الصعب على النموذج اكتشاف الكائنات الصغيرة أو غير المنتظمة الشكل. يمكن أن تكون عملية تحديد وضبط أحجام مربعات المرساة أيضًا مستهلكة للوقت وتتطلب الكثير من الجهد اليدوي. بصرف النظر عن ذلك، غالبًا ما تكافح النماذج القائمة على المرساة مع اكتشاف الكائنات المحجوبة أو المتداخلة، حيث قد لا تتكيف المربعات المحددة مسبقًا بشكل جيد مع هذه السيناريوهات الأكثر تعقيدًا.

التحول إلى الكشف عن الكائنات الخالي من المرساة

بدأت الكاشفات الخالية من المرساة في اكتساب الاهتمام في عام 2018 مع نماذج مثل CornerNet و CenterNet، التي اتبعت نهجًا جديدًا في الكشف عن الكائنات عن طريق إلغاء الحاجة إلى مربعات مرساة محددة مسبقًا. على عكس النماذج التقليدية التي تعتمد على مربعات مرساة بأحجام وأشكال مختلفة للتنبؤ بمكان وجود الكائنات، تتنبأ النماذج الخالية من المرساة بمواقع الكائنات مباشرة. إنها تركز على النقاط أو الميزات الرئيسية للكائن، مثل المركز، مما يبسط عملية الكشف ويجعلها أسرع وأكثر دقة.

إليك كيف تعمل النماذج الخالية من المرساة بشكل عام:

  • اكتشاف النقاط الرئيسية (Keypoint detection): بدلاً من استخدام مربعات محددة مسبقًا، تحدد بعض النماذج نقاطًا مهمة على الكائن، مثل المركز أو الزوايا المحددة. تساعد هذه النقاط الرئيسية النماذج على تحديد مكان الكائن وحجمه.
  • توقعالمركز: تركز بعض النماذج على توقع مركز الكائن. بمجرد تحديد موقع المركز، يمكن للنموذج توقع حجم وموضع الكائن بأكمله من هناك.
  • انحدار الخريطة الحرارية: تستخدم العديد من النماذج الخالية من المرساة خرائط حرارية، حيث يمثل كل بكسل موقعًا محتملاً للكائن. تشير قيم الخريطة الحرارية الأقوى إلى ثقة أعلى بوجود كائن في تلك النقطة.
__wf_reserved_inherit
الشكل 2. الكشف القائم على المرساة مقابل الكشف بدون مرساة.

نظرًا لأن النماذج الخالية من المرساة لا تعتمد على مربعات المرساة، فهي تتمتع بتصميم أبسط. هذا يعني أنها أكثر كفاءة من الناحية الحسابية. نظرًا لأنها لا تضطر إلى معالجة مربعات مرساة متعددة، فيمكنها اكتشاف الكائنات بسرعة أكبر - وهي ميزة مهمة في التطبيقات في الوقت الفعلي مثل القيادة الذاتية والمراقبة بالفيديو. 

تعتبر النماذج الخالية من المرساة أيضًا أفضل بكثير في التعامل مع الكائنات الصغيرة أو غير المنتظمة أو المحجوبة. نظرًا لأنها تركز على اكتشاف النقاط الرئيسية بدلاً من محاولة احتواء مربعات المرساة، فهي أكثر مرونة. وهذا يمكنها من اكتشاف الكائنات بدقة في البيئات المزدحمة أو المعقدة حيث قد تفشل النماذج المستندة إلى المرساة.

Ultralytics YOLO11: كاشف بدون نقاط ارتكاز

صُممت نماذج YOLO في الأصل لتحقيق السرعة والكفاءة، وقد تحولت تدريجيًا من الطرق القائمة على المرساة إلى الكشف الخالي من المرساة، مما جعل نماذج مثل YOLO11 أسرع وأكثر مرونة وأكثر ملاءمة لمجموعة واسعة من التطبيقات في الوقت الفعلي.

إليك نظرة سريعة على كيفية تطور التصميم الخالي من المرساة عبر إصدارات YOLO المختلفة:

  • Ultralytics YOLOv5u: قدمت رأس Ultralytics المقسم الخالي من المرساة (Anchor-Free Split Ultralytics Head)، مما أزال الحاجة إلى مربعات مرساة محددة مسبقًا. بدلاً من ذلك، يتنبأ النموذج مباشرةً بمكان وجود الكائنات في الصورة، مما يبسط العملية ويحسن المرونة والسرعة.
  • YOLOv6: تم استخدام طريقة جديدة تسمى التدريب بمساعدة المرساة (Anchor-Aided Training (AAT))، حيث تم استخدام المراسي فقط أثناء التدريب. سمح هذا للنموذج بالاستفادة من هيكل الطرق القائمة على المرساة أثناء التدريب، مع الاستمرار في استخدام الاكتشاف الخالي من المرساة في وقت التشغيل لتحسين السرعة والقدرة على التكيف.
  • Ultralytics YOLOv8: تم التحويل بالكامل إلى الاكتشاف الخالي من المرساة (anchor-free detection) باستخدام رأس Ultralytics المقسم الخالي من المرساة (Anchor-Free Split Ultralytics Head). هذا جعل النموذج أسرع وأكثر دقة، خاصة بالنسبة للكائنات الصغيرة أو ذات الشكل الغريب التي لا تتناسب جيدًا مع مربعات المرساة.
  • Ultralytics YOLO11: تعتمد على نهج YOLOv8 الخالي من المرساة (anchor-free approach)، مما يزيد من تحسين الاكتشاف عن طريق إزالة مربعات المرساة تمامًا. ينتج عن هذا اكتشاف أسرع وأكثر دقة للتطبيقات في الوقت الفعلي مثل مراقبة سلوك الحيوان وتحليلات البيع بالتجزئة.
__wf_reserved_inherit
الشكل 3. مقارنة بين Ultralytics YOLOv8 و Ultralytics YOLO11.

تطبيقات واقعية لـ YOLO11

من الأمثلة الرائعة على فوائد الاكتشاف الخالي من المرساة باستخدام YOLO11 في المركبات ذاتية القيادة. في السيارات ذاتية القيادة، يعد اكتشاف المشاة والمركبات الأخرى والعقبات بسرعة ودقة أمرًا بالغ الأهمية للسلامة. تعمل طريقة YOLO11 الخالية من المرساة على تبسيط عملية الاكتشاف من خلال التنبؤ المباشر بالنقاط الرئيسية للكائنات، مثل مركز أحد المشاة أو حدود مركبة أخرى، بدلاً من الاعتماد على مربعات مرساة محددة مسبقًا. 

__wf_reserved_inherit
الشكل 4. فوائد الكشف الخالي من المرساة في YOLO11 (صورة للمؤلف).

لا يحتاج YOLO11 إلى ضبط أو ملاءمة شبكة من نقاط الارتكاز لكل كائن، الأمر الذي قد يكون مكلفًا حسابيًا وبطيئًا. بدلاً من ذلك، يركز على الميزات الرئيسية، مما يجعله أسرع وأكثر كفاءة. على سبيل المثال، عندما يخطو أحد المشاة في مسار السيارة، يمكن لـ YOLO11 تحديد موقعه بسرعة عن طريق تحديد النقاط الرئيسية، حتى لو كان الشخص مخفيًا جزئيًا أو يتحرك. تتيح القدرة على التكيف مع الأشكال والأحجام المختلفة دون مربعات الارتكاز لـ YOLO11 اكتشاف الكائنات بشكل أكثر موثوقية وبسرعات أعلى، وهو أمر حيوي لاتخاذ القرارات في الوقت الفعلي في أنظمة القيادة الذاتية.

تشمل التطبيقات الأخرى التي تبرز فيها حقًا قدرات YOLO11 الخالية من المرساة ما يلي:

  • إدارة البيع بالتجزئة والمخزون (Retail and inventory management): يسهل YOLO11 مراقبة المنتجات على الرفوف، حتى عندما تكون مكدسة أو محجوبة جزئيًا. يساعد هذا في تتبع المخزون بشكل أسرع وأكثر دقة ويقلل الأخطاء.
  • التصوير الطبي (Medical imaging): يعتبر YOLO11 فعالاً أيضًا في مجال الرعاية الصحية، حيث يمكنه اكتشاف الأورام أو التشوهات الأخرى في الفحوصات الطبية. تساعد قدرته على العمل مع الكائنات ذات الأشكال غير المنتظمة على تحسين الدقة في تشخيص الحالات المعقدة.
  • مراقبة الحياة البرية: في أبحاث الحياة البرية، يمكن لـ YOLO11 تتبع الحيوانات في الغابات الكثيفة أو التضاريس الوعرة، مما يساعد الباحثين على مراقبة السلوك أو حماية الأنواع المهددة بالانقراض.
  • تحليلات رياضية: يمكن استخدام YOLO11 لتتبع اللاعبين أو حركات الكرة أو العناصر الأخرى في الوقت الفعلي أثناء الأحداث الرياضية لتوفير رؤى قيمة للفرق والمدربين والمذيعين.

اعتبارات يجب مراعاتها عند العمل مع النماذج الخالية من المرساة

في حين أن النماذج الخالية من المرساة مثل YOLO11 تقدم العديد من المزايا، إلا أنها تأتي مع بعض القيود. أحد الاعتبارات العملية الرئيسية التي يجب وضعها في الاعتبار هو أنه حتى النماذج الخالية من المرساة يمكن أن تكافح مع الانسدادات أو الكائنات المتداخلة للغاية. الأساس المنطقي وراء ذلك هو أن الرؤية الحاسوبية تهدف إلى تكرار الرؤية البشرية، ومثلما نكافح أحيانًا لتحديد الكائنات المحجوبة، يمكن أن تواجه نماذج الذكاء الاصطناعي تحديات مماثلة.

هناك عامل آخر مثير للاهتمام يتعلق بمعالجة تنبؤات النموذج. على الرغم من أن بنية النماذج الخالية من المرساة (anchor-free) أبسط من النماذج القائمة على المرساة (anchor-based)، إلا أن التحسين الإضافي يصبح ضروريًا في بعض الحالات. على سبيل المثال، قد تكون تقنيات ما بعد المعالجة مثل تثبيط الحد الأقصى غير الأقصى (NMS) مطلوبة لتنظيف التنبؤات المتداخلة أو تحسين الدقة في المشاهد المزدحمة.

ترسيخ مستقبل الذكاء الاصطناعي مع YOLO11

كان التحول من الكشف القائم على المرساة إلى الكشف الخالي من المرساة بمثابة تقدم كبير في الكشف عن الكائنات. مع النماذج الخالية من المرساة مثل YOLO11، يتم تبسيط العملية، مما يؤدي إلى تحسينات في كل من الدقة والسرعة.

من خلال YOLO11، رأينا كيف يتفوق الكشف عن الكائنات بدون مرساة في التطبيقات في الوقت الفعلي مثل السيارات ذاتية القيادة والمراقبة بالفيديو والتصوير الطبي، حيث يكون الكشف السريع والدقيق أمرًا بالغ الأهمية. يمكّن هذا النهج YOLO11 من التكيف بسهولة أكبر مع أحجام الكائنات المتغيرة والمشاهد المعقدة، مما يوفر أداءً أفضل عبر البيئات المتنوعة.

مع استمرار تطور الرؤية الحاسوبية، سيصبح الكشف عن الكائنات أسرع وأكثر مرونة وكفاءة.

اكتشف مستودع GitHub الخاص بنا وانضم إلى مجتمعنا الجذاب للبقاء على اطلاع دائم بكل ما يتعلق بالذكاء الاصطناعي. تحقق من كيفية تأثير Vision AI على قطاعات مثل التصنيع و الزراعة.

لنبنِ مستقبل
الذكاء الاصطناعي معًا!

ابدأ رحلتك مع مستقبل تعلم الآلة

ابدأ مجانًا
تم نسخ الرابط إلى الحافظة