Yolo فيجن شنتشن
شنتشن
انضم الآن

مزايا جهاز Ultralytics YOLO11 كونه كاشفًا خاليًا من المراسي

أبيرامي فينا

5 دقائق قراءة

5 ديسمبر، 2024

افهم كيف يدعم Ultralytics YOLO11 اكتشاف الأجسام الخالية من الارتكاز والفوائد التي تجلبها بنية هذا النموذج إلى مختلف التطبيقات.

إذا ألقينا نظرة على تاريخ نماذج رؤية الذكاء الاصطناعي (Vision AI)، فإن مفهوم اكتشاف الكائنات - وهي مهمة أساسية في رؤية الكمبيوتر تتضمن تحديد وتحديد مواقع الكائنات داخل صورة أو مقطع فيديو - موجود منذ الستينيات. ومع ذلك، فإن السبب الرئيسي لأهميته في الابتكارات المتطورة اليوم هو أن تقنيات اكتشاف الكائنات وهياكل النماذج قد تطورت وتحسنت بسرعة منذ ذلك الحين. 

في مقال سابق، ناقشنا في مقال سابق تطور اكتشاف الأجسام والطريق الذي أدى إلى نماذج Ultralytics YOLO . واليوم، سنركز على استكشاف معلم أكثر تحديدًا في هذه الرحلة: القفزة من أجهزة الكشف القائمة على المرساة إلى أجهزة الكشف الخالية من المرساة. 

تعتمد الكاشفات المستندة إلى المرساة على مربعات محددة مسبقًا، تسمى "المرساة"، للتنبؤ بمكان وجود الكائنات في الصورة. في المقابل، تتخطى الكاشفات الخالية من المرساة هذه المربعات المحددة مسبقًا وبدلاً من ذلك تتنبأ بمواقع الكائنات مباشرة.

على الرغم من أن هذا التحول قد يبدو تغييرًا بسيطًا ومنطقيًا، إلا أنه أدى في الواقع إلى تحسينات كبيرة في دقة اكتشاف الأجسام وكفاءتها. في هذه المقالة، سوف نفهم كيف أعادت أجهزة الكشف الخالية من الارتكاز تشكيل الرؤية الحاسوبية من خلال تطورات مثل Ultralytics YOLO11.

ما هي الكاشفات القائمة على المرساة؟

تستخدم الكاشفات القائمة على المرساة (Anchor-based detectors) مربعات محددة مسبقًا، تُعرف باسم المراسي، للمساعدة في تحديد موقع الكائنات في الصورة. فكر في هذه المراسي على أنها شبكة من المربعات بأحجام وأشكال مختلفة موضوعة فوق الصورة. ثم يقوم النموذج بضبط هذه المربعات لتناسب الكائنات التي يكتشفها. على سبيل المثال، إذا حدد النموذج سيارة، فسيقوم بتعديل مربع المرساة لمطابقة موضع السيارة وحجمها بدقة أكبر.

ترتبط كل نقطة تثبيت بجسم محتمل في الصورة، وأثناء التدريب، يتعلم النموذج كيفية تعديل مربعات التثبيت لتتناسب بشكل أفضل مع موقع الجسم وحجمه ونسبة العرض إلى الارتفاع. يسمح ذلك للنموذج detect الأجسام بمقاييس واتجاهات مختلفة. ومع ذلك، يمكن أن يستغرق اختيار المجموعة الصحيحة من مربعات التثبيت وقتاً طويلاً، ويمكن أن تكون عملية ضبطها بدقة عرضة للأخطاء.

__wf_reserved_inherit
الشكل 1. ما هو صندوق المرساة؟

على الرغم من أن أجهزة الكشف القائمة على المرساة، مثل YOLOv4، تعمل بشكل جيد في العديد من التطبيقات، إلا أن لها بعض العيوب. على سبيل المثال، لا تتماشى مربعات الارتساء دائمًا بشكل جيد مع الأجسام ذات الأشكال أو الأحجام المختلفة، مما يجعل من الصعب على النموذج detect الأجسام الصغيرة أو غير المنتظمة الشكل. يمكن أن تستغرق عملية اختيار وضبط أحجام مربعات الارتكاز أيضًا وقتًا طويلاً وتتطلب الكثير من الجهد اليدوي. بصرف النظر عن ذلك، غالبًا ما تواجه النماذج المستندة إلى المرساة صعوبة في اكتشاف الأجسام المحجوبة أو المتداخلة، حيث قد لا تتكيف المربعات المحددة مسبقًا بشكل جيد مع هذه السيناريوهات الأكثر تعقيدًا.

التحول إلى الكشف عن الكائنات الخالي من المرساة

بدأت الكاشفات الخالية من المرساة في اكتساب الاهتمام في عام 2018 مع نماذج مثل CornerNet و CenterNet، التي اتبعت نهجًا جديدًا في الكشف عن الكائنات عن طريق إلغاء الحاجة إلى مربعات مرساة محددة مسبقًا. على عكس النماذج التقليدية التي تعتمد على مربعات مرساة بأحجام وأشكال مختلفة للتنبؤ بمكان وجود الكائنات، تتنبأ النماذج الخالية من المرساة بمواقع الكائنات مباشرة. إنها تركز على النقاط أو الميزات الرئيسية للكائن، مثل المركز، مما يبسط عملية الكشف ويجعلها أسرع وأكثر دقة.

إليك كيف تعمل النماذج الخالية من المرساة بشكل عام:

  • اكتشاف النقاط الرئيسية (Keypoint detection): بدلاً من استخدام مربعات محددة مسبقًا، تحدد بعض النماذج نقاطًا مهمة على الكائن، مثل المركز أو الزوايا المحددة. تساعد هذه النقاط الرئيسية النماذج على تحديد مكان الكائن وحجمه.
  • توقعالمركز: تركز بعض النماذج على توقع مركز الكائن. بمجرد تحديد موقع المركز، يمكن للنموذج توقع حجم وموضع الكائن بأكمله من هناك.
  • انحدار الخريطة الحرارية: تستخدم العديد من النماذج الخالية من المرساة خرائط حرارية، حيث يمثل كل بكسل موقعًا محتملاً للكائن. تشير قيم الخريطة الحرارية الأقوى إلى ثقة أعلى بوجود كائن في تلك النقطة.
__wf_reserved_inherit
الشكل 2. الكشف القائم على المرساة مقابل الكشف بدون مرساة.

نظرًا لأن النماذج الخالية من المرتكزات لا تعتمد على مربعات الارتكاز، فإن تصميمها أبسط. وهذا يعني أنها أكثر كفاءة من الناحية الحسابية. ونظراً لأنها لا تحتاج إلى معالجة العديد من مربعات الارتكاز، فيمكنها detect الأجسام بسرعة أكبر - وهي ميزة مهمة في تطبيقات الوقت الحقيقي مثل القيادة الذاتية والمراقبة بالفيديو. 

كما أن النماذج الخالية من المرساة أفضل بكثير في التعامل مع الأجسام الصغيرة أو غير المنتظمة أو المسدودة. نظرًا لأنها تركز على اكتشاف النقاط الرئيسية بدلاً من محاولة ملاءمة مربعات الارتكاز، فهي أكثر مرونة. وهذا يمكّنها من detect الأجسام بدقة في البيئات المزدحمة أو المعقدة حيث قد تفشل النماذج القائمة على المرساة.

Ultralytics YOLO11: كاشف بدون مرساة

صُممت نماذج YOLO في الأصل من أجل السرعة والكفاءة، وقد تحولت نماذج YOLO11 تدريجيًا من الأساليب القائمة على الارتكاز إلى الكشف الخالي من الارتكاز، مما يجعل نماذج مثل YOLO11 أسرع وأكثر مرونة وملاءمة لمجموعة واسعة من التطبيقات في الوقت الحقيقي.

فيما يلي نظرة سريعة على كيفية تطور التصميم الخالي من المرساة عبر إصدارات YOLO المختلفة:

  • Ultralytics YOLOV5u: تم تقديم رأس Ultralytics ralytics الخالي من المرساة، مما يلغي الحاجة إلى مربعات الارتساء المحددة مسبقًا. بدلاً من ذلك، يتنبأ النموذج مباشرةً بمكان وجود الأجسام في الصورة، مما يبسط العملية ويحسن المرونة والسرعة.
  • YOLOv6: تم استخدام طريقة جديدة تسمى التدريب بمساعدة المرساة (AAT)، حيث تم استخدام المراسي فقط أثناء التدريب. وقد سمح ذلك للنموذج بالاستفادة من بنية الأساليب القائمة على المراسي أثناء التدريب، مع الاستمرار في استخدام الكشف الخالي من المراسي في وقت التشغيل لتحسين السرعة والقدرة على التكيف.
  • Ultralytics YOLOv8: تم التحول بالكامل إلى الكشف الخالي من المرساة باستخدام رأس Ultralytics المنفصل الخالي من المرساة. وقد جعل ذلك النموذج أسرع وأكثر دقة، خاصة بالنسبة للأجسام الصغيرة أو ذات الأشكال الغريبة التي لا تتناسب بشكل جيد مع صناديق الارتساء.
  • Ultralytics YOLO11: يبني على نهج YOLOv8الخالي من الارتكاز، مما يحسّن الاكتشاف بشكل أكبر من خلال التخلص من مربعات الارتكاز بالكامل. يؤدي هذا إلى اكتشاف أسرع وأكثر دقة للتطبيقات في الوقت الفعلي مثل مراقبة سلوك الحيوانات وتحليلات البيع بالتجزئة.
__wf_reserved_inherit
الشكل 3. مقارنة بين Ultralytics YOLOv8 و Ultralytics YOLO11.

التطبيقات الواقعية لـ YOLO11

من الأمثلة الرائعة على فوائد الاكتشاف الخالي من العوائق باستخدام YOLO11 في السيارات ذاتية القيادة. في السيارات ذاتية القيادة، يعد اكتشاف المشاة والمركبات الأخرى والعوائق بسرعة ودقة أمراً بالغ الأهمية للسلامة. يبسّط نهج YOLO11 الخالي من المرتكزات عملية الكشف من خلال التنبؤ مباشرةً بالنقاط الرئيسية للأجسام، مثل مركز المشاة أو حدود مركبة أخرى، بدلاً من الاعتماد على مربعات الارتكاز المحددة مسبقاً. 

__wf_reserved_inherit
الشكل 4. فوائد الاكتشاف الخالي من المرساة في YOLO11 (الصورة من قبل المؤلف).

لا يحتاج YOLO11 إلى ضبط أو ملاءمة شبكة من نقاط الارتكاز لكل كائن، وهو ما قد يكون مكلفًا وبطيئًا من الناحية الحسابية. بدلاً من ذلك، يركز على الميزات الرئيسية، مما يجعله أسرع وأكثر كفاءة. على سبيل المثال، عندما يخطو أحد المشاة في مسار السيارة، يمكن لـ YOLO11 تحديد موقعه بسرعة من خلال تحديد النقاط الرئيسية، حتى لو كان الشخص مخفيًا جزئيًا أو يتحرك. وتسمح القدرة على التكيف مع الأشكال والأحجام المختلفة بدون مربعات تثبيت لـ YOLO11 detect الأجسام بشكل أكثر موثوقية وبسرعات أعلى، وهو أمر حيوي لاتخاذ القرارات في الوقت الحقيقي في أنظمة القيادة الذاتية.

تتضمن التطبيقات الأخرى التي تبرز فيها قدرات YOLO11الخالية من المراسي ما يلي:

  • إدارة البيع بالتجزئة والمخزون: يسهّل YOLO11 مراقبة المنتجات على الأرفف، حتى عندما تكون مكدسة أو مسدودة جزئيًا. يساعد ذلك في تتبع المخزون بشكل أسرع وأكثر دقة ويقلل من الأخطاء.
  • التصوير الطبي: YOLO11 فعال أيضًا في مجال الرعاية الصحية، حيث يمكنه detect الأورام أو غيرها من التشوهات في عمليات المسح الطبي. تساعد قدرته على العمل مع الأجسام غير منتظمة الشكل على تحسين الدقة في تشخيص الحالات المعقدة.
  • مراقبة الحياة البرية: في بحوث الحياة البرية، يمكن لـ YOLO11 track الحيوانات في الغابات الكثيفة أو التضاريس الوعرة، مما يساعد الباحثين على مراقبة سلوك الحيوانات أو حماية الأنواع المهددة بالانقراض.
  • التحليلات الرياضية: يمكن استخدام YOLO11 track اللاعبين أو حركات الكرة أو غيرها من العناصر في الوقت الفعلي أثناء الأحداث الرياضية لتوفير رؤى قيمة للفرق والمدربين والمذيعين.

اعتبارات يجب مراعاتها عند العمل مع النماذج الخالية من المرساة

على الرغم من أن النماذج الخالية من المرتكزات مثل YOLO11 تقدم العديد من المزايا، إلا أنها تأتي مع بعض القيود. يتمثل أحد الاعتبارات العملية الرئيسية التي يجب مراعاتها في أنه حتى النماذج الخالية من المراسي يمكن أن تواجه صعوبة في التعامل مع حالات الانسداد أو الأجسام المتداخلة بشكل كبير. والأساس المنطقي وراء ذلك هو أن الرؤية الحاسوبية تهدف إلى محاكاة الرؤية البشرية، وكما نعاني أحياناً في تحديد الأجسام المسدودة، يمكن أن تواجه نماذج الذكاء الاصطناعي تحديات مماثلة.

هناك عامل آخر مثير للاهتمام يتعلق بمعالجة تنبؤات النموذج. على الرغم من أن هندسة النماذج الخالية من الارتكاز أبسط من النماذج القائمة على الارتكاز، إلا أن التنقيح الإضافي يصبح ضرورياً في بعض الحالات. على سبيل المثال، قد تكون هناك حاجة إلى تقنيات ما بعد المعالجة مثل الإخماد غير الأقصىNMS) لتنظيف التنبؤات المتداخلة أو تحسين الدقة في المشاهد المزدحمة.

ترسيخ مستقبل الذكاء الاصطناعي مع YOLO11

كان التحول من الاكتشاف القائم على المرساة إلى الاكتشاف الخالي من المرساة تقدمًا كبيرًا في اكتشاف الأجسام. فمع النماذج الخالية من المرتكزات مثل YOLO11 يتم تبسيط العملية، مما يؤدي إلى تحسينات في كل من الدقة والسرعة.

من خلال YOLO11 رأينا كيف يتفوق الكشف عن الأجسام الخالية من الارتكاز في تطبيقات الوقت الحقيقي مثل السيارات ذاتية القيادة والمراقبة بالفيديو والتصوير الطبي، حيث يكون الكشف السريع والدقيق أمرًا بالغ الأهمية. يُمكّن هذا النهج YOLO11 من التكيف بسهولة أكبر مع أحجام الأجسام المتنوعة والمشاهد المعقدة، مما يوفر أداءً أفضل في بيئات متنوعة.

مع استمرار تطور الرؤية الحاسوبية، سيصبح الكشف عن الكائنات أسرع وأكثر مرونة وكفاءة.

اكتشف مستودع GitHub الخاص بنا وانضم إلى مجتمعنا الجذاب للبقاء على اطلاع دائم بكل ما يتعلق بالذكاء الاصطناعي. تحقق من كيفية تأثير Vision AI على قطاعات مثل التصنيع و الزراعة.

لنبنِ مستقبل
الذكاء الاصطناعي معًا!

ابدأ رحلتك مع مستقبل تعلم الآلة

ابدأ مجانًا