فهم كيف يدعم Ultralytics YOLO11 الكشف عن الأجسام بدون نقاط ارتكاز (anchor-free object detection) والفوائد التي يجلبها تصميم هذا النموذج لمختلف التطبيقات.
%2525202.webp)
فهم كيف يدعم Ultralytics YOLO11 الكشف عن الأجسام بدون نقاط ارتكاز (anchor-free object detection) والفوائد التي يجلبها تصميم هذا النموذج لمختلف التطبيقات.
إذا ألقينا نظرة على تاريخ نماذج رؤية الذكاء الاصطناعي (Vision AI)، فإن مفهوم اكتشاف الكائنات - وهي مهمة أساسية في رؤية الكمبيوتر تتضمن تحديد وتحديد مواقع الكائنات داخل صورة أو مقطع فيديو - موجود منذ الستينيات. ومع ذلك، فإن السبب الرئيسي لأهميته في الابتكارات المتطورة اليوم هو أن تقنيات اكتشاف الكائنات وهياكل النماذج قد تطورت وتحسنت بسرعة منذ ذلك الحين.
في مقال سابق، ناقشنا تطور اكتشاف الكائنات والمسار الذي أدى إلى نماذج Ultralytics YOLO. اليوم، سنركز على استكشاف معلمًا أكثر تحديدًا في هذه الرحلة: الانتقال من الكاشفات المستندة إلى المرساة إلى الكاشفات غير المستندة إلى المرساة.
تعتمد الكاشفات المستندة إلى المرساة على مربعات محددة مسبقًا، تسمى "المرساة"، للتنبؤ بمكان وجود الكائنات في الصورة. في المقابل، تتخطى الكاشفات الخالية من المرساة هذه المربعات المحددة مسبقًا وبدلاً من ذلك تتنبأ بمواقع الكائنات مباشرة.
في حين أن هذا التحول قد يبدو تغييرًا بسيطًا ومنطقيًا، إلا أنه أدى في الواقع إلى تحسينات كبيرة في دقة وكفاءة الكشف عن الكائنات. في هذه المقالة، سنفهم كيف أعادت أجهزة الكشف الخالية من المرساة تشكيل رؤية الكمبيوتر من خلال التطورات مثل Ultralytics YOLO11.
تستخدم الكاشفات القائمة على المرساة (Anchor-based detectors) مربعات محددة مسبقًا، تُعرف باسم المراسي، للمساعدة في تحديد موقع الكائنات في الصورة. فكر في هذه المراسي على أنها شبكة من المربعات بأحجام وأشكال مختلفة موضوعة فوق الصورة. ثم يقوم النموذج بضبط هذه المربعات لتناسب الكائنات التي يكتشفها. على سبيل المثال، إذا حدد النموذج سيارة، فسيقوم بتعديل مربع المرساة لمطابقة موضع السيارة وحجمها بدقة أكبر.
يرتبط كل مرساة بكائن محتمل في الصورة، وأثناء التدريب، يتعلم النموذج كيفية تعديل مربعات المرساة لتتناسب بشكل أفضل مع موقع الكائن وحجمه ونسبة العرض إلى الارتفاع. يتيح ذلك للنموذج اكتشاف الكائنات بمقاييس واتجاهات مختلفة. ومع ذلك، يمكن أن يستغرق تحديد المجموعة الصحيحة من مربعات المرساة وقتًا طويلاً، ويمكن أن تكون عملية ضبطها الدقيق عرضة للأخطاء.
في حين أن الكاشفات القائمة على المرساة، مثل YOLOv4، قد عملت بشكل جيد في العديد من التطبيقات، إلا أنها تحتوي على بعض العيوب. على سبيل المثال، لا تتماشى مربعات المرساة دائمًا بشكل جيد مع الكائنات ذات الأشكال أو الأحجام المختلفة، مما يجعل من الصعب على النموذج اكتشاف الكائنات الصغيرة أو غير المنتظمة الشكل. يمكن أن تكون عملية تحديد وضبط أحجام مربعات المرساة أيضًا مستهلكة للوقت وتتطلب الكثير من الجهد اليدوي. بصرف النظر عن ذلك، غالبًا ما تكافح النماذج القائمة على المرساة مع اكتشاف الكائنات المحجوبة أو المتداخلة، حيث قد لا تتكيف المربعات المحددة مسبقًا بشكل جيد مع هذه السيناريوهات الأكثر تعقيدًا.
بدأت الكاشفات الخالية من المرساة في اكتساب الاهتمام في عام 2018 مع نماذج مثل CornerNet و CenterNet، التي اتبعت نهجًا جديدًا في الكشف عن الكائنات عن طريق إلغاء الحاجة إلى مربعات مرساة محددة مسبقًا. على عكس النماذج التقليدية التي تعتمد على مربعات مرساة بأحجام وأشكال مختلفة للتنبؤ بمكان وجود الكائنات، تتنبأ النماذج الخالية من المرساة بمواقع الكائنات مباشرة. إنها تركز على النقاط أو الميزات الرئيسية للكائن، مثل المركز، مما يبسط عملية الكشف ويجعلها أسرع وأكثر دقة.
إليك كيف تعمل النماذج الخالية من المرساة بشكل عام:
نظرًا لأن النماذج الخالية من المرساة لا تعتمد على مربعات المرساة، فهي تتمتع بتصميم أبسط. هذا يعني أنها أكثر كفاءة من الناحية الحسابية. نظرًا لأنها لا تضطر إلى معالجة مربعات مرساة متعددة، فيمكنها اكتشاف الكائنات بسرعة أكبر - وهي ميزة مهمة في التطبيقات في الوقت الفعلي مثل القيادة الذاتية والمراقبة بالفيديو.
تعتبر النماذج الخالية من المرساة أيضًا أفضل بكثير في التعامل مع الكائنات الصغيرة أو غير المنتظمة أو المحجوبة. نظرًا لأنها تركز على اكتشاف النقاط الرئيسية بدلاً من محاولة احتواء مربعات المرساة، فهي أكثر مرونة. وهذا يمكنها من اكتشاف الكائنات بدقة في البيئات المزدحمة أو المعقدة حيث قد تفشل النماذج المستندة إلى المرساة.
صُممت نماذج YOLO في الأصل لتحقيق السرعة والكفاءة، وقد تحولت تدريجيًا من الطرق القائمة على المرساة إلى الكشف الخالي من المرساة، مما جعل نماذج مثل YOLO11 أسرع وأكثر مرونة وأكثر ملاءمة لمجموعة واسعة من التطبيقات في الوقت الفعلي.
إليك نظرة سريعة على كيفية تطور التصميم الخالي من المرساة عبر إصدارات YOLO المختلفة:
من الأمثلة الرائعة على فوائد الاكتشاف الخالي من المرساة باستخدام YOLO11 في المركبات ذاتية القيادة. في السيارات ذاتية القيادة، يعد اكتشاف المشاة والمركبات الأخرى والعقبات بسرعة ودقة أمرًا بالغ الأهمية للسلامة. تعمل طريقة YOLO11 الخالية من المرساة على تبسيط عملية الاكتشاف من خلال التنبؤ المباشر بالنقاط الرئيسية للكائنات، مثل مركز أحد المشاة أو حدود مركبة أخرى، بدلاً من الاعتماد على مربعات مرساة محددة مسبقًا.
لا يحتاج YOLO11 إلى ضبط أو ملاءمة شبكة من نقاط الارتكاز لكل كائن، الأمر الذي قد يكون مكلفًا حسابيًا وبطيئًا. بدلاً من ذلك، يركز على الميزات الرئيسية، مما يجعله أسرع وأكثر كفاءة. على سبيل المثال، عندما يخطو أحد المشاة في مسار السيارة، يمكن لـ YOLO11 تحديد موقعه بسرعة عن طريق تحديد النقاط الرئيسية، حتى لو كان الشخص مخفيًا جزئيًا أو يتحرك. تتيح القدرة على التكيف مع الأشكال والأحجام المختلفة دون مربعات الارتكاز لـ YOLO11 اكتشاف الكائنات بشكل أكثر موثوقية وبسرعات أعلى، وهو أمر حيوي لاتخاذ القرارات في الوقت الفعلي في أنظمة القيادة الذاتية.
تشمل التطبيقات الأخرى التي تبرز فيها حقًا قدرات YOLO11 الخالية من المرساة ما يلي:
في حين أن النماذج الخالية من المرساة مثل YOLO11 تقدم العديد من المزايا، إلا أنها تأتي مع بعض القيود. أحد الاعتبارات العملية الرئيسية التي يجب وضعها في الاعتبار هو أنه حتى النماذج الخالية من المرساة يمكن أن تكافح مع الانسدادات أو الكائنات المتداخلة للغاية. الأساس المنطقي وراء ذلك هو أن الرؤية الحاسوبية تهدف إلى تكرار الرؤية البشرية، ومثلما نكافح أحيانًا لتحديد الكائنات المحجوبة، يمكن أن تواجه نماذج الذكاء الاصطناعي تحديات مماثلة.
هناك عامل آخر مثير للاهتمام يتعلق بمعالجة تنبؤات النموذج. على الرغم من أن بنية النماذج الخالية من المرساة (anchor-free) أبسط من النماذج القائمة على المرساة (anchor-based)، إلا أن التحسين الإضافي يصبح ضروريًا في بعض الحالات. على سبيل المثال، قد تكون تقنيات ما بعد المعالجة مثل تثبيط الحد الأقصى غير الأقصى (NMS) مطلوبة لتنظيف التنبؤات المتداخلة أو تحسين الدقة في المشاهد المزدحمة.
كان التحول من الكشف القائم على المرساة إلى الكشف الخالي من المرساة بمثابة تقدم كبير في الكشف عن الكائنات. مع النماذج الخالية من المرساة مثل YOLO11، يتم تبسيط العملية، مما يؤدي إلى تحسينات في كل من الدقة والسرعة.
من خلال YOLO11، رأينا كيف يتفوق الكشف عن الكائنات بدون مرساة في التطبيقات في الوقت الفعلي مثل السيارات ذاتية القيادة والمراقبة بالفيديو والتصوير الطبي، حيث يكون الكشف السريع والدقيق أمرًا بالغ الأهمية. يمكّن هذا النهج YOLO11 من التكيف بسهولة أكبر مع أحجام الكائنات المتغيرة والمشاهد المعقدة، مما يوفر أداءً أفضل عبر البيئات المتنوعة.
مع استمرار تطور الرؤية الحاسوبية، سيصبح الكشف عن الكائنات أسرع وأكثر مرونة وكفاءة.
اكتشف مستودع GitHub الخاص بنا وانضم إلى مجتمعنا الجذاب للبقاء على اطلاع دائم بكل ما يتعلق بالذكاء الاصطناعي. تحقق من كيفية تأثير Vision AI على قطاعات مثل التصنيع و الزراعة.