استعدوا لـ YOLO Vision 2025!
25 سبتمبر، 2025
10:00 — 18:00 بتوقيت بريطانيا الصيفي
حدث هجين
مؤتمر Yolo Vision 2024
مسرد المصطلحات

الكاشفات المستندة إلى المرساة

اكتشف كيف أحدثت الكاشفات المستندة إلى المرساة ثورة في اكتشاف الكائنات من خلال تحديد المواقع بدقة، والقدرة على التكيف مع الحجم، والتطبيقات الواقعية.

تُعد الكاشفات المستندة إلى المرساة (Anchor-based detectors) فئة أساسية من نماذج اكتشاف الكائنات في مجال الرؤية الحاسوبية. تعمل هذه النماذج باستخدام مجموعة محددة مسبقًا من المربعات، تُعرف باسم مربعات المرساة (anchor boxes)، لتحديد وتوطين الكائنات داخل الصورة. مربعات المرساة هي في الأساس شبكة من القوالب بأحجام ونسب عرض إلى ارتفاع مختلفة يتم تبليطها عبر الصورة. يتوقع النموذج كيفية إزاحة هذه المراسي وتوسيع نطاقها لتتناسب مع المربعات المحيطة للكائنات الحقيقية، بالإضافة إلى درجة ثقة تشير إلى وجود كائن. يبسط هذا النهج مشكلة العثور على الكائنات عن طريق تحويلها إلى مهمة انحدار وتصنيف بالنسبة إلى هذه المراسي الثابتة.

تتضمن الأمثلة البارزة للبنى القائمة على المرساة عائلة R-CNN، مثل Faster R-CNN، وأجهزة الكشف المبكرة ذات المرحلة الواحدة مثل SSD (Single Shot MultiBox Detector) والعديد من نماذج YOLO، بما في ذلك Ultralytics YOLOv5 الناجحة للغاية.

كيفية عمل الكاشفات المستندة إلى المرتكزات (Anchor-Based Detectors)

الفكرة الأساسية وراء الكشف المستند إلى المرساة هي استخدام مجموعة من مربعات الإسناد المحددة مسبقًا كنقطة انطلاق. خلال عملية تدريب النموذج، يتعلم الكاشف أداء مهمتين رئيسيتين لكل مربع مرساة:

  1. التصنيف: تحديد ما إذا كان مربع الارتساء يحتوي على كائن مهم أم أنه مجرد خلفية.
  2. الانحدار: احسب الإزاحات الدقيقة (x، y، العرض، الارتفاع) اللازمة لضبط مربع الارتكاز بحيث يحيط بإحكام بالكائن المكتشف.

يتم إجراء هذه التنبؤات بواسطة رأس الكشف الخاص بالنموذج بعد معالجة ميزات الصورة التي تم استخلاصها بواسطة العمود الفقري (backbone). نظرًا لأنه قد يتم الكشف عن كائن واحد بواسطة مربعات ارتساء متعددة، يتم استخدام خطوة معالجة لاحقة تسمى تثبيط غير الأقصى (Non-Maximum Suppression (NMS)) لتصفية الاكتشافات الزائدة والإبقاء على أفضل مربع ملائم فقط. غالبًا ما يتم تقييم أداء هذه النماذج باستخدام مقاييس مثل متوسط الدقة المتوسطة (mean Average Precision (mAP)) و التقاطع على الاتحاد (Intersection over Union (IoU)).

الكاشفات المستندة إلى المرتكزات مقابل الكاشفات غير المستندة إلى المرتكزات

في السنوات الأخيرة، ظهرت أجهزة الكشف الخالية من المرساة كبديل شائع. على عكس النماذج القائمة على المرساة، تتوقع الأساليب الخالية من المرساة مواقع الكائنات وأحجامها مباشرةً، غالبًا عن طريق تحديد النقاط الرئيسية (مثل مراكز الكائنات أو الزوايا) أو توقع المسافات من نقطة إلى حدود الكائن، مما يلغي الحاجة إلى أشكال مرساة محددة مسبقًا.

تشمل الاختلافات الرئيسية ما يلي:

  • التعقيد: تتطلب النماذج القائمة على المرساة تصميمًا دقيقًا وضبطًا لمعلمات المرساة (الأحجام والنسب والمقاييس)، والتي يمكن أن تعتمد على مجموعة البيانات. تعمل النماذج الخالية من المرساة على تبسيط تصميم رأس الكشف.
  • المرونة: قد تتكيف الطرق الخالية من نقاط الارتكاز بشكل أفضل مع الكائنات ذات نسب العرض إلى الارتفاع أو الأشكال غير العادية التي لا يتم تمثيلها جيدًا بواسطة مجموعة نقاط الارتكاز الثابتة.
  • الكفاءة: يمكن أن يؤدي التخلص من المراسي إلى تقليل عدد التنبؤات التي يحتاج النموذج إلى إجرائها، مما قد يؤدي إلى استدلال أسرع ومعالجة لاحقة أبسط.

في حين أن الكاشفات المستندة إلى المرتكزات مثل YOLOv4 كانت ناجحة للغاية، فقد اعتمدت العديد من البنيات الحديثة، بما في ذلك Ultralytics YOLO11، تصميمات غير مستندة إلى المرتكزات للاستفادة من مزاياها في البساطة والكفاءة. يمكنك استكشاف مزايا الكشف غير المستند إلى المرتكزات في YOLO11 والاطلاع على مقارنات بين نماذج YOLO المختلفة.

تطبيقات واقعية

تُستخدم الكاشفات المستندة إلى المرساة على نطاق واسع في مختلف التطبيقات حيث يكون للكائنات أشكال وأحجام قياسية نسبيًا.

  • القيادة الذاتية: في حلول صناعة السيارات، تعتبر هذه الكاشفات ممتازة لتحديد المركبات والمشاة وإشارات المرور. تتوافق الأشكال التي يمكن التنبؤ بها لهذه الكائنات جيدًا مع المراسي المحددة مسبقًا، مما يتيح اكتشافًا موثوقًا به لشركات مثل NVIDIA و Tesla.
  • تحليلات البيع بالتجزئة: بالنسبة إلى إدارة المخزون المدفوعة بالذكاء الاصطناعي، يمكن لنماذج الارتكاز فحص الرفوف بكفاءة لحساب المنتجات. إن الحجم والشكل الموحدين للسلع المعبأة يجعلها مرشحة مثالية لهذا النهج، مما يساعد على أتمتة مراقبة المخزون.
  • الأمن والمراقبة: يعد تحديد الأشخاص أو المركبات في لقطات كاميرات المراقبة الثابتة حالة استخدام قوية أخرى. هذا أساسي لتطبيقات مثل دليل نظام الإنذار الأمني Ultralytics.

الأدوات والتدريب

يتضمن تطوير ونشر نماذج الكشف عن الكائنات، سواء كانت مستندة إلى المرتكزات أو غير مستندة إلى المرتكزات، استخدام أطر عمل مثل PyTorch أو TensorFlow ومكتبات مثل OpenCV. توفر منصات مثل Ultralytics HUB مهام سير عمل مبسطة لتدريب النماذج المخصصة وإدارة مجموعات البيانات ونشر الحلول، ودعم بنيات النماذج المختلفة. لمزيد من التعلم، تسرد موارد مثل Papers With Code أحدث النماذج، وتغطي الدورات التدريبية من منصات مثل DeepLearning.AI المفاهيم الأساسية.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن
تم نسخ الرابط إلى الحافظة