اكتشف كيف أحدثت الكاشفات المستندة إلى المرساة ثورة في اكتشاف الكائنات من خلال تحديد المواقع بدقة، والقدرة على التكيف مع الحجم، والتطبيقات الواقعية.
تُعد الكاشفات المستندة إلى المرساة (Anchor-based detectors) فئة أساسية من نماذج اكتشاف الكائنات في مجال الرؤية الحاسوبية. تعمل هذه النماذج باستخدام مجموعة محددة مسبقًا من المربعات، تُعرف باسم مربعات المرساة (anchor boxes)، لتحديد وتوطين الكائنات داخل الصورة. مربعات المرساة هي في الأساس شبكة من القوالب بأحجام ونسب عرض إلى ارتفاع مختلفة يتم تبليطها عبر الصورة. يتوقع النموذج كيفية إزاحة هذه المراسي وتوسيع نطاقها لتتناسب مع المربعات المحيطة للكائنات الحقيقية، بالإضافة إلى درجة ثقة تشير إلى وجود كائن. يبسط هذا النهج مشكلة العثور على الكائنات عن طريق تحويلها إلى مهمة انحدار وتصنيف بالنسبة إلى هذه المراسي الثابتة.
تتضمن الأمثلة البارزة للبنى القائمة على المرساة عائلة R-CNN، مثل Faster R-CNN، وأجهزة الكشف المبكرة ذات المرحلة الواحدة مثل SSD (Single Shot MultiBox Detector) والعديد من نماذج YOLO، بما في ذلك Ultralytics YOLOv5 الناجحة للغاية.
الفكرة الأساسية وراء الكشف المستند إلى المرساة هي استخدام مجموعة من مربعات الإسناد المحددة مسبقًا كنقطة انطلاق. خلال عملية تدريب النموذج، يتعلم الكاشف أداء مهمتين رئيسيتين لكل مربع مرساة:
يتم إجراء هذه التنبؤات بواسطة رأس الكشف الخاص بالنموذج بعد معالجة ميزات الصورة التي تم استخلاصها بواسطة العمود الفقري (backbone). نظرًا لأنه قد يتم الكشف عن كائن واحد بواسطة مربعات ارتساء متعددة، يتم استخدام خطوة معالجة لاحقة تسمى تثبيط غير الأقصى (Non-Maximum Suppression (NMS)) لتصفية الاكتشافات الزائدة والإبقاء على أفضل مربع ملائم فقط. غالبًا ما يتم تقييم أداء هذه النماذج باستخدام مقاييس مثل متوسط الدقة المتوسطة (mean Average Precision (mAP)) و التقاطع على الاتحاد (Intersection over Union (IoU)).
في السنوات الأخيرة، ظهرت أجهزة الكشف الخالية من المرساة كبديل شائع. على عكس النماذج القائمة على المرساة، تتوقع الأساليب الخالية من المرساة مواقع الكائنات وأحجامها مباشرةً، غالبًا عن طريق تحديد النقاط الرئيسية (مثل مراكز الكائنات أو الزوايا) أو توقع المسافات من نقطة إلى حدود الكائن، مما يلغي الحاجة إلى أشكال مرساة محددة مسبقًا.
تشمل الاختلافات الرئيسية ما يلي:
في حين أن الكاشفات المستندة إلى المرتكزات مثل YOLOv4 كانت ناجحة للغاية، فقد اعتمدت العديد من البنيات الحديثة، بما في ذلك Ultralytics YOLO11، تصميمات غير مستندة إلى المرتكزات للاستفادة من مزاياها في البساطة والكفاءة. يمكنك استكشاف مزايا الكشف غير المستند إلى المرتكزات في YOLO11 والاطلاع على مقارنات بين نماذج YOLO المختلفة.
تُستخدم الكاشفات المستندة إلى المرساة على نطاق واسع في مختلف التطبيقات حيث يكون للكائنات أشكال وأحجام قياسية نسبيًا.
يتضمن تطوير ونشر نماذج الكشف عن الكائنات، سواء كانت مستندة إلى المرتكزات أو غير مستندة إلى المرتكزات، استخدام أطر عمل مثل PyTorch أو TensorFlow ومكتبات مثل OpenCV. توفر منصات مثل Ultralytics HUB مهام سير عمل مبسطة لتدريب النماذج المخصصة وإدارة مجموعات البيانات ونشر الحلول، ودعم بنيات النماذج المختلفة. لمزيد من التعلم، تسرد موارد مثل Papers With Code أحدث النماذج، وتغطي الدورات التدريبية من منصات مثل DeepLearning.AI المفاهيم الأساسية.