Anchor-Based Detectors
استكشف كيف تستخدم الكاشفات القائمة على الارتكاز مربعات محيطة محددة مسبقًا لاكتشاف الكائنات. تعلم آلياتها الأساسية، وحالات الاستخدام الواقعية، وكيف تقارن بـ Ultralytics YOLO26 الحديث والأسرع.
تعد الكاشفات المعتمدة على المراسي فئة أساسية من نماذج اكتشاف الكائنات في رؤية الحاسوب التي تستخدم مجموعة من صناديق الإحاطة المحددة مسبقاً لتحديد وتصنيف الكائنات. بدلاً من محاولة التنبؤ بإحداثيات كائن من نقطة الصفر، تبدأ هذه الأنظمة بقوالب مرجعية ثابتة تُعرف باسم صناديق المراسي. يتم بعد ذلك تدريب الشبكة العصبية لتحديد أي من هذه القوالب يطابق بشكل أفضل كائناً في الصورة وحساب الإزاحات المحددة - أي التعديلات في الموضع والحجم - اللازمة لمحاذاة المرساة تماماً مع الهدف. يحول هذا النهج مشكلة التنبؤ بالإحداثيات الاعتباطية الصعبة إلى مهمة انحدار أكثر استقراراً، وهو ما يمثل اختراقاً رئيسياً في تطوير بنى التعلم العميق (DL) المبكرة مثل Faster R-CNN وSSD.
Link to this sectionكيفية عمل الآليات المعتمدة على المراسي#
تتمحور العملية الأساسية للكاشف المعتمد على المراسي حول تقسيم صورة الإدخال إلى شبكة كثيفة. في كل خلية من هذه الشبكة، يقوم النموذج بتوليد صناديق مراسي متعددة ذات مقاييس ونسب عرض إلى ارتفاع مختلفة لمراعاة أشكال الكائنات المختلفة، مثل المشاة طويلي القامة أو المركبات العريضة. بينما تمر بيانات الصورة عبر العمود الفقري للنموذج، تستخرج الشبكة ميزات غنية لتنفيذ مهمتين متزامنتين:
-
التصنيف: يخصص النموذج درجة احتمالية لكل مرساة، متنبئاً بما إذا كانت تحتوي على فئة معينة من الكائنات (على سبيل المثال، "سيارة"، "كلب") أو مجرد ضوضاء في الخلفية.
-
انحدار الصندوق (Box Regression): بالنسبة للمراسي التي يتم تحديدها ككائنات محتوية، تتنبأ الشبكة بعوامل تصحيح لتحسين إحداثيات مركز المرساة
x, yوالعرض والارتفاع، مما يؤدي إلى صندوق إحاطة دقيق.
أثناء تدريب النموذج، تستخدم هذه الكاشفات مقياساً يسمى التقاطع فوق الاتحاد (IoU) لمطابقة المراسي المحددة مسبقاً مع تسميات الحقيقة الأرضية المقدمة في مجموعة البيانات. تُعامل المراسي ذات التداخل العالي كعينات إيجابية. نظراً لأن هذه العملية تولد آلاف الاكتشافات المحتملة، يتم تطبيق خوارزمية تصفية تُعرف باسم قمع غير الأعظمية (NMS) أثناء الاستدلال للتخلص من الصناديق الزائدة والاحتفاظ فقط بالتنبؤ الأكثر دقة لكل كائن.
Link to this sectionالمقارنة مع الكاشفات الخالية من المراسي#
بينما أرست الطرق المعتمدة على المراسي المعيار لسنوات، تطور المجال نحو كاشفات خالية من المراسي. يعد فهم هذا التمييز أمراً حيوياً للممارسين المعاصرين.
- المعتمدة على المراسي: تعتمد نماذج مثل YOLOv5 و RetinaNet الأصلية على التكوين اليدوي أو خوارزميات التجميع مثل تجميع k-means لتحديد أفضل أحجام للمراسي لمجموعة بيانات معينة. يوفر هذا الاستقرار ولكنه قد يكون جامداً إذا كانت الكائنات تختلف بشكل كبير في الشكل.
- خالية من المراسي: غالباً ما تقوم البنى الحديثة، بما في ذلك YOLO26، بإزالة مرحلة المرساة تماماً. فهي تتنبأ بمراكز الكائنات وأحجامها مباشرة من بكسلات خريطة الميزات، مما يقلل من العبء الحسابي ويبسط البحث عن المعلمات الفائقة. هذا النهج "الشامل" (end-to-end) أسرع عموماً وأسهل في التدريب على بيانات متنوعة.
Link to this sectionتطبيقات العالم الحقيقي#
لا تزال المنطق المعتمد على المراسي ذا صلة في العديد من أنظمة الإنتاج القديمة والمتخصصة حيث تكون أشكال الكائنات قابلة للتنبؤ ومتسقة.
- مراقبة حركة المرور: في أنظمة النقل الذكية، تكتشف الكاميرات المركبات لإدارة التدفق أو تحديد المخالفات. نظراً لأن السيارات والشاحنات لها أبعاد قياسية، يمكن ضبط النماذج المعتمدة على المراسي باستخدام أولويات محددة لزيادة الدقة والاسترجاع.
- أتمتة البيع بالتجزئة: تستخدم أنظمة الدفع الآلي رؤية الحاسوب لتحديد المنتجات. نظراً لأن السلع المعبأة مثل صناديق الحبوب تحافظ على نسبة عرض إلى ارتفاع ثابتة، توفر المراسي أولوية قوية للشبكة، مما يساعدها على التمييز بين العناصر المتشابهة في مشهد مزدحم.
Link to this sectionمثال على التنفيذ#
بينما تستخدم أحدث نماذج YOLO26 رؤوساً خالية من المراسي لتحقيق أداء فائق، تظل واجهة تشغيل الاكتشاف متسقة. تعمل منصة Ultralytics وواجهة برمجة تطبيقات Python على تجريد تعقيد ما إذا كان النموذج يستخدم مراسي أو نقاط مركزية، مما يسمح للمستخدمين بالتركيز على النتائج.
إليك كيفية تحميل نموذج وتشغيل الاستدلال لاكتشاف الكائنات، وهو سير عمل ينطبق بغض النظر عن بنية المرساة الأساسية:
from ultralytics import YOLO
# Load the YOLO26 model (optimized for speed and accuracy)
model = YOLO("yolo26n.pt")
# Run inference on an image source
# The model handles internal logic (anchor-based or anchor-free) automatically
results = model.predict("https://ultralytics.com/images/bus.jpg")
# Display the first result with bounding boxes
results[0].show()Link to this sectionقراءة إضافية#
لتعميق فهمك لآليات الاكتشاف، استكشف الأبحاث الأساسية حول Faster R-CNN التي قدمت شبكة مقترحات المناطق (RPN)، أو اقرأ عن كاشف الصندوق المتعدد بطلقة واحدة (SSD)، الذي قام بتحسين الاكتشاف المعتمد على المراسي من حيث السرعة. وللحصول على نظرة أوسع للمجال، تعد مجموعة بيانات COCO المعيار القياسي لتقييم كل من النماذج المعتمدة على المراسي والخالية منها. بالإضافة إلى ذلك، غالباً ما تغطي الدورات المتقدمة على Coursera التفاصيل الرياضية لانحدار الصندوق ومطابقة المراسي.






