تعرّف على كيفية تمكين صناديق الارتكاز من اكتشاف الكائنات القائمة على الارتكاز، ومقدمات التصنيف، والانحدار، NMS، مع تطبيقات في القيادة الذاتية والبيع بالتجزئة.
تعمل مربعات الارتكاز كمفهوم تأسيسي في بنية العديد من نماذج نماذج الكشف عن الأجسام، حيث تعمل كمراجع محددة مسبقًا للتنبؤ بموقع الأجسام وحجمها. بدلاً من مسح الصورة بحثًا عن أجسام ذات أبعاد عشوائية من الصفر، يستخدم النموذج هذه الأشكال الثابتة - المحددة بارتفاعات وعرض محددين - كنقاط بداية, أو كنقاط بداية. هذا النهج يبسط عملية التعلم من خلال تحويل المهمة الصعبة للتنبؤ بالإحداثيات المطلقة إلى مشكلة انحدار أكثر قابلية للإدارة حيث تتعلم الشبكة تعديل أو "إزاحة" هذه القوالب هذه القوالب لتتناسب مع الأجسام الحقيقية الأرضية. هذه التقنية كانت هذه التقنية محورية في نجاح البنى الشائعة مثل عائلة عائلة شبكة R-CNN الأسرع وأوائل أجهزة الكشف أحادية المرحلة.
تتضمن آلية مربعات التثبيت تبليط صورة الإدخال بشبكة كثيفة من المراكز. في كل خلية شبكية يتم إنشاء مربعات تثبيت متعددة بنسب أبعاد و ومقاييس مختلفة لاستيعاب الأجسام ذات الأشكال المختلفة، مثل المشاة الطوال أو المركبات العريضة. أثناء مرحلة تدريب النموذج، يطابق النظام هذه المراسي مع الأجسام الفعلية باستخدام مقياس يسمى التقاطع على الاتحاد (IoU). المراسي التي تتداخل بشكل كبير مع كائن مستهدف يتم تصنيفها كعينات إيجابية.
يستخرج العمود الفقري للكاشف الميزات من الصورة, والتي يستخدمها رأس الكشف لأداء مهمتين مهمتين متوازيتين لكل مرساة موجبة:
للتعامل مع التنبؤات المتداخلة لنفس الكائن، يتم تنفيذ خطوة ما بعد المعالجة تُعرف باسم بالقمع غير الأقصى (NMS) لتصفية من المربعات الزائدة عن الحاجة، مع الاحتفاظ فقط بالمربع الذي يتمتع بأعلى درجات الثقة. أطر مثل PyTorch و TensorFlow الأدوات الحسابية اللازمة لتنفيذ هذه العمليات المعقدة بكفاءة.
يتطلب فهم مربعات الارتساء تمييزها عن المصطلحات المماثلة ضمن الرؤية الحاسوبية (CV).
الطبيعة المهيكلة لصناديق التثبيت تجعلها فعالة بشكل خاص في البيئات التي تكون فيها أشكال الأجسام متسقة ويمكن التنبؤ بها.
في حين أن النماذج الحديثة مثل YOLO11 خالية من المراسي، فإن الإصدارات السابقة مثل YOLOv5 تستخدم صناديق المراسي. إن
ultralytics تلخّص الحزمة هذا التعقيد، مما يسمح للمستخدمين بتشغيل الاستدلال دون الحاجة إلى
تكوين المراسي يدويًا. يوضّح المثال التالي تحميل نموذج مدرّب مسبقًا detect الكائنات:
from ultralytics import YOLO
# Load a pretrained YOLOv5 model (anchor-based architecture)
model = YOLO("yolov5su.pt")
# Run inference on a static image from the web
results = model("https://ultralytics.com/images/bus.jpg")
# Display the detected bounding boxes
results[0].show()
بالنسبة للمهتمين بالأسس الرياضية لهذه الأنظمة، فإن المنصات التعليمية مثل كورسيرا و و DeepLearning.AI تقدم دورات متعمقة حول الشبكات العصبية التلافيفية واكتشاف الأجسام.