اكتشف كيف أحدثت الكاشفات المستندة إلى المرساة ثورة في اكتشاف الكائنات من خلال تحديد المواقع بدقة، والقدرة على التكيف مع الحجم، والتطبيقات الواقعية.
الكاشفات القائمة على المرساة هي فئة أساسية من النماذج المستخدمة في الرؤية الحاسوبية (CV) لحل مشكلة اكتشاف الأجسام. تعتمد هذه الأنظمة على مجموعة محددة مسبقًا من المربعات المحددة، المعروفة باسم مربعات الارتكاز، والتي تعمل كقوالب مرجعية مبلطة عبر الصورة. وبدلاً من محاولة التنبؤ بموقع الجسم من الصفر، تقوم الشبكة بحساب مقدار إزاحة هذه المربعات الثابتة وتغيير حجمها لتلائم الأجسام الموجودة في المشهد بإحكام. يحوّل هذا النهج بشكل أساسي مهمة تحديد الموقع المعقدة إلى مشكلة انحدار منظم، مما يوفر نقطة انطلاق ثابتة لنماذج لنماذج التعلّم العميق (DL) لتعلم التسلسلات التسلسلات الهرمية المكانية.
يتضمن سير العمل في الكاشف القائم على المرساة توليد شبكة كثيفة من نقاط الارتكاز فوق صورة الإدخال، كل منها بمقاييس ونسب عرض إلى ارتفاع مختلفة لالتقاط الأجسام المختلفة الأحجام والأشكال. بمقاييس ونسب أبعاد مختلفة لالتقاط الأجسام ذات الأحجام والأشكال المختلفة. أثناء مرور الصورة عبر العمود الفقري للنموذج، يتم استخراج خرائط السمات وتحليلها. لكل موقع مرساة، يقوم يقوم رأس الكشف بإجراء تنبؤين متزامنين تنبؤات متزامنة:
أثناء تدريب النموذج، تستخدم الخوارزميات مقياسًا يسمى التقاطع على الاتحاد (IoU) ل لتحديد نقاط الارتساء التي تتداخل بشكل كافٍ مع الأجسام المعروفة. يتم التعامل فقط مع نقاط الارتكاز ذات أعلى IoU على أنها عينات إيجابية. نظرًا لأن هذه العملية تولّد آلاف المربعات المرشّحة، تُعرف خطوة ما بعد المعالجة باسم بالقمع غير الأقصى (NMS) لإزالة التداخلات الزائدة عن الحاجة والاحتفاظ فقط بالكشف الأكثر دقة.
ومن المهم التمييز بين هذه النماذج والجيل الحديث من الحديثة من أجهزة الكشف الخالية من المرساة. في حين أن الأنظمة مثل نظامي Faster R-CNN الأصلي و Ultralytics YOLOv5 تعتمد على الضبط اليدوي لأبعاد الأبعاد، في حين تتنبأ النماذج الخالية من المرساة بمراكز الكائنات أو النقاط الرئيسية مباشرةً.
على الرغم من ظهور طرق أحدث، لا تزال أجهزة الكشف القائمة على المرساة سائدة في العديد من خطوط الأنابيب القائمة حيث تكون أشكال الأجسام تكون أشكال الأجسام متسقة ويمكن التنبؤ بها.
يمكنك بسهولة تجربة اكتشاف الأجسام بسهولة باستخدام ultralytics الحزمة. في حين أن أحدث النماذج
خالية من الارتكاز، فإن الإطار يدعم مجموعة متنوعة من البنى. يوضح المثال التالي كيفية تشغيل
الاستدلال على صورة باستخدام نموذج مدرب مسبقًا:
from ultralytics import YOLO
# Load a pre-trained object detection model
# Note: YOLOv5 is a classic example of an anchor-based architecture
model = YOLO("yolov5su.pt")
# Perform inference on a local image
results = model("path/to/image.jpg")
# Display the resulting bounding boxes and class labels
results[0].show()
يوفر فهم ميكانيكا أجهزة الكشف القائمة على المرساة أساسًا متينًا لفهم تطور الرؤية الحاسوبية وخيارات التصميم وراء الخوارزميات المتقدمة مثل YOLO11 والتكرارات المستقبلية مثل YOLO26.