Yolo فيجن شنتشن
شنتشن
انضم الآن
مسرد المصطلحات

الكاشفات المستندة إلى المرساة

اكتشف كيف أحدثت الكاشفات المستندة إلى المرساة ثورة في اكتشاف الكائنات من خلال تحديد المواقع بدقة، والقدرة على التكيف مع الحجم، والتطبيقات الواقعية.

الكاشفات القائمة على المرساة هي فئة أساسية من النماذج المستخدمة في الرؤية الحاسوبية (CV) لحل مشكلة اكتشاف الأجسام. تعتمد هذه الأنظمة على مجموعة محددة مسبقًا من المربعات المحددة، المعروفة باسم مربعات الارتكاز، والتي تعمل كقوالب مرجعية مبلطة عبر الصورة. وبدلاً من محاولة التنبؤ بموقع الجسم من الصفر، تقوم الشبكة بحساب مقدار إزاحة هذه المربعات الثابتة وتغيير حجمها لتلائم الأجسام الموجودة في المشهد بإحكام. يحوّل هذا النهج بشكل أساسي مهمة تحديد الموقع المعقدة إلى مشكلة انحدار منظم، مما يوفر نقطة انطلاق ثابتة لنماذج لنماذج التعلّم العميق (DL) لتعلم التسلسلات التسلسلات الهرمية المكانية.

آليات الكشف القائم على المرساة

يتضمن سير العمل في الكاشف القائم على المرساة توليد شبكة كثيفة من نقاط الارتكاز فوق صورة الإدخال، كل منها بمقاييس ونسب عرض إلى ارتفاع مختلفة لالتقاط الأجسام المختلفة الأحجام والأشكال. بمقاييس ونسب أبعاد مختلفة لالتقاط الأجسام ذات الأحجام والأشكال المختلفة. أثناء مرور الصورة عبر العمود الفقري للنموذج، يتم استخراج خرائط السمات وتحليلها. لكل موقع مرساة، يقوم يقوم رأس الكشف بإجراء تنبؤين متزامنين تنبؤات متزامنة:

  1. التصنيف: يقوم النموذج بتعيين درجة احتمالية تشير إلى ما إذا كانت المرساة تحتوي على على فئة معينة من الكائنات أو أنها ببساطة ضوضاء في الخلفية.
  2. انحدار الصندوق المحيط: يتنبأ النموذج بقيم الإزاحة (إحداثيات المركز والعرض والارتفاع) والارتفاع) لتعديل أبعاد المرساة بحيث تتطابق مع الحقيقة الأرضية الصندوق المحيط.

أثناء تدريب النموذج، تستخدم الخوارزميات مقياسًا يسمى التقاطع على الاتحاد (IoU) ل لتحديد نقاط الارتساء التي تتداخل بشكل كافٍ مع الأجسام المعروفة. يتم التعامل فقط مع نقاط الارتكاز ذات أعلى IoU على أنها عينات إيجابية. نظرًا لأن هذه العملية تولّد آلاف المربعات المرشّحة، تُعرف خطوة ما بعد المعالجة باسم بالقمع غير الأقصى (NMS) لإزالة التداخلات الزائدة عن الحاجة والاحتفاظ فقط بالكشف الأكثر دقة.

البنى القائمة على المرساة مقابل البنى الخالية من المرساة

ومن المهم التمييز بين هذه النماذج والجيل الحديث من الحديثة من أجهزة الكشف الخالية من المرساة. في حين أن الأنظمة مثل نظامي Faster R-CNN الأصلي و Ultralytics YOLOv5 تعتمد على الضبط اليدوي لأبعاد الأبعاد، في حين تتنبأ النماذج الخالية من المرساة بمراكز الكائنات أو النقاط الرئيسية مباشرةً.

  • قائم على المرساة: يتطلّب تحديد معاملات فائقة لأحجام ونسب الارتكاز، والتي يمكن أن تكون حساسة لمجموعات بيانات محددة. وهي قوية تاريخيًا بالنسبة للأشياء القياسية.
  • خالية من المرساة: يلغي الحاجة إلى مربعات محددة مسبقًا، مما يبسِّط البنية ويقلل من النفقات الحسابية. أحدث ما توصلت إليه Ultralytics YOLO11 يستخدم نهجًا خاليًا من المراسي تحقيق سرعة ومرونة فائقة، خاصةً للأجسام ذات الأشكال الهندسية غير المنتظمة. يمكنك قراءة المزيد عن عن فوائد التصميم الخالي من المراسي في YOLO11 على مدونتنا.

تطبيقات واقعية

على الرغم من ظهور طرق أحدث، لا تزال أجهزة الكشف القائمة على المرساة سائدة في العديد من خطوط الأنابيب القائمة حيث تكون أشكال الأجسام تكون أشكال الأجسام متسقة ويمكن التنبؤ بها.

  • القيادة الذاتية: في تطوير المركبات ذاتية القيادة، يجب أن تقوم الأنظمة بشكل موثوق به detect السيارات والشاحنات وإشارات المرور detect موثوق. نظراً لأن المركبات تحافظ عموماً على نسب أبعاد ثابتة، فإن النماذج القائمة على المرساة نماذج فعالة لمجموعات الإدراك التي يستخدمها رواد الصناعة مثل Waymo وMobileye.
  • إدارة مخزون التجزئة: بالنسبة لـ الذكاء الاصطناعي في البيع بالتجزئة، تراقب الكاميرات الأرفف track مستويات المخزون. المنتجات مثل علب الحبوب أو علب المشروبات لها أشكال موحدة تتماشى تمامًا مع مضبوطة، مما يسمح بالعدّ عالي الدقة و وتتبع الأشياء.

التنفيذ باستخدام Ultralytics

يمكنك بسهولة تجربة اكتشاف الأجسام بسهولة باستخدام ultralytics الحزمة. في حين أن أحدث النماذج خالية من الارتكاز، فإن الإطار يدعم مجموعة متنوعة من البنى. يوضح المثال التالي كيفية تشغيل الاستدلال على صورة باستخدام نموذج مدرب مسبقًا:

from ultralytics import YOLO

# Load a pre-trained object detection model
# Note: YOLOv5 is a classic example of an anchor-based architecture
model = YOLO("yolov5su.pt")

# Perform inference on a local image
results = model("path/to/image.jpg")

# Display the resulting bounding boxes and class labels
results[0].show()

يوفر فهم ميكانيكا أجهزة الكشف القائمة على المرساة أساسًا متينًا لفهم تطور الرؤية الحاسوبية وخيارات التصميم وراء الخوارزميات المتقدمة مثل YOLO11 والتكرارات المستقبلية مثل YOLO26.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن