استعدوا لـ YOLO Vision 2025!
25 سبتمبر، 2025
10:00 — 18:00 بتوقيت بريطانيا الصيفي
حدث هجين
مؤتمر Yolo Vision 2024
مسرد المصطلحات

صناديق التثبيت

تعرّف على كيفية تمكين صناديق الارتكاز من اكتشاف الكائنات القائمة على الارتكاز، ومقدمات التصنيف، والانحدار، ونظام إدارة المحتوى، مع تطبيقات في القيادة الذاتية والبيع بالتجزئة.

تُعد مربعات الارتكاز مكونًا أساسيًا في العديد من نماذج اكتشاف الأجسام القائمة على الارتكاز، حيث تعمل كمجموعة محددة مسبقًا من المربعات المرجعية بارتفاعات وعرض محددين. تعمل هذه المربعات كتخمينات مسبقة أو تخمينات مستنيرة حول الموقع المحتمل للأجسام في الصورة وحجمها. وبدلاً من البحث عن الأجسام بشكل أعمى، تستخدم النماذج هذه المربعات كنقاط بداية، وتتنبأ بالإزاحات لتحسين موقعها وحجمها لتتناسب مع الأجسام الفعلية. يحول هذا النهج المهمة المعقدة لتوطين الأجسام إلى مشكلة انحدار أكثر قابلية للإدارة، حيث يتعلم النموذج ضبط هذه القوالب بدلاً من إنشاء مربعات من الصفر.

كيفية عمل صناديق التثبيت

تتضمن الآلية الأساسية تبليط الصورة بشبكة كثيفة من مربعات التثبيت في مواضع مختلفة. في كل موضع، يتم استخدام عدة نقاط ارتكاز بمقاييس ونسب أبعاد مختلفة لضمان إمكانية اكتشاف الأجسام ذات الأشكال والأحجام المتنوعة بفعالية. أثناء عملية تدريب النموذج، يستخرج العمود الفقري للكاشف أولاً خريطة ميزات من صورة الإدخال. ثم يستخدم رأس الكشف بعد ذلك هذه الميزات لأداء مهمتين لكل مربع تثبيت:

  • التصنيف: يتنبأ باحتمالية احتواء مربع الارتكاز على كائن ذي أهمية، مع تعيين تصنيف للفئة ودرجة ثقة.
  • الانحدار: يقوم بحساب التعديلات الدقيقة (أو الإزاحات) اللازمة لتحويل مربع الارتكاز إلى مربع محدد نهائي يحيط بالكائن بإحكام.

ويستخدم النموذج مقاييس مثل التقاطع على الاتحاد (IoU) لتحديد مربعات الارتكاز التي تتطابق بشكل أفضل مع الكائنات الحقيقية الأرضية أثناء التدريب. بعد التنبؤ، يتم تطبيق خطوة ما بعد المعالجة تُسمى "القمع غير الأقصى" (NMS) لإزالة المربعات الزائدة والمتداخلة لنفس الكائن.

صناديق التثبيت مقابل المفاهيم الأخرى

من المهم التمييز بين مربعات الارتكاز والمصطلحات ذات الصلة في الرؤية الحاسوبية:

  • الصندوق المحيط: مربع الارتكاز هو قالب محدد مسبقًا يُستخدم أثناء عملية الكشف، في حين أن المربع المحيط هو الناتج النهائي المحسّن الذي يحدد بدقة موقع الجسم المكتشف.
  • الكاشفات الخالية من المرساة: في حين أن النماذج القائمة على المرساة مثل YOLOv5 وعائلة Faster R-CNN تعتمد على هذه الإعدادات المسبقة، فقد تحولت البنى الحديثة بشكل متزايد نحو أجهزة الكشف الخالية من المرساة. تتنبأ النماذج مثل Ultralytics YOLO11 بمواقع الكائنات مباشرةً عن طريق تحديد النقاط الرئيسية أو المراكز، مما يبسّط تصميم النموذج ويمكن أن يحسّن الأداء على الكائنات ذات الأشكال غير التقليدية. يمكنك قراءة المزيد حول مزايا التصميم الخالي من نقاط الارتكاز في YOLO11.

تطبيقات واقعية

إن النهج المنظم لصناديق التثبيت يجعلها فعالة في السيناريوهات التي يكون فيها للأجسام أشكال وأحجام يمكن التنبؤ بها.

  1. القيادة الذاتية: في الحلول الخاصة بصناعة السيارات، تتفوق أجهزة الكشف القائمة على المراسي في تحديد السيارات والمشاة وإشارات المرور. تتوافق نسب الأبعاد المتناسقة نسبياً لهذه الأجسام بشكل جيد مع نقاط الارتكاز المحددة مسبقاً، مما يتيح الكشف الموثوق للأنظمة التي طورتها شركات مثل NVIDIA و Tesla.
  2. تحليلات البيع بالتجزئة: لإدارة المخزون بالاعتماد على الذكاء الاصطناعي، يمكن لهذه النماذج مسح الأرفف بكفاءة لحساب المنتجات. إن الحجم والشكل الموحد للسلع المعبأة يجعلها مرشحة مثالية للنهج القائم على المرساة، مما يساعد على أتمتة مراقبة المخزون وتقليل الجهد اليدوي.

عادةً ما يتم تطوير هذه النماذج باستخدام أطر عمل قوية للتعلم العميق مثل PyTorch و TensorFlow. للتعلم المستمر، تقدم منصات مثل DeepLearning.AI دورات شاملة حول أساسيات الرؤية الحاسوبية.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن
تم نسخ الرابط إلى الحافظة