مسرد المصطلحات

أجهزة الكشف المعتمدة على المرساة

اكتشف كيف تُحدِث أجهزة الكشف القائمة على المرساة ثورة في اكتشاف الأجسام من خلال تحديد الموقع الدقيق، والقدرة على التكيف على نطاق واسع، والتطبيقات الواقعية.

الكاشفات القائمة على المرساة هي فئة أساسية من نماذج اكتشاف الأجسام في الرؤية الحاسوبية. تعمل هذه النماذج باستخدام مجموعة محددة مسبقًا من المربعات، المعروفة باسم مربعات الارتكاز، لتحديد الأجسام داخل الصورة وتعيين موقعها. مربعات الارتكاز هي في الأساس شبكة من القوالب بأحجام ونسب أبعاد مختلفة مبلطة عبر الصورة. يتنبأ النموذج بكيفية إزاحة هذه المربعات وتغيير حجمها لتتناسب مع المربعات المحددة للأجسام، بالإضافة إلى درجة ثقة تشير إلى وجود جسم ما. يعمل هذا النهج على تبسيط مشكلة العثور على الأجسام من خلال تحويلها إلى مهمة انحدار وتصنيف بالنسبة إلى هذه المرتكزات الثابتة.

تشمل الأمثلة البارزة على البنى القائمة على الارتكاز عائلة R-CNN، مثل Faster R-CNN، وأوائل أجهزة الكشف أحادية المرحلة مثل SSD (كاشف الصندوق المتعدد ذو اللقطة الواحدة) والعديد من نماذج YOLO، بما في ذلك Ultralytics YOLOv5 الناجح للغاية.

كيفية عمل أجهزة الكشف القائمة على المرساة

تتمثل الفكرة الأساسية وراء الكشف القائم على الارتكاز في استخدام مجموعة من المربعات المرجعية المحددة مسبقًا كنقطة بداية. أثناء عملية تدريب النموذج، يتعلم الكاشف أداء مهمتين رئيسيتين لكل مربع مرساة:

  1. التصنيف: تحديد ما إذا كان مربع الارتكاز يحتوي على كائن ذي أهمية أم أنه مجرد خلفية.
  2. الانحدار: احسب الإزاحات الدقيقة (س، ص، العرض، الارتفاع) اللازمة لضبط مربع الارتكاز بحيث يحيط بإحكام بالجسم المكتشف.

يتم إجراء هذه التنبؤات بواسطة رأس اكتشاف النموذج بعد معالجة ميزات الصورة المستخرجة بواسطة العمود الفقري. نظرًا لأنه قد يتم اكتشاف كائن واحد من خلال عدة مربعات ربط، يتم استخدام خطوة ما بعد المعالجة تُسمى "القمع غير الأقصى" (NMS) لتصفية الاكتشافات الزائدة عن الحاجة والاحتفاظ فقط بالمربع الأفضل ملاءمة. غالبًا ما يتم تقييم أداء هذه النماذج باستخدام مقاييس مثل متوسط متوسط الدقة (mAP) والتقاطع على الاتحاد (IoU).

أجهزة الكشف المعتمدة على المرساة مقابل أجهزة الكشف الخالية من المرساة

في السنوات الأخيرة، ظهرت في السنوات الأخيرة أجهزة الكشف الخالية من المراسي كبديل شائع. على عكس النماذج القائمة على المرساة، تتنبأ النُهج الخالية من المرساة بمواقع الأجسام وأحجامها مباشرة، وغالبًا ما يتم ذلك عن طريق تحديد النقاط الرئيسية (مثل مراكز الأجسام أو زواياها) أو التنبؤ بالمسافات من نقطة إلى حدود الجسم، مما يلغي الحاجة إلى أشكال مرساة محددة مسبقًا.

تشمل الاختلافات الرئيسية ما يلي:

  • التعقيد: تتطلب النماذج القائمة على المرساة تصميمًا دقيقًا وضبطًا دقيقًا لمعلمات المرساة (الأحجام والنسب والمقاييس)، والتي يمكن أن تعتمد على مجموعة البيانات. تعمل النماذج الخالية من المرساة على تبسيط تصميم رأس الكشف.
  • المرونة: قد تتكيف الطرق الخالية من المرساة بشكل أفضل مع الأجسام ذات نسب أبعاد غير عادية أو أشكال غير ممثلة بشكل جيد من خلال مجموعة المرساة الثابتة.
  • الكفاءة: يمكن أن يؤدي التخلص من نقاط الارتكاز إلى تقليل عدد التنبؤات التي يحتاج النموذج إلى إجرائها، مما قد يؤدي إلى استنتاج أسرع ومعالجة لاحقة أبسط.

في حين أن أجهزة الكشف القائمة على الارتكاز مثل YOLOv4 كانت ناجحة للغاية، فقد اعتمدت العديد من البنى الحديثة، بما في ذلك Ultralytics YOLO11، تصميمات خالية من الارتكاز للاستفادة من مزاياها في البساطة والكفاءة. يمكنك استكشاف مزايا الكشف الخالي من المراسي في YOLO11 والاطلاع على المقارنات بين نماذج YOLO المختلفة.

التطبيقات الواقعية

تُستخدم أجهزة الكشف القائمة على المرساة على نطاق واسع في تطبيقات مختلفة حيث يكون للأجسام أشكال وأحجام قياسية نسبيًا.

  • القيادة الذاتية: في الحلول الخاصة بصناعة السيارات، تعتبر أجهزة الكشف هذه ممتازة في تحديد المركبات والمشاة وإشارات المرور. تتوافق الأشكال التي يمكن التنبؤ بها لهذه الأجسام بشكل جيد مع نقاط الارتكاز المحددة مسبقاً، مما يتيح الكشف الموثوق به لشركات مثل NVIDIA و Tesla.
  • تحليلات البيع بالتجزئة: بالنسبة لإدارة المخزون التي تعتمد على الذكاء الاصطناعي، يمكن للنماذج القائمة على المرساة مسح الرفوف بكفاءة لحساب المنتجات. إن الحجم والشكل الموحد للسلع المعبأة يجعلها مرشحة مثالية لهذا النهج، مما يساعد على أتمتة مراقبة المخزون.
  • الأمن والمراقبة: يُعد تحديد الأشخاص أو المركبات في لقطات كاميرات المراقبة الثابتة حالة استخدام قوية أخرى. وهذا أمر أساسي لتطبيقات مثل دليل نظام الإنذار الأمني Ultralytics.

الأدوات والتدريب

يتضمن تطوير نماذج اكتشاف الكائنات ونشرها، سواءً كانت قائمة على المرساة أو خالية من المرساة، استخدام أطر عمل مثل PyTorch أو TensorFlow ومكتبات مثل OpenCV. وتوفر منصات مثل Ultralytics HUB تدفقات عمل مبسطة لتدريب النماذج المخصصة وإدارة مجموعات البيانات ونشر الحلول، ودعم مختلف بنيات النماذج. ولمزيد من التعلّم، تسرد موارد مثل Papers With Code أحدث النماذج، وتغطي الدورات التدريبية من منصات مثل DeepLearning.AI المفاهيم الأساسية.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون ونمو مع المبتكرين العالميين

انضم الآن
تم نسخ الرابط إلى الحافظة