استعدوا لـ YOLO Vision 2025!
25 سبتمبر، 2025
10:00 — 18:00 بتوقيت بريطانيا الصيفي
حدث هجين
مؤتمر Yolo Vision 2024
مسرد المصطلحات

كاشفات الكائنات ثنائية المرحلة

اكتشف قوة أدوات الكشف عن الكائنات على مرحلتين — حلول تركز على الدقة للكشف الدقيق عن الكائنات في مهام رؤية الحاسوب المعقدة.

كاشفات الأجسام ثنائية المرحلة هي فئة من نماذج رؤية الكمبيوتر التي تحدد وتحدد مواقع الأجسام في صورة أو مقطع فيديو من خلال عملية تسلسلية من خطوتين. تُعرف هذه المنهجية بدقتها العالية، لا سيما في تحديد مواقع الأجسام بدقة، على الرغم من أنها غالبًا ما تأتي على حساب زمن الوصول للاستدلال الأعلى. الفكرة الأساسية هي تحديد المجالات المحتملة ذات الأهمية أولاً ثم إجراء تصنيف وتحديد موقع مفصلين فقط على تلك المناطق الواعدة.

عملية المرحلتين

تنقسم عملية الكشف على مرحلتين إلى مراحل متمايزة ومتسلسلة:

  1. توليد اقتراح المنطقة: في المرحلة الأولى، يقوم النموذج بمسح الصورة لإنشاء مجموعة من المناطق المرشحة، والمعروفة باسم "مناطق الاهتمام" (RoIs) أو المقترحات، والتي من المحتمل أن تحتوي على كائن. يتم تحقيق ذلك عادةً بواسطة وحدة فرعية تسمى شبكة اقتراح المنطقة (RPN)، كما تم تقديمها بشكل مشهور في بنية Faster R-CNN. الهدف من هذه المرحلة ليس تصنيف الكائنات ولكن ببساطة تقليل عدد المواقع التي تحتاج المرحلة الثانية إلى تحليلها.

  2. تصنيف الكائنات وتحسين المربع المحيط: في المرحلة الثانية، يتم تمرير كل منطقة مقترحة إلى رأس تصنيف ورأس انحدار. يحدد رأس التصنيف فئة الكائن داخل RoI (على سبيل المثال، "شخص"، "سيارة"، "كلب") أو يعينه كخلفية. في الوقت نفسه، يقوم رأس الانحدار بتحسين إحداثيات المربع المحيط ليناسب الكائن بدقة أكبر. يتيح هذا التحليل المركز للمناطق المحددة مسبقًا للنموذج تحقيق دقة تحديد موقع عالية.

الكاشفات ثنائية المرحلة مقابل الكاشفات أحادية المرحلة

يكمن التمييز الأساسي في خط أنابيب التشغيل الخاص بهم. تفصل أجهزة الكشف ذات المرحلتين مهام تحديد الموقع والتصنيف، بينما تقوم أجهزة الكشف عن الكائنات ذات المرحلة الواحدة بتنفيذ كلتا المهمتين في وقت واحد في تمريرة واحدة.

  • الكاشفات ذات المرحلتين (مثل عائلة R-CNN): تعطي الأولوية للدقة. تسمح العملية المكونة من خطوتين باستخراج الميزات وتحسينها بشكل أكثر تفصيلاً لكل كائن محتمل، مما يؤدي إلى أداء أفضل في المشاهد المعقدة التي تحتوي على العديد من الكائنات الصغيرة أو المتداخلة. ومع ذلك، فإن تعقيدها يجعلها مكلفة حسابيًا وأبطأ.
  • أجهزة الكشف أحادية المرحلة (مثل Ultralytics YOLO، SSD): تعطي الأولوية للسرعة والكفاءة. من خلال التعامل مع اكتشاف الأجسام كمشكلة انحدار واحدة، فإنها تحقق سرعات استدلال في الوقت الفعلي مناسبة للتطبيقات على أجهزة الذكاء الاصطناعي الطرفية. في حين أن النماذج الحديثة أحادية المرحلة مثل YOLO11 قد قللت بشكل كبير من فجوة الدقة، إلا أنه قد لا تزال يُفضل استخدام أجهزة الكشف ثنائية المرحلة للمهام التي تتطلب أعلى دقة ممكنة.

البنى البارزة

تميز تطور الكاشفات ثنائية المرحلة بالعديد من النماذج المؤثرة:

  • R-CNN (شبكة عصبية التفافية قائمة على المنطقة): النموذج الرائد الذي اقترح لأول مرة استخدام مقترحات المنطقة مع شبكة عصبية التفافية (CNN). استخدمت خوارزمية خارجية تسمى البحث الانتقائي لإنشاء مقترحات.
  • Fast R-CNN: تحسين قام بمعالجة الصورة بأكملها من خلال CNN مرة واحدة، وتقاسم الحساب وتسريع العملية بشكل كبير.
  • Faster R-CNN: قدمت شبكة اقتراح المنطقة (RPN)، ودمجت آلية اقتراح المنطقة في الشبكة العصبية نفسها للحصول على حل تعلم عميق شامل.
  • Mask R-CNN: يوسع Faster R-CNN بإضافة فرع ثالث يخرج قناعًا على مستوى البكسل لكل كائن، مما يتيح تقسيم المثيلات.

تطبيقات واقعية

إن الدقة العالية لكاشفات المرحلتين تجعلها ذات قيمة في السيناريوهات التي تكون فيها الدقة ذات أهمية قصوى:

  • تحليل الصور الطبية: يتطلب الكشف عن الحالات الشاذة الطفيفة مثل الأورام الصغيرة أو الآفات أو السلائل في الفحوصات الطبية (التصوير المقطعي المحوسب، التصوير بالرنين المغناطيسي) دقة عالية للمساعدة في التشخيص. التحديد الدقيق للموقع أمر بالغ الأهمية للتخطيط للعلاج. شاهد المزيد حول الذكاء الاصطناعي في الرعاية الصحية والأبحاث في مجلات مثل Radiology: Artificial Intelligence. يمكنك استكشاف مجموعات بيانات مثل مجموعة بيانات أورام الدماغ للمهام ذات الصلة.
  • القيادة الذاتية: يعد الاكتشاف الدقيق وتحديد موقع المشاة وراكبي الدراجات والمركبات الأخرى وإشارات المرور، وخاصة الصغيرة أو المحجوبة جزئيًا، أمرًا بالغ الأهمية لأنظمة السلامة في السيارات ذاتية القيادة. تعتمد شركات مثل Waymo بشكل كبير على أنظمة إدراك قوية.
  • فهم مفصل للمشهد: تستفيد التطبيقات التي تتطلب فهمًا دقيقًا لتفاعلات الكائنات أو العد الدقيق من دقة أعلى.
  • مراقبة الجودة في التصنيع: غالبًا ما يتطلب تحديد العيوب الصغيرة أو التحقق من موضع المكونات في التجميعات المعقدة دقة عالية. تعرف على المزيد حول الذكاء الاصطناعي في التصنيع.

يتضمن تدريب هذه النماذج عادةً مجموعات بيانات كبيرة مسماة، مثل مجموعة بيانات COCO، والضبط الدقيق. توفر Ultralytics موارد لـ تدريب النموذج وفهم مقاييس الأداء. بينما تركز Ultralytics على النماذج الفعالة ذات المرحلة الواحدة مثل Ultralytics YOLO، فإن فهم الكاشفات ذات المرحلتين يوفر سياقًا قيمًا في مجال الكشف عن الكائنات الأوسع.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن
تم نسخ الرابط إلى الحافظة