Yolo فيجن شنتشن
شنتشن
انضم الآن
مسرد المصطلحات

كاشفات الكائنات ثنائية المرحلة

اكتشف قوة أدوات الكشف عن الكائنات على مرحلتين — حلول تركز على الدقة للكشف الدقيق عن الكائنات في مهام رؤية الحاسوب المعقدة.

كاشفات الأجسام ذات المرحلتين هي فئة من نماذج التعلم العميق المتطورة نماذج التعلم العميق المتطورة المصممة لتحديد وتحديد موقع الأجسام داخل الصور بدقة عالية. وخلافاً لنظيراتها الأسرع، تقسم هذه البنى مهمة الكشف عن الأجسام إلى مرحلتين مختلفتين مهمة الكشف عن الأجسام إلى مرحلتين مختلفتين: تحديد المناطق المحتملة التي قد تتواجد فيها الأجسام، ثم تصنيف تلك المناطق أثناء تنقيح إحداثياتها. لقد جعل هذا النهج القائم على تقسيم العملية تاريخيًا أجهزة الكشف على مرحلتين المعيار الذهبي للمهام التي تكون فيها تكون فيها الدقة أمرًا بالغ الأهمية، وغالبًا ما يكون ذلك على حساب السرعة و والموارد الحاسوبية.

سير العمل على مرحلتين

تعمل بنية الكاشف ثنائي المراحل مثل القمع، حيث تعمل على تضييق نطاق البيانات من صورة واسعة إلى صورة محددة, محددة ومصنفة. تتضمّن هذه العملية عادةً شبكة أساسية، مثل ResNet، لاستخراج الميزات, تليها مرحلتان حاسمتان:

  1. اقتراح المنطقة: تستخدم المرحلة الأولى مكونًا يُطلق عليه غالبًا شبكة اقتراح المنطقة (RPN). تقوم هذه الشبكة بمسح خرائط الميزات التي تم إنشاؤها بواسطة العمود الفقري لتحديد "المناطق ذات الأهمية" (RoIs). في هذه المرحلة، لا يقوم النموذج بتصنيف الكائن؛ بل يعمل بشكل أساسي كمرشح للخلفية، حيث يقوم بوضع علامة على المناطق التي من المحتمل أن تحتوي على شيء ما مقابل المناطق الفارغة. تم ترسيخ هذا المفهوم في ورقة بحثية أسرع لشبكة R-CNN.
  2. التصنيف والتنقيح: في المرحلة الثانية، يتم تجميع المناطق المقترحة في حجمًا ثابتًا ويتم إدخالها في رأس كشف محدد. يقوم هذا هذا الرأس مهمتين متزامنتين: يقوم بتعيين تسمية فئة محددة (على سبيل المثال، "شخص" و "مركبة") للجسم ويستخدم انحدار الصندوق المحدود لضبط الإحداثيات, لضمان مطابقة الصندوق للجسم بإحكام.

الكاشفات ثنائية المرحلة مقابل الكاشفات أحادية المرحلة

إن فهم الفرق بين كاشفات الأجسام ذات المرحلتين و كاشفات الأجسام ذات المرحلة الواحدة أساسي لاختيار النموذج المناسب للتطبيق.

  • أجهزة الكشف ذات المرحلتين (على سبيل المثال، شبكة R-CNN الأسرع، شبكة R-CNN القناع): تعطي هذه النماذج الأولوية للدقة. من خلال الفصل بين الاقتراح والتصنيف، فإنها تتعامل مع المشاهد المعقدة ذات الأجسام المتداخلة أو التفاصيل الصغيرة بشكل بشكل جيد. ومع ذلك، فإن آلية التدقيق المزدوج هذه تُدخل زمنًا أعلى زمن استنتاج أعلى، مما يجعل من الصعب نشرها في البيئات التي تتطلب استجابات فورية.
  • أجهزة الكشف ذات المرحلة الواحدة (على سبيل المثال، YOLO SSD): البنى مثل Ultralytics YOLO تتعامل مع الكشف على أنه مشكلة انحدار واحدة واحدة. فهي تقوم بتعيين وحدات بكسل الصورة مباشرةً إلى إحداثيات المربع المحدد واحتمالات الفئة في مسار واحد. في حين أن تاريخيًا أقل دقة من النماذج ذات المرحلتين، فإن التكرارات الحديثة مثل YOLO11 قد سدت فجوة الدقة بشكل فعال مع الحفاظ على سرعات الاستدلال في الوقت الحقيقي.

المعماريات الرئيسية في التاريخ

حددت العديد من البنى تطور الكشف على مرحلتين:

تطبيقات واقعية

نظرًا لأن أجهزة الكشف ثنائية المراحل تتفوق في تحديد مواقع الأجسام الصغيرة وتقليل الإيجابيات الخاطئة، فإنها تظل حيوية في صناعات محددة.

  • تحليل الصور الطبية: في الأشعة، يتطلب تحديد العقيدات أو الأورام الصغيرة في الأشعة المقطعية أعلى حساسية ممكنة. غالبًا ما تُستخدم نماذج غالبًا ما تُستخدم النماذج هنا لتقليل مخاطر فقدان التشخيص الحرج، كما هو مفصّل في العديد من الذكاء الاصطناعي في دراسات الرعاية الصحية.
  • فحص الجودة الآلي: في مجال التصنيع، يتطلب تحديد العيوب المجهرية على لوحات الدارات الكهربائية أو الأجزاء المشكّلة آليًا تحليلًا عالي الدقة عالية الدقة. تساعد إمكانيات التوطين الدقيقة لأجهزة الكشف على مرحلتين في اكتشاف العيوب التي قد تفوتك بنماذج أسرع وأقل دقة.

تنفيذ الكشف عالي الدقة

في حين أن Ultralytics متخصصة في النماذج المتطورة ذات المرحلة الواحدة، فإن الإصدارات الحديثة مثل YOLO11 توفر الدقة العالية المرتبطة عادةً بأجهزة الكشف ذات المرحلتين ولكن مع سرعة كبيرة في أسرع بكثير في التدريب والاستدلال.

فيما يلي كيفية تنفيذ نموذج YOLO11 المدرَّب مسبقًا باستخدام ultralytics حزمة لتحقيق نتائج كشف عالية الدقة:

from ultralytics import YOLO

# Load a high-accuracy pre-trained YOLO11 model (Large variant)
# 'yolo11l.pt' offers a balance of high accuracy comparable to older two-stage models
model = YOLO("yolo11l.pt")

# Run inference on a local image
results = model("path/to/image.jpg")

# Display the results with bounding boxes
results[0].show()

المفاهيم ذات الصلة

  • مربعات التثبيت: أشكال مربعات محددة مسبقًا التي تستخدمها العديد من أجهزة الكشف ذات المرحلتين لتقدير حجم الجسم ونسبة العرض إلى الارتفاع أثناء مرحلة الاقتراح.
  • الكبت غير الأقصى (NMS): تقنية ما بعد المعالجة تُستخدم في كل من أجهزة الكشف ذات المرحلة الواحدة والمرحلتين لإزالة المربعات المتداخلة الزائدة عن الحاجة, لضمان بقاء الاكتشاف الأكثر ثقة فقط.
  • التقاطع على الاتحاد (IoU): مقياس يُستخدم لقياس التداخل بين المربع المتوقع والحقيقة الأرضية، وهو ضروري لتدريب شبكة RPN ورؤوس التنقيح.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن