استعدوا لـ YOLO Vision 2025!
25 سبتمبر، 2025
10:00 — 18:00 بتوقيت بريطانيا الصيفي
حدث هجين
مؤتمر Yolo Vision 2024
مسرد المصطلحات

كاشفات الأجسام ذات المرحلة الواحدة (One-Stage Object Detectors)

اكتشف سرعة وكفاءة كاشفات الكائنات ذات المرحلة الواحدة مثل YOLO، المثالية للتطبيقات في الوقت الفعلي مثل الروبوتات والمراقبة.

أجهزة الكشف عن الكائنات ذات المرحلة الواحدة هي فئة من نماذج التعلم العميق المصممة للسرعة والكفاءة في رؤية الكمبيوتر. إنها تقوم بتحديد موقع الكائن وتصنيفه في تمريرة موحدة واحدة للشبكة العصبية. يتناقض هذا مع نظيراتها الأكثر تعقيدًا، أجهزة الكشف عن الكائنات ذات المرحلتين، والتي تقسم المهمة إلى خطوتين متميزتين. من خلال معالجة اكتشاف الكائنات كمشكلة انحدار مباشرة، تتوقع النماذج ذات المرحلة الواحدة مربعات إحاطة واحتمالات الفئة مباشرة من ميزات الصورة، مما يجعلها سريعة بشكل استثنائي ومناسبة للتطبيقات التي تتطلب الاستدلال في الوقت الفعلي.

كيف تعمل الكاشفات أحادية المرحلة؟

يقوم الكاشف أحادي المرحلة بمعالجة صورة كاملة مرة واحدة من خلال شبكة عصبونية التفافية (CNN) واحدة. تم تصميم بنية الشبكة لتنفيذ عدة مهام في وقت واحد. أولاً، يقوم العمود الفقري للشبكة بتنفيذ استخراج الميزات، وإنشاء تمثيلات غنية للصورة المدخلة بمقاييس مختلفة. ثم يتم تغذية هذه الميزات في رأس كشف متخصص.

هذا الجزء مسؤول عن توقع مجموعة من المربعات المحيطة (bounding boxes)، ودرجة ثقة (confidence) لكل مربع تشير إلى وجود كائن، واحتمالية انتماء كل كائن إلى فئة معينة. تحدث هذه العملية بأكملها في تمريرة أمامية واحدة، وهو المفتاح لسرعتها العالية. تُستخدم تقنيات مثل تثبيط الحد الأقصى غير (non-maximum suppression (NMS) بعد ذلك لتصفية الاكتشافات الزائدة والمتداخلة لإنتاج الإخراج النهائي. يتم تدريب النماذج باستخدام دالة خسارة (loss function) متخصصة تجمع بين خسارة التوطين (مدى دقة المربع المحيط) وخسارة التصنيف (مدى دقة توقع الفئة).

مقارنة مع كاشفات الأجسام ذات المرحلتين

يكمن التمييز الأساسي في المنهجية. تم تصميم أجهزة الكشف ذات المرحلة الواحدة للسرعة والبساطة، بينما تعطي أجهزة الكشف ذات المرحلتين الأولوية للدقة، على الرغم من أن هذا التمييز أصبح أقل وضوحًا مع النماذج الأحدث.

  • أجهزة الكشف أحادية المرحلة: تقوم هذه النماذج، مثل عائلة YOLO (أنت تنظر مرة واحدة فقط)، بإجراء الكشف في خطوة واحدة. وهي بشكل عام أسرع ولها بنية أبسط، مما يجعلها مثالية للأجهزة الطرفية والتطبيقات في الوقت الفعلي. وقد أدى تطوير أجهزة الكشف الخالية من المرساة إلى تحسين أدائها وبساطتها.
  • كاشفات الكائنات ذات المرحلتين (Two-Stage Object Detectors): تقوم نماذج مثل سلسلة R-CNN ومتغيراتها الأسرع أولاً بإنشاء مجموعة متفرقة من مقترحات المناطق حيث قد توجد الكائنات. في المرحلة الثانية، تقوم شبكة منفصلة بتصنيف هذه المقترحات وتحسين إحداثيات المربع المحيط. تؤدي هذه العملية المكونة من خطوتين عادةً إلى دقة أعلى، خاصةً بالنسبة للكائنات الصغيرة، ولكن على حساب سرعة الاستدلال الأبطأ بشكل ملحوظ. Mask R-CNN هو مثال معروف يوسع هذا النهج ليشمل تقسيم المثيلات (instance segmentation).

الهياكل والنماذج الرئيسية

تم تطوير العديد من البنى المؤثرة ذات المرحلة الواحدة، ولكل منها مساهمات فريدة:

  • YOLO (أنت تنظر مرة واحدة فقط): قدمت YOLO في ورقة بحثية رائدة عام 2015، اكتشاف الكائنات كمشكلة انحدار واحدة. وقد حسنت الإصدارات اللاحقة، بما في ذلك YOLOv8 و Ultralytics YOLO11 الحديثة، باستمرار التوازن بين السرعة والدقة.
  • كاشف الصندوق المتعدد بلقطة واحدة (SSD): كان هيكل SSD نموذجًا رائدًا آخر من مرحلة واحدة يستخدم خرائط الميزات متعددة المقاييس لاكتشاف الكائنات ذات الأحجام المختلفة، مما يحسن الدقة مقارنة بـ YOLO الأصلي.
  • RetinaNet: قدم هذا النموذج Focal Loss، وهي دالة خسارة جديدة مصممة لمعالجة عدم توازن الفئات الشديد الذي تمت مواجهته أثناء تدريب الكاشفات الكثيفة، مما يسمح لها بتجاوز دقة العديد من الكاشفات ذات المرحلتين في ذلك الوقت.
  • EfficientDet: عائلة من النماذج التي طورتها Google Research والتي تركز على قابلية التوسع والكفاءة باستخدام طريقة توسيع مركبة وشبكة ميزات BiFPN جديدة. يمكنك معرفة كيف تقارن بالنماذج الأخرى مثل YOLOv8 مقابل EfficientDet.

تطبيقات واقعية

لقد جعلت سرعة وكفاءة أجهزة الكشف ذات المرحلة الواحدة لا غنى عنها في العديد من التطبيقات المدفوعة بالذكاء الاصطناعي:

  1. المركبات ذاتية القيادة: في الذكاء الاصطناعي للسيارات ذاتية القيادة، تُعد الكاشفات ذات المرحلة الواحدة ضرورية لإدراك البيئة في الوقت الفعلي. يمكنهم على الفور تحديد وتتبع المشاة وراكبي الدراجات والمركبات الأخرى وإشارات المرور، مما يمكّن نظام الملاحة في السيارة من اتخاذ قرارات مهمة في أجزاء من الثانية. تستخدم شركات مثل Tesla مبادئ مماثلة لأنظمة الطيار الآلي الخاصة بها.
  2. الأمن والمراقبة الذكية: تعمل النماذج أحادية المرحلة على تشغيل أنظمة الأمان الحديثة من خلال تحليل مقاطع الفيديو للكشف عن التهديدات مثل الدخول غير المصرح به أو النشاط المشبوه. على سبيل المثال، يمكن تدريب النظام على عد الأشخاص في طابور لإدارة الطابور أو تحديد الأمتعة المهجورة في المطار، وكل ذلك في الوقت الفعلي.

المزايا والقيود

الميزة الأساسية لأجهزة الكشف ذات المرحلة الواحدة هي سرعتها المذهلة، والتي تتيح اكتشاف الكائنات في الوقت الفعلي على مجموعة متنوعة من الأجهزة، بما في ذلك أجهزة الذكاء الاصطناعي الطرفية منخفضة الطاقة مثل NVIDIA Jetson أو Raspberry Pi. كما أن بنيتها الأبسط والشاملة تجعلها أسهل في التدريب والنشر باستخدام أطر عمل مثل PyTorch أو TensorFlow.

تاريخيًا، كان القيد الرئيسي هو انخفاض الدقة مقارنةً بأجهزة الكشف على مرحلتين، خاصةً عند التعامل مع الكائنات الصغيرة جدًا أو المسدودة بشدة. ومع ذلك، فإن التطورات الأخيرة في بنية النموذج وتقنيات التدريب، كما هو موضح في نماذج مثل YOLO11، قد قللت بشكل كبير من فجوة الأداء هذه، مما يوفر مزيجًا قويًا من السرعة والدقة العالية لمجموعة واسعة من مهام رؤية الكمبيوتر. تعمل منصات مثل Ultralytics HUB على تبسيط عملية تدريب النماذج المخصصة لتلبية احتياجات محددة.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن
تم نسخ الرابط إلى الحافظة